IT・インターネット・ゲーム業界の求人・転職サイトは「IT転職ナビ」

IT用語集

IT・インターネット・ゲーム業界に関する用語をわかりやすく解説しています。

  • twitter

Webスクレイピング

Webスクレイピングとは、インターネット上にあるWebページから必要な情報を抜き出し、エクセルやcsvなどのデータとして取得することです。
最近ではWebスクレイピングをするためのツールやプラットフォームサービスが続々とローンチされており、学習環境が限られていたり時間がないがWebスクレイピングを必要とする人も、以前と比べて比較的Webスクレイピングを行いやすくなっています。
Python(データの取扱いが得意なプログラミング言語)などを使ってWebスクレイピングをすると、前述のようなプラットフォームを使うよりも自由度が高く情報を取得できる場合もあります。

Webスクレイピングをすると自動で欲しい情報が欲しいだけ取得でき、希望するデータ形式や入力方式で出力されるようにすることもできます。
Webサービス同士で連携するときに使われるAPIは一見Webスクレイピングの機能と被るように見えます。
しかしWebスクレイピングを使うと、APIが提供されていない場合や、APIでは取得できないよう設定されている情報も取得することができるという点でメリットがあります。

Webスクレイピングは株価や物価などのマーケット情報の取得、WebページのSEO対策、各種データの解析に役立てられています。
Webスクレイピングを行う上での注意点は、情報を取得する相手側のサーバに負荷をかけすぎないこと(1~3秒間に1ページのクロールに留めるなど。)配慮する必要があることです。
また、著作権の侵害など法的な面でも十分に注意する必要があります。