Pythonでスクレイピングするための環境構築(VSCode + Selenium + Python)
自分メモ用に投稿します。
VSCodeでPythonとSeleniumが動く環境を構築する
はじめに
タイトルにスクレイピングとありますが、せっかくなのでSeleniumも入れて普段の学習にも使えるように環境構築をしようと思います。
*自分用のメモなので、拙い部分についてはご了承願います。
注意事項
スクレイピング*1をする場合、サーバー側に負荷をかける行為です。
またスクレイピングをするデータには著作権など権利問題が絡むことがあります。
過去には訴訟にも至ったこともありますので、法律や利用規約、マナーを守って行いましょう。
下記の記事内に注意事項が記載されていますので、読んでみましょうー
環境
今回環境構築に使う環境やツールは以下の4つを使います。
それぞれDL用サイトのリンクを貼り付けていますので、DLをしてください。
なお、ここでは詳しいインストール方法については記述しません。
ぜひググって調べてみてください。
私が書くよりも何倍も分かりやすいページがあるはずです。
Visual Studio Code
Visual Studio Code(以降「VSCode」と呼びます)
基本的に最新版を取得すれば大丈夫
Python
最新版を取得すれば大丈夫。
ただし、PythonにはVer.2.X系とVer.3.X系があるので、Ver.3.X版を入れてください。
Selenium
Seleniumは何かexeとかをDLするのではなく、Pythonのパッケージ管理システム(pip)を利用して取得します。
このpipはPythonをインストールすることで自動的に取得出来るので、特別何かをする必要はありません。
Selenium WebDriver
Seleniumを使う場合、各ブラウザごとにドライバーを用意する必要があります。
ChromeならChrome用、Firefoxならfirefox用など。*2
インストールした後の設定
1. VScodeを日本語化にする*3
- 起動直後、左側に見える四角いアイコンをクリックする。■←こんな感じの
- MARKETPLACEが表示されるので「Japanese Language Pack」を検索。
- 「install」(緑色の小さいやつ)をクリックする。
これで再起動すると日本語になっているはずです。
2. VScodeの【 拡張設定 】にPythonを追加する
- 起動直後に、左側に見える四角いアイコンをクリックする。■←こんな感じの
- MARKETPLACEが表示されるので「Python」を検索。
- 「install」(緑色の小さいやつ)をクリックする。
3. コードを書いてスクレイピングしてみる。
スクレイピングするサイトは以下の場所を拝借。
なおくれぐれもスクレイピング には、冒頭でも書いたよう注意事項を理解してから行ってください。
scraping-for-beginner.herokuapp.com
ブラウザを起動する→上のリンクのサイトにアクセスする→表示されている値を取得する。
そのほかの操作については、以下の記事を参考にすると分かりやすいです。
以上