WEBスクレイピング。
今回はpythonのライブラリ(requests, bs4)だけで実行する。
◆天気予報情報をスクレイピング
スクレイピングの対象は定番の天気予報。
◆tenki.jp内の横浜市の天気予報
ここの情報を取得してみる。
情報は当日含めた3日分(72時間分)掲載されているので、その分が取得数となる。
気温、風向き、時間など、各72個要素がある。
◆HTML要素の確認
とりえず気温データを取得してみる。
HTMLを見ると、tr class ="temperature"の中の、<span>ここ!</span>。
スクリプトはこちらに。
◆実行結果
◆こりゃ楽だ。
この前はchromedriver.exeをわざわざ使ってのスクレイピング・・・今回はpython内のライブラリだけで完結するのでチョーラクチン。
スクリプトもすっきりで分かりやすい。
単純なスクレイピングならこっちのほうがいいなぁ。
◆欲張ってほかの情報も・・・
気温以外の情報も見たくなる。
なるほど~、簡単に情報引っ張れるのね。