アメグラ2号のブログ

1980年代後半の古き良きビデオゲームのほか、オッサンの個人的備忘録

python(requests, bs4) WEBスクレイピング 

f:id:game-allergy:20210331143049p:plain


 

WEBスクレイピング

今回はpythonのライブラリ(requests, bs4)だけで実行する。

 

 

◆天気予報情報をスクレイピング

スクレイピングの対象は定番の天気予報。

f:id:game-allergy:20210411213745j:plain

 

◆tenki.jp内の横浜市の天気予報

ここの情報を取得してみる。

情報は当日含めた3日分(72時間分)掲載されているので、その分が取得数となる。

気温、風向き、時間など、各72個要素がある。

f:id:game-allergy:20210411213810j:plain

 

f:id:game-allergy:20210411213840j:plain

 

 

◆HTML要素の確認

f:id:game-allergy:20210411220003p:plain

とりえず気温データを取得してみる。

HTMLを見ると、tr class ="temperature"の中の、<span>ここ!</span>。

 

スクリプト

スクリプトはこちらに。

 

game-allergy.hatenablog.com

 

◆実行結果

f:id:game-allergy:20210411215626j:plain

 

◆こりゃ楽だ。

この前はchromedriver.exeをわざわざ使ってのスクレイピング・・・今回はpython内のライブラリだけで完結するのでチョーラクチン。

スクリプトもすっきりで分かりやすい。

単純なスクレイピングならこっちのほうがいいなぁ。

 

◆欲張ってほかの情報も・・・

f:id:game-allergy:20210411214326j:plain

気温以外の情報も見たくなる。

なるほど~、簡単に情報引っ張れるのね。