原因はクロール先のHTMLの形が変わったのだろう。→やっぱそうだった。
HTML解析処理は作るのが面倒だが、HTMLCleanerという素晴らしいライブラリがある。HTMLをXMLに変えてくれるのだ。
んでロボの造りとしては必要な情報はXPathで取得するのでこれを変えれば万事解決なのだ。
とは言えやっぱXPathは面倒臭い…。
http://aoproj.web.fc2.com/xpath/XPath_cheatsheets_v2.pdf
とりあえずFirefox に https://addons.mozilla.org/ja/firefox/addon/xpath-checker/ を入れた。Firefoxに目的のXMLを表示させた状態で右クリックするとXPathダイアログが立ち上がる。
→うむ、直った。これも日頃の行いというか、変わりそうな所を切り出した造りのお蔭だ。
コメント