PhantomJSがseleniumから消えていたので仕方なくChromeドライバで実装。Chromeは勝手にアップデートするから嫌なんだが致し方ない。
Twitterにログインせず from:@ボットのID で検索して何も引っかからなかったらサーチBANされているので、ファイルにフラグを書き込み、別プロセスはそのファイルを見てサーチBAN中は呟きを自粛、という単純なもの。
TwitterはJavaScriptを駆使していてcurlなどではアクセスできないが、seleniumをPythonから使うと
pagestr=driver.page_source
でブラウザに表示中の文字列は取得できた。
ちなみにタグはclassに意味不明のランダムなものがしばしば入るのであてにならない。

実践 Selenium WebDriver
Satya Avasarala
オライリージャパン
2014-09-18