先日から試してるWEBKEEPERSのバリュープランが大変速いので、1年契約に昇進。さらば1stレンタルサーバ
私はアフィサイトの自動更新をこのWindows VPSで行っている。

処理は大きく4群に分かれる。
1.あちこちクロールしてデータを内部フォーマットに揃えて溜め込むPython
2.その内部フォーマットデータを分析して各ジャンルデータを更新、Webサーバにアップロード等々その他ほぼ全てを行うJavaAP
3.Tweetしたい文面をJMSで受け、適当な間隔を置いてTweetする常駐Java AP
4.更新とは関係ないが、放映中のTV番組にあわせて適当に関連同人誌を宣伝するTV自動実況Java AP*1
ちなみに自動更新だけだと撃ち漏らすので帰り道に駅とかから携帯で指示を出す。
クローラだけPythonなのは、クロール先もこの先いずれはHTML形式が変わるだろうし、とするとスクリプト言語の方が何時でも何処でもその場でちょこちょこ直せてよかろうと思った故。でも実はhtmlcleanerかましてXMLにしてしまえばJDom使えて楽さは余り変わらない罠。あと可変パラメータがね、Javaだとアーギュメント処理とかプロパティファイル処理とか面倒だけどPythonは.pyそれ自体設定ファイルだから上の方にちょこちょこ書けば済むという…。いやそれが良いのかどうかという話はあるが。
HTTP通信で時間取るし、個別の文字列処理はきっとC言語で記述されてるだろうからJavaにそう引けは取らないだろう、と思ってた…。手元のPCでもまぁ余裕で許容範囲だった…
…んだけど、1stレンタルサーバの一番安いプランの超遅いVPSで動かしたところこれが大間違い。Python遅ぇえええええええええええ。こりゃいずれJavaで書き直さねば…。
だがそれもWEBKEEPERSの一番安いプランに乗り換えた所ズバット解決。むしろ16コアが余る位だ。

*1:ちなみに既にSPAM BOTと思われてて検索結果には一切出ない… https://twitter.com/nekora2199/