2022年01月

ブラウザの最新版に追随しているのはChromeのドライバのみ。PhantomJSに至っては消えている。Firefoxは古いバージョンのサポートを続けているのだそうな。
FKU_Gw5UYAMf-pM

とりあえずTwitterにアクセスまではできたが、TwitterのページはJavaScriptでしかもタグが入り組んでいて分析が中々難しい…。表示中のページをセーブすると新たにダウンロードするようでTwitterに弾かれるし。タグとか完全に無視して「〇〇という文字列を含んでいるか?」のチェックが出来ると良いのだけれど。

メモ。以下のclassが、サーチバンされている時にのみ登場するが、間に挟まる謎めいた文字列はアクセスの度に変わる…何なんだ。r-fdjqy7で特定可能?かも?
---
<div dir="auto" class="css-901oao r-14j79pv r-1tl8opc r-a023e6 r-16dba41 r-rjixqe r-1nxhmzv r-bcqeeo r-fdjqy7 r-qvutc0" data-testid="empty_state_body_text">入力した単語の検索結果はありません。単語の入力を間違えたか、センシティブと思われる内容が表示されない
---





このエントリーをはてなブックマークに追加 mixiチェック

紙の中古なら1円だというのに、Kindle版が出てたのでつい買ってしまった…。大昔2巻まで読んだ気がする。絵柄が凄くジョジョだ…ゴゴゴゴゴ…。
アニメ版とは登場人物とあとは主人公カズマが色々な敵と喧嘩をするのが同じ位で、内容は全然違うのね。まぁ一番の違いと言えば、やはりアニメ版のシェリスはミニスカの下に短パンを穿いているがこの漫画版の方はパンツという点かな。







このエントリーをはてなブックマークに追加 mixiチェック

よく考えたらこれ、というかヒーロークロスラインって殆ど漫画図書館で無料で読めるやんけ。ぐぬぬ…。


このエントリーをはてなブックマークに追加 mixiチェック

前回までのあらすじ。
シャドウバン(サーチバン)を喰らうと、ブラウザからはfrom:IDで検索しても表示されなくなるが、APIでは普通に取得できるし投稿も成功するので機械的に見分けるのは困難
このためブラウザでIDサーチURL(https://twitter.com/search?q=from%3A%40nekora2520&src=recent_search_click)へのアクセスを自動化するのが良さげ。ちなみにcurlではJavaScriptに対応していないと言われて弾かれる。-A で偽装したとしても実際、Twitterのデータ部はHTMLの後にJavaScriptで取得するので無理だろう。
なのでSeleniumが妥当か。ただし以前Seleniumを使った時はドライバが非互換等々で結構厳しかった。また果たしてJavaScriptの部分を上手く取れるか…。
https://kemkemblog.com/about-shadowban-and-detection-tool で紹介されているアクセス先は古いが、JavaScriptをキャッシュするWEBサービス https://phantomjscloud.com/ を使ったやり方が記載されていて参考になるかもしれない。




このエントリーをはてなブックマークに追加 mixiチェック

侵略大帝様が主人公なのが結構含まれる短編集。
ヒーロークロスライン、あったなぁ…シェアワールド企画もの。今となっては朧気にしか思い出せぬがどれも結構面白かったよな。一回、みなとみらい駅横の広場で着ぐるみショーをやってるのに出くわした事がある。
作画が長谷川裕一でないのも2本入ってるけど、別の人の絵を通すと長谷川裕一短編作品の語り口が寧ろはっきり判って興味深いな。最初の一コマ目で異様な主人公が登場、語り手も「そいつは突然やってきた!」のようなリアクションを取り、続いて登場する悪者とひと悶着、追い払った後に一服して周囲と和み、再登場した強敵と対峙しピンチに陥った所で何かカッコいい事をする。うむ、カッコいい。


このエントリーをはてなブックマークに追加 mixiチェック

これもちょっと前のKindle長谷川裕一各作品第一巻だけ半額セールで1巻だけ。
クロノアイズの続編で、タイキ君が成人済。
今度のは「既に歴史が変更済みの色々な世界へ行って未来からの犯罪者と戦う」という話。
歴史改変の度に世界が分岐するならそこまで気合入れて対応しなくても良いような気がせんでもないが、「未来からの干渉を排する」という筋は通ってるのでまぁいいか。
結構エピソードの省略が大胆で面白い所だけ抽出して描いてて凄いよね。クジラ回とか。
あと侵略大帝様の素顔って美形だったのね…。

クロノアイズ グランサー 1巻
長谷川裕一
Benjanet
2014-07-08

このエントリーをはてなブックマークに追加 mixiチェック

Twitter社は「シャドウバンなんてありません」と堂々と言っているが、その意味は単に「その事象をTwitter社員はシャドウバンと呼ばない」というだけで「あるアカウントからの投稿をあらゆる検索結果から除外する」仕組みは実在する。
んで、シャドウバンの解除にはしばらく邪悪な投稿をしなければ良いと言う事が経験則として分かっている。
最近作った悪のボットはシャドウバンクラッシュを喰らいがちなので自動的にシャドウバン状態を検知し喪が明けるまで投稿を自粛、あるいは良い子な投稿のみ行う動作にしたい。
BANと違って投稿自体には成功するので見分けるには一工夫が要るようだ。
ブラウザから検索で「@from:TwitterのID」を行うと、通常のIDとシャドウバン喰らってる最中のIDで挙動が異なるとのこと

■品行方正な模範的市民のIDを使った検索例。プロフィールを先頭に過去の投稿が出る。
0119

■悪行三昧のスパマーBotのIDを使った検索例。彼奴については検索結果が無い事にされる。
0119b

なるほど。
恐らくTwitter APIで検索しても同じ結果が返ってくるのではなかろうか。
自動自粛機能実装はここに鍵があると思われる。


やってみた。
API経由で邪悪なIDからの投稿をサーチしてみたら普通に取得できてしまう…ぐぬぬ。となると例のチェックページをブラウザを自動操作して使うしか…。
$ python3 id_search.py
200
{
    "data": [
        {
            "id": "1483821836626722817",
            "text": "\u662d\u548c\u7279\u64ae\u306b\u3066\u5192\u982d\u306e\u30cf\u30a4\u30ab\u30fc\u306f\u8b66\u5099\u54e1\u3068\u4e26\u3073\u6b7b\u4ea1\u7387\u304c\u9ad8\u3044\u3002\n#\u30b8\u30e3\u30c3\u30ab\u30fc\u96fb\u6483\u968a"
        },
(略)
ちなみに凍結されたIDの投稿は流石に見えない模様
$ python3 id_search.py
200
{
    "meta": {
        "result_count": 0
    }
}



このエントリーをはてなブックマークに追加 mixiチェック

なんかちょっと前に長谷川裕一作品の1巻だけ安売りセールやってたので。
うーむ、これは何か以前にもこの第1巻だけ読んだな…。
長谷川裕一作品に外れは無いので、多分2巻以降も面白いに違いない、違いないのだが…。

クロノアイズ 1巻
長谷川裕一
Benjanet
2014-07-08

このエントリーをはてなブックマークに追加 mixiチェック

んだぁこりゃ~。「時間封鎖」は結構面白そうだったのにガッカリですよ(無限記憶はスキップ)。
いや「何か輪が閉じた感」を出したい感じは分かるんだけど、現代(?)編は丸ごと不要級につまんねーし、1万年後編も微妙だし、実際、内容は445ページ以降の駆け足独白が全てなのだけれどその445ページ以降も割とがっかりだし。
三部作の最後でがっかりと言えばタイタス・アローンだがこれも中々のガッカリよ。
…って今知ったがゴーメンガーストに「4」があったとな。読みたいような3の続きなら要らんような…。

連環宇宙 (創元SF文庫) (創元SF文庫)
ロバート・チャールズ・ウィルスン
東京創元社
2012-05-12






このエントリーをはてなブックマークに追加 mixiチェック

Twitter API v2対応のボット完成。
V2 APIは申請と審査無しで利用できるので悪のボットを山ほど作れるという訳だ。
例えば2つアカウントを用意して片方が影道BANを食らったらその期間中はもう一つにフェイルオーバーするなどの運用も考えられる。まぁ影道BANをAPIから検出する技術が無いので考えるだけだけど。


このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ