KH Coderという、茶筌とRのGUIフロントエンドAPの、作者自らによる使い方本。表示されたデータの解釈の例などもあり。
必要とする人が自分で使うために作り、我ながら便利だからと業界発展のために無料で広める、フリーソフトの鑑である。就職活動のプロフィール飾るためにGitHubで外国産の汎用ソフトにいっちょかみしたがるWeb系とは志が違う。
やってることは要は茶筌で文章を単語に分解してRで分析させるらしい。英語だとスペースで区切られてる所を目印に分けるだけでほぼ完璧に単語に分解できるのに、日本語では単語分解だけで既に1分野だ。
アフィのアレも私の野獣の勘ばかりでやってても偏るのでちょっとこういうので機械に提案させるのも良いかも知れぬ。
・データはテキストで、Shift-JIS/JIS/EUCのいずれか。
・対象ファイル中に'"\\<>|が含まれていてはならない。できれば半角文字も無い方が望ましい。
・H1〜H5でタグ付けしてあるHTMLだと都合が良いらしい。
あとでもうちょっと見る。こういうのは使いながら読まないと身につかんからな。
![]() | 社会調査のための計量テキスト分析―内容分析の継承と発展を目指して 樋口耕一 ナカニシヤ出版 2014-03 売り上げランキング : 18004 Amazonで詳しく見る by G-Tools |
コメント