カテゴリ: python

1.OpenSSLをダウンロードしてインストール(https://slproweb.com/products/Win32OpenSSL.html)。
  バージョンは今回は新しい方がよかろうと3.0.5の64bit版とした。
2.インストール先/bin をシステム環境変数PATHに追加。
3.Anaconda Promptを「管理者として実行」
4.conda install -c anaconda openssl でPythonのopenssl関連モジュールをインストール(https://anaconda.org/anaconda/openssl)。
5.conda install -c anaconda gensim でgensimをインストール(https://anaconda.org/anaconda/gensim)


このエントリーをはてなブックマークに追加 mixiチェック

先日の胡散臭いデザインのはやっぱどうもダメなので、拡張辞書はLinux上で作成してそれをWindowsに持ってきて参照させる方法で対応したところ上手く行った。
あと、PythonでもJava同様、Windowsでのパスの区切りは/で代用できた。
CentOS上でmecabと拡張辞書のインストール手順は、https://qiita.com/YuukiMiyoshi/items/00b9878a1fa32b859a43 を参照。
ここで作成した /opt/mecab/lib/mecab/dic/neologd ディレクトリをそのままWindowsの任意の場所にコピーして、-dオプションで指定する。
Ffr-Dc-aEAIW0yV




このエントリーをはてなブックマークに追加 mixiチェック

※この手順はやはりだめだったので10/23の記事参照。
Windowsが中々載っていないが、手順はこのブログ
デザインが胡散臭いが親切丁寧だ。一つだけ、システム辞書ディレクトリが今のMeCabと異なる。
あと、コンパイルコマンドを実行するDOS窓は「管理者として実行」で開く事。
----
Microsoft Windows [Version 10.0.19045.2130]
(c) Microsoft Corporation. All rights reserved.

C:\WINDOWS\system32>cd C:\Users\owner\mecab-ipadic-neologd-master

C:\Users\owner\mecab-ipadic-neologd-master>build

C:\Users\owner\mecab-ipadic-neologd-master>mecab-dict-index -d "C:\Program Files\MeCab\dic\ipadic" -u "C:\Program Files\MeCab\dic\ipadic\NEologd.dic" -f utf-8 -t utf-8 C:\Users\owner\mecab-ipadic-neologd-master\mecab-user-dict-seed.20200910.csv
reading C:\Users\owner\mecab-ipadic-neologd-master\mecab-user-dict-seed.20200910.csv ... 3224584
emitting double-array: 100% |###########################################|

done!

C:\Users\owner\mecab-ipadic-neologd-master>
----

コンパイルは通ったっぽいが、Pythonからの実行に失敗する。

Fflyyv9aMAAC-YW


このエントリーをはてなブックマークに追加 mixiチェック

C:\インストールパス\Anaconda3
C:\インストールパス\Anaconda3\Scripts

そして全パッケージの最新化は、Anaconda Powershell を「管理者として」開いて、
conda update --all

アナコンダ3 [DVD]
デヴィッド・ハッセルホフ
ソニー・ピクチャーズエンタテインメント
2009-12-23

このエントリーをはてなブックマークに追加 mixiチェック

下記の書籍にWindowsだとPythonからMeCabを使えるようにするのが結構大変と記載があった。
やり方は https://qiita.com/kensussu/items/5500841c97b05e94a2d9 。これが無ければ危ない所だった。
※ちなみに既にAnacondaはインストール済。
・MeCabは公式版ではなく64bit版 https://github.com/ikegami-yukino/mecab/releases をインストール。
・インストール時の言語はデフォルトのSJISではなくUTF-8を選択
・インストーラはPATHを通してくれないので、インストール完了後に自分でコントロールパネルから環境変数PATHにMeCabインストール先\binを追加すること。
・Anaconda Powershellから、conda install -c mzh mecab-python3 でPython側の対応ライブラリをインストール
・Jupyter Notebookからサンプルを実行して確認
FfWwcARaAAM7GG7

うむ、MeCab完全に理解した。



このエントリーをはてなブックマークに追加 mixiチェック

こう言う感じで、各カラム毎にダブルクォーテーションで括ったCSVを読み込ませる


こうなる。quotingが0~2までは同じ動作、3にすると先頭カラムが""で括られる。先頭カラム以外は常に””までもが文字データとして取得されてしまう。

どうしたものか。
https://tanuhack.com/pandas-csv-readto/
とか、何のオプションも無しにただ読み込ませただけで""が外れるのに。



このエントリーをはてなブックマークに追加 mixiチェック

主な情報はヘッダから採るようにしているが、やはり少々影響は受ける。
PythonJavaの混成アプリで今回影響を受けたのはPython部分。Pythonは普段使わないからすぐ忘れてその度に文法をWebで検索して思い出す…。インデントで挙動が変わるのだけはどうかと思う。いや読みやすくなるのは判るが…。
どんどん変わるであろうHTMLはPythonで受けて整形というか情報を取り出し、本処理のJavaの方はリコンパイルを避ける事で変更に強い設計にした筈だったが、Pythonの文法を忘れるという罠が…全部Javaにすべきだったか…。だが今から作り直すのも面倒…。
そいえばいつのまにか新しいサムネイルの大きさというか、リサイズをしてくれる処理が出来たようで


等々、メイン画像の大きさを色々変えられるっぽい。サムネイルには効かないようだが。

このエントリーをはてなブックマークに追加 mixiチェック

ソースからのビルドにも失敗したので、今度は別PCにインストール後、C:\Python32\をディレクトリごと固めてこのPCにコピー。パスを直下とDLLsとlibsに通してpythonコマンドを実行すると

python32.dllが見つかりません

エラー。ちなみにC:\Python32\配下にpython32.dllなんてファイルはそもそも存在しない。python32.libならあるけど。System32とかに入っているのだろうか?それとも静的リンク版ならpython32.libの方を使ったりするのだろうか。
→インストールしてちゃんと動作してる方のPCにもpython32.dllは無かった。謎。LinuxのlddみたいなコマンドってWindowsでは何だろう?

このエントリーをはてなブックマークに追加 mixiチェック

という訳でPython 3.2.2をソースからビルドする羽目に。こういうの苦手なんだが…昔から一発で通った試しがあまり無い。でもWindowsだしUnix程#ifdefの迷路って訳でも無いだろう…多分…。
http://www.python.org/download/releases/3.2.2/ から Gzipped source tar ball (3.2.2) をダウンロード。一番一般的なtar.gzだ。7zで解凍できる。
展開したディレクトリ直下のREADMEを読む。

On Windows, see PCbuild/readme.txt.

それだけか。素っ気無いな。

Microsoft Visual C++ 2008 Express Edition is required at the very least.

何、Express Editionでビルドできるのか。だったら最新のVisual Studio 2010 Express Editionで…と思ったけどインストール面倒なのでまぁいいや。そもそも今、.msiが正常動作しなくてこんな羽目になってるんだし。

All you need to do is open the workspace "pcbuild.sln" in Visual Studio,

PCBuild直下のpcbuild.slnをVS2005開く

選択されたファイルはソリューションファイルですが、このアプリケーションより新しいバージョンで作成されたため開くことができません

ダメじゃん。だが慌てるのはまだ早い。さっきVC8.0ってディレクトリを見つけてあるんだ。

Legacy support

                          • -

You can find build directories for older versions of Visual Studio and
Visual C++ in the PC directory. The legacy build directories are no longer
actively maintained and may not work out of the box.

PC/VC6/
Visual C++ 6.0
PC/VS7.1/
Visual Studio 2003 (7.1)
PC/VS8.0/
Visual Studio 2005 (8.0)

…うーむ、もはやメンテナンスされてないとか動かないかも知れないとか言ってるし…。とりあえずソリューションは開けたのでビルド。

10>コンパイルしています...
10>randtable.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\randtable.c': No such file or directory
10>huffman.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\huffman.c': No such file or directory
10>decompress.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\decompress.c': No such file or directory
10>crctable.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\crctable.c': No such file or directory
10>compress.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\compress.c': No such file or directory
10>bzlib.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\bzlib.c': No such file or directory
10>blocksort.c
10>c1 : fatal error C1083: ソース ファイルを開けません。'..\..\..\bzip2-1.0.5\blocksort.c': No such file or directory
10>bz2module.c
(以下略)他色々

bzlib.cなんてファイルは無いぞ。別のOSSのソースが必要とか?多分、ソースを入手したりパスを変更したりするより、VC++2010 Express Edition入れた方が早い。しかしmsiが動作しない。
何か嫌になってきたな。さらばPythonXML処理が簡単に書けるのは気に入っていたよ…。

このエントリーをはてなブックマークに追加 mixiチェック

3.2.1をアンインストールして、3.2.2をインストールしようとしたところ、インストーラ

msiexec.exe の 0x6d6d5eaa でハンドルされていない例外が発生しました: 0xC0000005: 場所 0x00000020 を読み込み中にアクセス違反が発生しました。

で必ず異常終了する。3.2.1のインストーラも3.1.4も3.0.1のも同様。
以前成功したはずの3.2.1まで異常終了するところを見ると何となくPythonばかりではなく*.msiはみんなそうなるような気がしないでも無いが試していない。私のPCは以前もHotSpot JVM 1.6シリーズが異常終了するようになったりしてて何か変なんだけど多分その類じゃないかと疑っている。何故そうなるのかは不明。
PythonWindows版だけは何故かソースが無いし、まぁとにかくこのPCでPythonは使えなくなったのでお別れである。せっかくやっと使えるようになったのに…。作ったばかりの先日のアレもJavaに移植しないと。うむ、面倒…。というか後ひとつ、毎日定期的に流してる奴があってそっちの移植が急務か。さらばPython
→と思ったら http://www.python.org/download/releases/3.2.2/ ソースあった。ビルドできるかなーVisual Studioのプロジェクト付きじゃなかったらもう嫌ん。
 →プロジェクトはあるが、slnが6つもある。どれだ。VC++7.1用と8用とか色々あるんだけど。というか私のVisual Studio 2005 ってVC++8だっけ?7だっけ?VC++6.0は聞いた事あるがVC++7.0はあまり聞かないので2005が7だった気がするが…しばらく使ってないから忘れてる…。いや、VC++6.0から2005の間に確か2002があってそれが7か。ということは2005はVC++8。うむ。というかインストールディレクトリ名が

C:\Program Files\Microsoft Visual Studio 8

だった。

このエントリーをはてなブックマークに追加 mixiチェック

↑このページのトップヘ