2008-12-30 20:19:33
石田基広『Rによるテキストマイニング入門』(森北出版 2008/12)[amazon.co.jp, bk1, 楽天, 紀伊國屋書店, Yahoo! Books]という本を買って、RMeCabという素晴らしいものがあると知って早速インストールしてみた。
RMeCabサイトから、Linux用にはRMeCab_0.67.tar.gzをダウンロード。MacOSXの場合はRMeCab_0.67.tgzを「別名で保存」して、管理者権限で立ち上げたRから、
> install.packages("RMeCab_0.67.tgz", destdir=".", repos = NULL) * Installing *binary* package 'RMeCab' ... * DONE (RMeCab)とやってインストール。
Linuxの場合も同様にすると、
> install.packages("RMeCab_0.67.tar.gz", destdir=".", repos = NULL) install.packages("RMeCab_0.67.tar.gz", destdir = ".", repos = NULL) 中で警告がありました: 引数 'lib' が欠けています:/usr/local/lib/R/site-library を使います * Installing *binary* package 'RMeCab' ... * DONE (RMeCab)という警告が出たが、問題ないらしい。ちなみに、職場のUbuntu 8.10 (R 2.8.1)にはRMeCab 0.67を、自宅のUbuntu 8.10 (R 2.7.1)にはRMeCab 0.61をインストールした。何の問題もなくインストールできて、動作確認ができた。
ところが、MacOSXの方は、
> library('RMeCab') エラー: パッケージ 'RMeCab' は universal-apple-darwin8.11.1 に対して造られました 追加情報: Warning message: パッケージ 'RMeCab' はバージョン 2.8.1 の R の下で造られましたというエラーが出たので、ああ2.8.0だったんだねと思って、2.8.1を
./configure --with-blas='-framework vecLib' \\ --with-lapack --with-aqua\\ --enable-R-framework --enable-R-shlib make make installというようにインストールしたけれども、「エラー: パッケージ 'RMeCab' は universal-apple-darwin8.11.1 に対して造られました」というエラーは消えないじゃないか。
mecabが古いのかな(0.93だった)ので、0.97をダウンロードして、インストール。
./configure --with-charset=utf-8 make sudo make installで。辞書も同様に。
To enable dictionary, rewrite /usr/local/etc/mecabrc as "dicrc = /usr/local/lib/mecab/dic/ipadic" などという表示が出てきたので、そうしてみた。
予想はしていたが、関係なかった。どうしたらいいか判らないので、作った人にメールを出してみた。(*制作者の石田基広氏からすぐにご返事をいだたきました。今は手元にPowePC版Macがないので確認できないが、年が明けたら借りて調べるので、しばらく待ってほしいということでした。)
ついでに、mecab-pythonもインストール。
python setup.py buildとやったら、
ld: warning in /usr/local/lib/libmecab.dylib, file is not of required architectureという警告が。どうも判らないので、
sudo python setup.py installとすると、何やらインストールはしたようだ。
テストしようと、
python test.pyとやったら、SyntaxError: Non-ASCII character とかいうエラーが出たので、test.pyに
# coding: utf-8
という行を入れてみたら、今度は、
no such file or directory: ./dicrc
というようなエラーが。
さっきの/usr/local/etc/mecabrcの書き換えがいけなかったのか。よくわからないけど、元に戻したら、
0.97 太郎 名詞,固有名詞,人名,名,*,*,太郎,タロウ,タロー は 助詞,係助詞,*,*,*,*,は,ハ,ワ この 連体詞,*,*,*,*,*,この,コノ,コノ 本 名詞,一般,*,*,*,*,本,ホン,ホン を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 二 名詞,数,*,*,*,*,二,ニ,ニ 郎 名詞,一般,*,*,*,*,郎,ロウ,ロー を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ 見 動詞,自立,*,*,一段,連用形,見る,ミ,ミ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 女性 名詞,一般,*,*,*,*,女性,ジョセイ,ジョセイ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ 渡し 動詞,自立,*,*,五段・サ行,連用形,渡す,ワタシ,ワタシ た 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ 。 記号,句点,*,*,*,*,。,。,。 EOSというような解析結果が表示された(本当はこの下にもっといろいろ続く)。
RMeCabを試してみる話はまた後ほど。