- 追加された行はこのように表示されます。
- 削除された行は
このように表示されます。
!!!Python MeCab(日本語形態素解析)
[Python][自然言語処理]
{{amazon 4873114705}}
*http://taku910.github.io/mecab/
!!インストール
*http://d.hatena.ne.jp/atree/20090512/1242122536
!janome(辞書内包/Pure Python実装の形態素解析器)
*http://mocobeta-backup.tumblr.com/post/115843098157/pure-python-janome
*http://mocobeta.github.io/janome/
*MeCabの辞書を利用
!MeCab
# wget http://mecab.googlecode.com/files/mecab-0.996.tar.gz
# tar -xvf http://mecab.googlecode.com/files/mecab-0.996.tar.gz
# cd mecab-0.996.
# ./configure --with-charset=utf8
# make
# make install
""./configure で、Your compiler is not powerful enough to compile MeCab エラーとなったら、gcc-c++をインストール
# yum install gcc-c++
!辞書のインストール
# wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# tar -xvf http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz
# cd mecab-ipadic-2.7.0-20070801
# ./configure --with-charset=utf8
# make
# make install
!Pythonバインディングのインストール
# wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
# tar -xvf mecab-python-0.996.tar.gz
# cd mecab-python-0.996
# python2.7 setup.py install
*python2.7 としているのは、[[Python2.7をインストールしている|CentOS6にPython2.7をインストール]]ため
!ImportError: libmecab.so.2
::以下のエラーがでる場合
# python2.7
>>> import MeCab
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "MeCab.py", line 26, in <module>
_MeCab = swig_import_helper()
File "MeCab.py", line 18, in swig_import_helper
import _MeCab
ImportError: libmecab.so.2: cannot open shared object file: No such file or directory
::ライブラリを読み込ませるように設定
# cd /etc/ld.so.conf.d
# vi mecab.conf
*以下の内容をmecab.confに記述
/usr/local/lib
*読み込み
# ldconfig
!!実行してみる
# python2.7
>>> import MeCab
>>> mecab = MeCab.Tagger('-Ochasen')
>>> print mecab.parse('泣き叫ぶ鬼の串刺し。何かに憑かれた餓鬼の群れ')
泣き叫ぶ ナキサケブ 泣き叫ぶ 動詞-自立 五段・バ行 基本形
鬼 オニ 鬼 名詞-一般
の ノ の 助詞-連体化
串刺し クシザシ 串刺し 名詞-一般
。 。 。 記号-句点
何 ナニ 何 名詞-代名詞-一般
か カ か 助詞-副助詞/並立助詞/終助詞
に ニ に 助詞-格助詞-一般
憑かれ ツカレ 憑かれる 動詞-自立 一段 連用形
た タ た 助動詞 特殊・タ 基本形
餓鬼 ガキ 餓鬼 名詞-一般
の ノ の 助詞-連体化
群れ ムレ 群れ 名詞-一般
EOS