「Python MeCab(日本語形態素解析)」の版間の差分
ナビゲーションに移動
検索に移動
(ページの作成:「==Python MeCab(日本語形態素解析)== [Python][自然言語処理] {{amazon|4873114705}} *http://taku910.github.io/mecab/ ===インストール=== *http:/…」) |
|||
1行目: | 1行目: | ||
==Python MeCab(日本語形態素解析)== | ==Python MeCab(日本語形態素解析)== | ||
− | [Python][自然言語処理] | + | [[Python][自然言語処理]] |
{{amazon|4873114705}} | {{amazon|4873114705}} | ||
21行目: | 21行目: | ||
# make install | # make install | ||
− | + | <blockquote>./configure で、Your compiler is not powerful enough to compile MeCab エラーとなったら、gcc-c++をインストール</blockquote> | |
# yum install gcc-c++ | # yum install gcc-c++ | ||
====辞書のインストール==== | ====辞書のインストール==== | ||
41行目: | 41行目: | ||
=====以下のエラーがでる場合===== | =====以下のエラーがでる場合===== | ||
# python2.7 | # python2.7 | ||
− | + | >>> import MeCab | |
Traceback (most recent call last): | Traceback (most recent call last): | ||
− | File " | + | File "<stdin>", line 1, in <module> |
− | File "MeCab.py", line 26, in | + | File "MeCab.py", line 26, in <module> |
_MeCab = swig_import_helper() | _MeCab = swig_import_helper() | ||
File "MeCab.py", line 18, in swig_import_helper | File "MeCab.py", line 18, in swig_import_helper | ||
58行目: | 58行目: | ||
===実行してみる=== | ===実行してみる=== | ||
# python2.7 | # python2.7 | ||
− | + | >>> import MeCab | |
− | + | >>> mecab = MeCab.Tagger('-Ochasen') | |
− | + | >>> print mecab.parse('泣き叫ぶ鬼の串刺し。何かに憑かれた餓鬼の群れ') | |
泣き叫ぶ ナキサケブ 泣き叫ぶ 動詞-自立 五段・バ行 基本形 | 泣き叫ぶ ナキサケブ 泣き叫ぶ 動詞-自立 五段・バ行 基本形 | ||
鬼 オニ 鬼 名詞-一般 | 鬼 オニ 鬼 名詞-一般 |
2020年2月15日 (土) 08:05時点における版
目次
Python MeCab(日本語形態素解析)
[[Python][自然言語処理]]
インストール
janome(辞書内包/Pure Python実装の形態素解析器)
- http://mocobeta-backup.tumblr.com/post/115843098157/pure-python-janome
- http://mocobeta.github.io/janome/
- MeCabの辞書を利用
MeCab
# wget http://mecab.googlecode.com/files/mecab-0.996.tar.gz # tar -xvf http://mecab.googlecode.com/files/mecab-0.996.tar.gz # cd mecab-0.996. # ./configure --with-charset=utf8 # make # make install
<blockquote>./configure で、Your compiler is not powerful enough to compile MeCab エラーとなったら、gcc-c++をインストール</blockquote>
# yum install gcc-c++
辞書のインストール
# wget http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz # tar -xvf http://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gz # cd mecab-ipadic-2.7.0-20070801 # ./configure --with-charset=utf8 # make # make install
Pythonバインディングのインストール
# wget http://mecab.googlecode.com/files/mecab-python-0.996.tar.gz # tar -xvf mecab-python-0.996.tar.gz # cd mecab-python-0.996 # python2.7 setup.py install
- python2.7 としているのは、[CentOS6にPython2.7をインストール] [Python2.7をインストールしている]ため
ImportError: libmecab.so.2
以下のエラーがでる場合
# python2.7 >>> import MeCab Traceback (most recent call last): File "<stdin>", line 1, in <module> File "MeCab.py", line 26, in <module> _MeCab = swig_import_helper() File "MeCab.py", line 18, in swig_import_helper import _MeCab ImportError: libmecab.so.2: cannot open shared object file: No such file or directory
ライブラリを読み込ませるように設定
# cd /etc/ld.so.conf.d # vi mecab.conf
- 以下の内容をmecab.confに記述
/usr/local/lib
- 読み込み
# ldconfig
実行してみる
# python2.7 >>> import MeCab >>> mecab = MeCab.Tagger('-Ochasen') >>> print mecab.parse('泣き叫ぶ鬼の串刺し。何かに憑かれた餓鬼の群れ') 泣き叫ぶ ナキサケブ 泣き叫ぶ 動詞-自立 五段・バ行 基本形 鬼 オニ 鬼 名詞-一般 の ノ の 助詞-連体化 串刺し クシザシ 串刺し 名詞-一般 。 。 。 記号-句点 何 ナニ 何 名詞-代名詞-一般 か カ か 助詞-副助詞/並立助詞/終助詞 に ニ に 助詞-格助詞-一般 憑かれ ツカレ 憑かれる 動詞-自立 一段 連用形 た タ た 助動詞 特殊・タ 基本形 餓鬼 ガキ 餓鬼 名詞-一般 の ノ の 助詞-連体化 群れ ムレ 群れ 名詞-一般 EOS
© 2006 矢木浩人