自然言語解析 janome インストール

Janome

pure pythonで書かれた形態素解析器です。
こちらもMecabと似たようなものですが、pythonのpipで簡単に導入できるメリットですが、解析速度はMecabより遅いです。
小規模の解析でサクッと試してみたい場合は、こちらがおすすめです。

 

note.nkmk.me

 

pip install janome

 Collecting janomeNote: you may need to restart the kernel to use updated packages.

Downloading Janome-0.4.2-py2.py3-none-any.whl (19.7 MB)
     --------------------------------------- 19.7/19.7 MB 11.5 MB/s eta 0:00:00
Installing collected packages: janome
Successfully installed janome-0.4.2

 

これでインストールは完了。MeCabよりも簡単。

ユーザー辞書の使い方は?

from janome.tokenizer import Tokenizer
t = Tokenizer("userdic.csv", udic_enc="utf8") for token in t.tokenize('ああああ'):     print(token)

 

mocobeta.github.io