MeCab ユーザー辞書を作成し単語を追加する windows
windows環境でMeCabユーザー辞書に単語を追加します。
参考URL
https://www.pytry3g.com/entry/MeCab-UserDictionary
http://miner.hatenablog.com/entry/323
辞書コンパイルまで
・anaconda promptを開く(コマンドプロンプトでも可)
・適当な作業ディレクトリに移動
・excelから新規でシートを開き下記のようにフォーマットに沿って単語を追加していく
フォーマットは
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音,追加エントリ
としている。
文脈IDは空白にすれば自動で挿入される。
品詞、品詞細分類1~3は下記URLの表の中の分類のうちどれかを入れる必要がある。
http://miner.hatenablog.com/entry/323
※保存する際にはCSV UTF-8(コンマ区切り)で保存する必要がある
今回はexample.csvというファイル名で保存した
・次にテキストエディタを開き下記の例のように書く
echo on "C:\Program Files (x86)\MeCab\bin\mecab-dict-index" -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 example.csv pause
-d システム辞書があるディレクトリ
-u 保存するユーザー辞書の名前
example.csv 作成したcsvファイル
Program Files (x86)かProgram Filesは環境による。MeCabフォルダがある方を確認する。
・下記のようにコマンドを実行する
user_custom.bat
これでコンパイルされたuser.dicが生成される。
mecabrcの編集
・生成された辞書user.dicを任意のディレクトリに移動させる。
・管理者としてエディタを開き、mecabrcを開く。(mecabrcは/MeCab/etcにある)
・userdicを下記のようにuser.dicを移動させたディレクトリにする。
userdic = C:\Program Files\MeCab\dic\user-dict\user.dic
以上で単語の追加は完了