MeCab ユーザー辞書を作成し単語を追加する windows

windows環境でMeCabユーザー辞書に単語を追加します。
参考URL
https://www.pytry3g.com/entry/MeCab-UserDictionary
http://miner.hatenablog.com/entry/323

辞書コンパイルまで

・anaconda promptを開く(コマンドプロンプトでも可)
・適当な作業ディレクトリに移動
excelから新規でシートを開き下記のようにフォーマットに沿って単語を追加していく

f:id:alientom516:20190320192847p:plain
フォーマットは
表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音,追加エントリ
としている。
文脈IDは空白にすれば自動で挿入される。
品詞、品詞細分類1~3は下記URLの表の中の分類のうちどれかを入れる必要がある。
http://miner.hatenablog.com/entry/323
※保存する際にはCSV UTF-8(コンマ区切り)で保存する必要がある
今回はexample.csvというファイル名で保存した
・次にテキストエディタを開き下記の例のように書く

echo on

"C:\Program Files (x86)\MeCab\bin\mecab-dict-index" -d "C:\Program Files (x86)\MeCab\dic\ipadic" -u user.dic -f utf-8 -t utf-8 example.csv

pause


-d システム辞書があるディレクト
-u 保存するユーザー辞書の名前
example.csv 作成したcsvファイル
Program Files (x86)かProgram Filesは環境による。MeCabフォルダがある方を確認する。
・下記のようにコマンドを実行する

user_custom.bat


これでコンパイルされたuser.dicが生成される。

mecabrcの編集

・生成された辞書user.dicを任意のディレクトリに移動させる。
・管理者としてエディタを開き、mecabrcを開く。(mecabrcは/MeCab/etcにある)
・userdicを下記のようにuser.dicを移動させたディレクトリにする。

userdic =  C:\Program Files\MeCab\dic\user-dict\user.dic

以上で単語の追加は完了