IPADIC-tdmelodic を MeCab 辞書として活用

IPADIC-tdmelodic のインストール

前の章で作成した *.csv.accent ファイルを IPADIC のディレクトリ配下に配置し、適切なコマンドラインオプションを与えてインストール用スクリプトを実行することで、 tdmelodic-ipadic をインストールできます。

# paths
WORKDIR=/path/to/your/work/dir
NEOLOGD_DIC_DIR=${WORKDIR}/mecab-ipadic-neologd/seed
IPADIC_DIR=${WORKDIR}/mecab-ipadic-2.7.0-XXXX
# copy
for f in `ls ${NEOLOGD_DIC_DIR}/*.csv.accent`
do
    target=`basename $f`
    target=${target%.accent}
    cp $f $IPADIC_DIR/$target
done

for f in `ls ${IPADIC_DIR}/*.csv.accent`
do
    target=`basename $f`
    target=${target%.accent}
    cp $f $IPADIC_DIR/$target
done
# install
cd ${IPADIC_DIR}
./configure --with-dicdir=`mecab-config --dicdir`/tdmelodic-ipadic
make
make install

UniDic-tdmelodic の使用例

いくつかの例をご覧ください。

例1

echo 一昔前は人工知能のプログラミング言語といえばCommon LispやPrologだった。 | \
    mecab -d `mecab-config --dicdir`/tdmelodic-ipadic
一昔    名詞,一般,*,*,*,*,一昔,ヒトムカシ,ヒ[ト]ムカシ
前      名詞,副詞可能,*,*,*,*,前,マエ,マ]エ
は      助詞,係助詞,*,*,*,*,は,ハ,ワ
人工知能        名詞,固有名詞,一般,*,*,*,人工知能,ジンコウチノウ,ジ[ンコーチ]ノー
の      助詞,連体化,*,*,*,*,の,ノ,ノ
プログラミング言語      名詞,固有名詞,一般,*,*,*,プログラミング言語,プログラミングゲンゴ,プ[ログラミングゲ]ンゴ
と      助詞,格助詞,引用,*,*,*,と,ト,ト]
いえ    動詞,自立,*,*,五段・ワ行促音便,仮定形,いう,イエ,イ[エ]
ば      助詞,接続助詞,*,*,*,*,ば,バ,バ
Common Lisp     名詞,固有名詞,一般,*,*,*,Common Lisp,コモンリスプ,コ[モンリ]スプ
や      助詞,並立助詞,*,*,*,*,や,ヤ,ヤ
Prolog  名詞,固有名詞,一般,*,*,*,Prolog,プロログ,プ[ロログ
だっ    助動詞,*,*,*,特殊・ダ,連用タ接続,だ,ダッ,ダ]ッ
た      助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
。      記号,句点,*,*,*,*,。,。,。
EOS

例2

echo 横浜市中区日本大通 | mecab -d `mecab-config --dicdir`/tdmelodic-ipadic
横浜市中区日本大通      名詞,固有名詞,地域,一般,*,*,横浜市中区日本大通,ヨコハマシナカクニホンオオドオリ,[コハマ]シナ[]クニ[ホンオード]ーリ
EOS

例3

echo 980hPa | mecab -d `mecab-config --dicdir`/tdmelodic-ipadic
echo 15mm | mecab -d `mecab-config --dicdir`/tdmelodic-ipadic
echo 4月10日 | mecab -d `mecab-config --dicdir`/tdmelodic-ipadic
980hPa  名詞,固有名詞,一般,*,*,*,980hPa,キュウヒャクハチジュウヘクトパスカル,キュ]ウヒャクハ[チジュウヘクトパ]スカル
EOS
15mm    名詞,固有名詞,一般,*,*,*,15mm,ジュウゴミリメートル,ジュ[ウゴミリメ]ートル
EOS
4月10日 名詞,固有名詞,一般,*,*,*,4月10日,シガツトオカ,[ガツトオカ
EOS