[mecab-users 428] 連接コストが一致しない

Back to archive index

higas****@yourg*****
2010年 8月 11日 (水) 13:13:42 JST


はじめまして。
東と申します。

N-Bestで表示した連接コストがmatrix.defと一致しないので困っています。

AMD64
CentOS5 64bit
mecab-0.97, mecab-0.98 ソースからコンパイル
ipadic-2.7.0-20070801 EUC-JP


/usr/local/mecab/bin/mecab -F "%m\t%phl,%phr,%c %pC %pc %H\n" -N 2 -l 1
表層文字列 左文脈ID 右文脈ID 単語生起コスト 連接コスト 累積コスト 素性
で出力しています。

さくらももいちご
さくら  1285,1285,5256 -283 4973 名詞,一般,*,*,*,*,さくら,サクラ,サクラ
も      262,262,4669 -4158 5484 助詞,係助詞,*,*,*,*,も,モ,モ
も      262,262,4669 478 10631 助詞,係助詞,*,*,*,*,も,モ,モ
いちご  1285,1285,7266 17 17914 名詞,一般,*,*,*,*,いちご,イチゴ,イチゴ
EOS
さくら  1285,1285,5256 -283 4973 名詞,一般,*,*,*,*,さくら,サクラ,サクラ
もも    1285,1285,7219 62 12254 名詞,一般,*,*,*,*,もも,モモ,モモ
いちご  1285,1285,7266 -1606 17914 名詞,一般,*,*,*,*,いちご,イチゴ,イチ
ゴ
EOS

matrix.def
1285 1285 62

「さくら もも」の連接コストが 62 はいいのですが、
「もも いちご」の連接コストが -1606 と表示されます。
「もも いちご」の連接コストは 62 じゃないんでしょうか?



それと、N-BestでEOSまで含めた累積コストを表示できると嬉しいです。

よろしくお願いします。




mecab-users メーリングリストの案内
Back to archive index