[mecab-users 208] Re: ユーザー辞書による形態素解析について

Back to archive index

Yoshio Kawano kawan****@livin*****
2007年 1月 29日 (月) 10:56:04 JST


お世話になっております。
YKawaです。

ご回答、ありがとうございます。

本件、自分で何かと動かしていたら、上手く使える様になりました。

動いた原因は、ご指摘の通り0.91と0.93の単語辞書(*.csv)の
フォーマットが違っていたからでした。
0.91では、
    表層形,左文脈ID,右文脈ID,単語コスト
でも、良かったのですが
0.93では、
    表層形,左文脈ID,右文脈ID,単語コスト,ユーザ定義のCSVフィールド
が必要なようです。

なので、フォーマットを変更して、辞書を作成しなおしました。

----- Original Message ----- 
From: "Taku Kudo" <taku****@chase*****>
To: "Yoshio Kawano" <kawan****@livin*****>
Cc: <mecab****@lists*****>
Sent: Sunday, January 28, 2007 9:57 PM
Subject: Re: [mecab-users 202] ユーザー辞書による形態素解析について


> 工藤です
>
> 返事がおくれましてすいません.
>
> 06/12/30 に Yoshio Kawano<kawan****@livin*****> さんは書きました:
> >
> >
> > お世話になっております。
> > YKawaです。
> >
> > 下記のコマンドを実行すると、エラーが発生します。
> > 解決の糸口となる情報をお持ちの方がいらっしゃいましたら
> > ご協力をお願い致します。
> >
> > ●実行コマンド
> >  mecab -N2 -d ../data/DIC/mecab article.1
> >
> > ●実行結果
> > tagger.cpp(143) [tokenizer_.open(param)] tokenizer.cpp(107)
> > [unkdic_.open(create_filename(prefix,
> > UNK_DIC_FILE).c_str())] dictionary.cpp(46) [(magic ^ DictionaryMagicID)
==
> > dmmap_->size()] dictionary file is broken: ../data/DIC/mecab/unk.dic
> >
> > ◎説明
> >  ユーザー辞書を作成し、『../data/DIC/mecab』に置きました。
> >  後は、その辞書を使って文書の形態素解析を実施したかったのが意図です。
> >    『../data/DIC/mecab』には、
> >         char.bin
> >         char.def
> >         dicrc
> >         matrix.bin
> >         matrix.def
> >         sys.dic
> >         unk.def
> >         unk.dic
> >     を、置いてあります。
> >
> >     マシンが2台ありまして、1台目で作成した辞書を
> >     2台目にコピーして使っております。
> >     1台目のマシンでは、正常に解析されるのですが
> >     2台目では、上記でお知らせしたエラーが発生します。
> >
> > ◎環境
> >     ・1台目のマシン
> >             Mecab 0.91
> >
> >     ・2台目のマシン
> >             Mecab 0.93
>
> 0.91 と 0.93 のバイナリ辞書には互換性がありません.
>
> 基本的にバイナリ辞書のフォーマットは頻繁に変更される可能性があります.
>




mecab-users メーリングリストの案内
Back to archive index