KyWSD: all-words WSD by KyTea


kytea を利用して日本語の all-words WSD のシステム( KyWSD )を作りました。
これです。kytea のモデルです。

まず kytea をインストールして下さい。コードは UTF-8 にして下さい。
使い方は以下を参考にしてください。

> cat sample.txt
野球のDHの正式呼び名と意味を教えてください。

> kytea -model wsd.mod < sample.txt
野球/名詞-普通名詞/51783-0-0-0 の/助詞-格助詞/0 DH/UNK/UNK の/助詞-格助詞/0
正式/形状詞-一般/0 呼び名/名詞-普通名詞/53605-0-0-0 と/助詞-格助詞/0
意味/名詞-普通名詞/2843-0-0-1 を/助詞-格助詞/0 教え/動詞-一般-語幹/5541-0-0-2
て/助詞-接続助詞/0 くださ/動詞-非自立可能-語幹/13445-0-0-2 い/動詞-非自立可能-語尾/0
。/補助記号-句点/0

>kytea -model wsd.mod -notag 1 -out conf < sample.txt
野球/51783-0-0-0 の/0&39930-0-1-3&40065-0-0-0 DH/UNK の/0&39930-0-1-3&39930-0-1-1
正式/0 呼び名/53605-0-0-0 と/0&37713-0-0-1&37446-0-0-2
意味/2843-0-0-1&2843-0-0-2&2843-0-0-3 を/0 教え/5541-0-0-2&5541-0-0-1&5541-0-0-3
て/0&35369-0-0-0 くださ/13445-0-0-2&0 い/0&1707-0-0-2&52935-0-0-3 。/0
・・・ (omit) ・・・
1 0.999999&7.94354e-07&1.23533e-07 1 1&6.47248e-08&3.92486e-08 1 1
1&1.8927e-09&1.8105e-09 0.807761&0.108979&0.0807573 1 0.863406&0.135187&0.0012201
1&4.35077e-09 0.999236&0.00076433 0.999999&1.22639e-07&8.67671e-08 1


何か質問、コメントなどあれば、新納までメール下さい。

2016年3月14日