2006-02-22 かな・漢字文字列を単位とした言語モデルの検討 lm net http://lbc21.jp/temp/hokoku14/psn/k/kato_m.htm 金野弘明・加藤正治・小坂哲夫・好田正紀・伊藤彰則: 「かな・漢字文字列を単位とした言語モデルの検討」 『電子情報通信学会技術研究報告』 SP2002-148, 1-6 (2002-12) 形態素でない言語モデルの単位の研究。 1文字を単位とする言語モデルと、 2文字を単位とする言語モデル。 階数は4。 2文字辞書の選択には、相互情報量か頻度を用いる。先行論文でモデルが提案され、 ここには丁寧な実験結果が書かれている。 性能が悪くなるのは