かな・漢字文字列を単位とした言語モデルの検討

http://lbc21.jp/temp/hokoku14/psn/k/kato_m.htm

金野弘明・加藤正治・小坂哲夫・好田正紀・伊藤彰則:
「かな・漢字文字列を単位とした言語モデルの検討」
『電子情報通信学会技術研究報告』 SP2002-148, 1-6 (2002-12)

形態素でない言語モデルの単位の研究。
1文字を単位とする言語モデルと、
2文字を単位とする言語モデル
階数は4。
2文字辞書の選択には、相互情報量か頻度を用いる。

先行論文でモデルが提案され、
ここには丁寧な実験結果が書かれている。
性能が悪くなるのは