2006-02-24 「音声認識用 N-gram 言語モデルの単位の最適化」批判 segmentation lm そもそも、N-gram でなく、適応的に文脈長を選ぶべきではないか(PPM*言語モデル?) 形態素/活用の単位の2-gram文脈の情報量は、それなりに一様(1-gram文脈では明らかに不足しているが) 3-gram と 2-gram はけっこう違う。