2006-02-24 「音声認識用 N-gram 言語モデルの単位の最適化」見直し segmentation lm 最小単位をなににするか? ・文字 ・形態素 ・? 形態素でないにしても、 読みが決定されている必要がある。 音声認識、同字語の曖昧性解消の点からも、読みは有用。音響コンフュサビリティを考慮した単位の必要性: 1モーラしかない単語では、音響モデルで音素環境依存性3-phone