「音声認識用 N-gram 言語モデルの単位の最適化」見直し

最小単位をなににするか?
・文字
形態素
・?
形態素でないにしても、
読みが決定されている必要がある。
音声認識、同字語の曖昧性解消の点からも、読みは有用。

音響コンフュサビリティを考慮した単位の必要性:
1モーラしかない単語では、音響モデルで音素環境依存性3-phone