2006-02-24から1日間の記事一覧

「音声認識用 N-gram 言語モデルの単位の最適化」見直し

最小単位をなににするか? ・文字 ・形態素 ・? 形態素でないにしても、 読みが決定されている必要がある。 音声認識、同字語の曖昧性解消の点からも、読みは有用。音響コンフュサビリティを考慮した単位の必要性: 1モーラしかない単語では、音響モデルで…

「音声認識用 N-gram 言語モデルの単位の最適化」批判

そもそも、N-gram でなく、適応的に文脈長を選ぶべきではないか(PPM*言語モデル?) 形態素/活用の単位の2-gram文脈の情報量は、それなりに一様(1-gram文脈では明らかに不足しているが) 3-gram と 2-gram はけっこう違う。

変分ベイズ学習理論入門

http://watanabe-www.pi.titech.ac.jp/~swatanab/var-bay.pdf

Clay Mathematics Institute

Workshop on Algebraic Statistics and Computational Biology [bio][stat][net]: http://www.claymath.org/programs/cmiworkshops/ascb/ 代数幾何と 生物の Sequence Analysis ?

大語彙連続音声認識のための言語的音響的属性に基づく単語単位の最適化

http://www.furui.cs.titech.ac.jp/publication/2003/asj2003s_135.pdf