2006-01-24から1日間の記事一覧

Tomokiyo & Ries, What makes a word - Learning base units in Japanese for speech recognition

lm

Class Phrase Models For Language Modeling の日本語への適用。 日本語で、パープレキシティをもっとも減少させるように、2-gramを連結する。 ただし、単語の出現確率はクラスベースであたえ、クラスは単語クラスタリングを用いる。

Hermann Ney, Member, Ute Essen, Reinhard Kneser, On the Estimation of 'Small' Probabilities by Leaving-One-Out(1995)

http://csdl.computer.org/dl/trans/tp/1995/12/i1202.htm Leaving-one-out というバックオフ手法について。