Tomokiyo & Ries, What makes a word - Learning base units in Japanese for speech recognition

Class Phrase Models For Language Modeling の日本語への適用。
日本語で、パープレキシティをもっとも減少させるように、2-gramを連結する。
ただし、単語の出現確率はクラスベースであたえ、クラスは単語クラスタリングを用いる。