Julius による大語彙連続音声認識のメモ

  • rawfile での入力音声はwav形式なので、

持っているファイルが raw だったら変換しておく。
http://julius.sourceforge.jp/forum/viewtopic.php?f=14&t=7

ヘッダ無し(RAW)の音声ファイル入力は、16bit (signed short) の、BIG ENDIAN 形式である必要があります。
バイトオーダーが LITTLE ENDIAN だと正しく認識できません。

LITTLE ENDIAN の RAW ファイルを、Juliusで読み込める wav ファイルに変換するには
以下のようにします。

sox -t .raw -r 16000 -s -w -c 1 file.raw -t .wav file.wav

qrsh julius -input rawfile \
julius -input rawfile \

  • nrl 逆向き3gram \
  • nlr 正向き2gram \
  • v 辞書 \
  • h HMM音響 (HTK形式, hmmdefs) \
  • hlist ~/mec/import/net/iiipcg/audio8/ogata/castle/tools/LVCSR,dev/etc/recog/tri,tied.list \
  • filelist filelist.txt \
& > error

辞書の書式

あっという間:アットユウマ:あっという間:38 [あっという間] a q t o y u u m a
あっという間に:アットユウマニ:あっという間に:34 [あっという間に] a q t o y u u m a n i