Julius による大語彙連続音声認識のメモ
- rawfile での入力音声はwav形式なので、
持っているファイルが raw だったら変換しておく。
http://julius.sourceforge.jp/forum/viewtopic.php?f=14&t=7
ヘッダ無し(RAW)の音声ファイル入力は、16bit (signed short) の、BIG ENDIAN 形式である必要があります。
バイトオーダーが LITTLE ENDIAN だと正しく認識できません。
LITTLE ENDIAN の RAW ファイルを、Juliusで読み込める wav ファイルに変換するには
以下のようにします。
sox -t .raw -r 16000 -s -w -c 1 file.raw -t .wav file.wav
qrsh julius -input rawfile \
julius -input rawfile \
- nrl 逆向き3gram \
- nlr 正向き2gram \
- v 辞書 \
- h HMM音響 (HTK形式, hmmdefs) \
- hlist ~/mec/import/net/iiipcg/audio8/ogata/castle/tools/LVCSR,dev/etc/recog/tri,tied.list \
- filelist filelist.txt \
& > error
辞書の書式
あっという間:アットユウマ:あっという間:38 [あっという間] a q t o y u u m a
あっという間に:アットユウマニ:あっという間に:34 [あっという間に] a q t o y u u m a n i