audio

raw wav 変換

sox -t .raw -r 16000 -s -w -c 1 file.raw -t .wav file.wav

STRAIGHT trial page

http://www.wakayama-u.ac.jp/~kawahara/straighttrial/ STRAIGHT は音声分析・合成ツール。 人間の音声を可読性の高い成分に分解し、再構成することができる。STRAIGHT linksにあるように、ここ数年国内外の多くの音声研究者が利用している。

「物理モデルによる音声合成」と比べてみた言語のモデルの現状

「音声にはモデルがあるけれど言語にはない」 という言葉がずっと気になっていた。 最近になって、少し意味が分かってきたような気がする。ここで音声にあるモデルというのは、 基本的に「発声に関わる神経と筋肉のモデル」である。 もちろん発声という行動…

IPA の項目がすばらしく充実している件

http://en.wikipedia.org/wiki/international_phonetic_alphabet これだけで、音声学のよい復習になります。情報処理推進機構ではないのに注意。追記 音声学を勉強したような顔をしてますが、本を読んだだけです。 言語学の中で音声学だけはトレーニングを受…

音声の構造的表象を通して考察する幼児の音声模倣と言語獲得

AIチャレンジ研究会24回の資料の峯松先生の論文。「定理」として最初にあげられるのがバタチャリヤ距離、カルバックライブラー距離、の変換不変性と、 N個の点集合が作る形とNxNの距離行列の等価性。 参考:距離 - 朱鷺の杜Wiki注目している集合が閉じてい…

Polyphonic Music Modeling with Random Fields - Victor, Jeremy (2003)

http://citeseer.ist.psu.edu/victor03polyphonic.html Markov Random Field を利用した、音楽モデリング。 テキスト検索手法を音楽検索へ導入することを強く意識している。パープレキシティ評価も。

Harmonic Modeling for Polyphonic Music Retrieval (2004)

http://citeseer.ist.psu.edu/pickens04harmonic.html コンテンツベースの音楽検索についての博士論文。 多声のパッセージを検索質問とし、曲を検索結果とする。