audio
sox -t .raw -r 16000 -s -w -c 1 file.raw -t .wav file.wav
http://www.wakayama-u.ac.jp/~kawahara/straighttrial/ STRAIGHT は音声分析・合成ツール。 人間の音声を可読性の高い成分に分解し、再構成することができる。STRAIGHT linksにあるように、ここ数年国内外の多くの音声研究者が利用している。
「音声にはモデルがあるけれど言語にはない」 という言葉がずっと気になっていた。 最近になって、少し意味が分かってきたような気がする。ここで音声にあるモデルというのは、 基本的に「発声に関わる神経と筋肉のモデル」である。 もちろん発声という行動…
http://en.wikipedia.org/wiki/international_phonetic_alphabet これだけで、音声学のよい復習になります。情報処理推進機構ではないのに注意。追記 音声学を勉強したような顔をしてますが、本を読んだだけです。 言語学の中で音声学だけはトレーニングを受…
AIチャレンジ研究会24回の資料の峯松先生の論文。「定理」として最初にあげられるのがバタチャリヤ距離、カルバックライブラー距離、の変換不変性と、 N個の点集合が作る形とNxNの距離行列の等価性。 参考:距離 - 朱鷺の杜Wiki注目している集合が閉じてい…
http://citeseer.ist.psu.edu/victor03polyphonic.html Markov Random Field を利用した、音楽モデリング。 テキスト検索手法を音楽検索へ導入することを強く意識している。パープレキシティ評価も。
http://citeseer.ist.psu.edu/pickens04harmonic.html コンテンツベースの音楽検索についての博士論文。 多声のパッセージを検索質問とし、曲を検索結果とする。