音声の構造的表象を通して考察する幼児の音声模倣と言語獲得

AIチャレンジ研究会24回の資料の峯松先生の論文。

「定理」として最初にあげられるのがバタチャリヤ距離、カルバックライブラー距離、の変換不変性と、
N個の点集合が作る形とNxNの距離行列の等価性。
参考:距離 - 朱鷺の杜Wiki

注目している集合が閉じている(音素、音韻)ことと開いている(語彙)ことが、
音声処理と言語処理のあつかう対象の大きな違いだと思った。

第一著者は絶対音感を持っており、この階名での書き起こしが全くもって理解できない一人である。異なる音高に同一の音ラベルを振ることなど、全く理解不能である。
異なる話者間で「あ」の同一性が感覚できない人がいるのだろうか?
感覚できない「機械」が(中略)音声認識器である。
感覚できない「人」として、一部の自閉症者がいる。

極端な音声の絶対音感を持つと考えられる自閉症者にとって、物理的に異なる特性を持つ話者Aの音とBの音を「同一音」として認知する健常者の感覚こそ、想像を絶するものではないかと推測する。
異なる二音を「あ」と感覚できる健常者の認知能力が、音の絶対項に基づくものなのか、あるいは、音間の相対項に基づくものなのか

音声コミュニケーションに障害のある自閉者に対する健常者を、
絶対音感をもつ人に対する健常者に並行させる議論は魅力的だと思った。

彼らのグループが作った「音声から単語をメロディーのようにして認識する」システムは、
非シンボル的な相対音感に対応する。(と思う)

「構造表象」生得主義のようにも見えるけれど
この論文だけでは詳細が分からないので、参考文献をあたる必要がある。

峯松先生の過去の招待講演から
http://www.gavo.t.u-tokyo.ac.jp/%7Emine/paper/PDF/2006/speech_as_music.pdf