PodCastleの実現：Web2.0にもとづく音声認識性能の向上について

IPSJ-SIG 2007-SLP-65 より。

PodCastleがすばらしいのは、
研究者とユーザーが、いわゆるwin-winな関係で直接つながっていることだと思う。
音声認識システムはユーザーに音声ファイルの全文検索を提供する。
ユーザーは音声認識システムに訂正情報を提供する。
ユーザーが教師データを容易に提供できるというタスクの性質、
その作業をスムーズにさせてくれるUIへの尽力がすばらしい。

おそらく検討されていると思うけれど、
字幕.inとの連携ができたらいいと思う。
字幕.inが音声・字幕アライメントの入出力APIを提供し、
Podcastleがそれを受けとったり書き込んだりする。