2007-04-02 PodCastleの実現:Web2.0にもとづく音声認識性能の向上について sr IPSJ-SIG 2007-SLP-65 より。PodCastleがすばらしいのは、 研究者とユーザーが、いわゆるwin-winな関係で直接つながっていることだと思う。 音声認識システムはユーザーに音声ファイルの全文検索を提供する。 ユーザーは音声認識システムに訂正情報を提供する。 ユーザーが教師データを容易に提供できるというタスクの性質、 その作業をスムーズにさせてくれるUIへの尽力がすばらしい。おそらく検討されていると思うけれど、 字幕.inとの連携ができたらいいと思う。 字幕.inが音声・字幕アライメントの入出力APIを提供し、 Podcastleがそれを受けとったり書き込んだりする。