2006-01-01から1ヶ月間の記事一覧

SAKAI Masahiro

http://www.tom.sfc.keio.ac.jp/~sakai/hiki/ 型理論とか勉強中の人。

Compound splitting and lexical unit recombination for improved ...

http://www.mmk.ei.tum.de/~waf/publ/00/icslp00ml_compounds.pdf ドイツ語における単語の分解と連結ドイツ語における問題は、空白区切りでは単語が長すぎるということ。

Toward a Unified Approach to Statistical Language Modeling for Chinese

http://research.microsoft.com/~joshuago/talip01.pdf 中国語におけるプレーンテキストからの言語モデルの構築

言語計測研究

http://staff.aist.go.jp/t-nakai/language/index.html 産総研 医用ビジョンラボ 言語処理する人間の脳をfMRIで観測。 松尾香弥子氏の、漢字の空書に関する研究とか。

Ronald Rosenfield, A Maximum Entropy Approach to Adaptive Statistical Language Modeling (1996)

http://citeseer.ist.psu.edu/rosenfeld96maximum.html 通称 Trigger Language Model Trigger-based Language Model長距離依存関係を表現するための言語モデルらしい。

倉田 岳人 and 森 信介 and 西村 雅史, 日本語生コーパスから自動獲得した未知語と言語モデルによる大語彙連続音声認識 第57回音声言語情報処理研究会,SIG-SLP57,2005年7月

http://www.research.ibm.com/trl/projects/speech/ 話し言葉に対応した大語彙連続音声認識か? 以前からの、事前知識なしの言語モデル構築の研究のつづき。

佐藤隆 and 匂坂芳典, 語を構成する音韻の連接特性を考慮した音声認識

http://purple.giti.waseda.ac.jp/master/spring2003/t01a141/index.php 認識結果として想定するのは仮名列、必要ならそのあとかな漢字変換をする、というアプローチ。音響-言語モデルとして、品詞2-gram の中に音韻(モーラ)連接のモデルを作る。 クラスベ…

宮川雅巳, グラフィカルモデリング(統計ライブラリー)

WISS, Workshop on Interactive Systems and Software

http://www.wiss.org/ 美崎さんによるレポートが読みやすくて面白い。 メディアインタラクショングループの後藤さんによる楽曲ブラウジング、合奏支援、 緒方さんによる音声入力インターフェイス各種などがある。

Windows のバッチファイルでの FOR

win

FOR %%f in (*.txt) do type %%f %が2回なのは、エスケープ記号だから(?)DOS窓では % は1つだけ。 FOR %f in (*.txt) do type %f

C++ で未定義クラスをつかった場合のエラー

cxx

error: forward declaration of `class XXXX' XXXX というクラスが未定義の場合に出るエラー。 よくある原因は、名前空間の使用を宣言していない。 関連して大量の文法エラーが出るので混乱した。

Rubyリファレンスマニュアル 1.6.8から1.8.0への変更点(まとめ)

$stdin [change] $stdout, $stderr は、$defout, $deferr の別名になり $defout, $deferr は obsolete になりました $stdin は、普通のグローバル変数となりました(STDINをリダイレクトする動作はなくなりました) $defout や $deferr に代入を行うと警告がで…

Ruby でプロセス間通信

#! /usr/bin/ruby # 2対のパイプを用意 pin, cout = IO.pipe cin, pout = IO.pipe Process.fork { # この中は子プロセス STDIN .reopen cin STDOUT.reopen cout pout.close_write pin.close_read exec "bc" # 子プロセスはこのあと bc になる } # この後は親…

ソース RPM の使いかた

rpmbuild --rebuild xxx.src.rpm とすると、コンパイルが行われてバイナリ RPM が作られ、 ~/rpm/RPMS/i386/ などに出力される。 (最後に置き場所が表示される)

JDK 5.0 で日本語フォントを使う

$JAVA_HOME/jre/lib/fonts/fallback/ に使いたいフォント(TrueType)を置き、 $JAVA_HOME/jre/lib/fontconfig.properties の記述を書き換え、それらを使うようにする。fallback ディレクトリは無ければ作る。 fontconfig.properties は、無ければ fontconfi…

Klaus Ries et al., Class Phrase Models For Language Modeling

http://citeseer.ist.psu.edu/ries96class.html 単語区切りあり言語における、教師なしフレーズ分割。 よく使われる単語列を1つのフレーズにまとめる。 2-gram パープレキシティ評価基準で、連結する2単語のよさを計る。パープレキシティ評価は 1-gram への…

Piotr Indyk

http://theory.lcs.mit.edu/~indyk/ 雑音のあるパターンマッチング。 FFTをツールとして、というのが面白そう。