2007-03-01から1ヶ月間の記事一覧

音声の構造的表象を通して考察する幼児の音声模倣と言語獲得

AIチャレンジ研究会24回の資料の峯松先生の論文。「定理」として最初にあげられるのがバタチャリヤ距離、カルバックライブラー距離、の変換不変性と、 N個の点集合が作る形とNxNの距離行列の等価性。 参考:距離 - 朱鷺の杜Wiki注目している集合が閉じてい…

Failure Trends in a Large Disk Drive Population

hw

http://labs.google.com/papers/disk_failures.pdf The figure shows that failures do not increase when the average temperature increases. In fact, there is a clear trend showing that lower temperatures are associated with higher failure rates…

無限級数頻度素性をもちいたベクトル空間モデルによるNBテキスト分類

無限級数頻度による文脈拡張にもとづく言語モデル

鈴木潤さん@NLP2007 のネタから。N-gram言語モデルは長距離の依存関係を表現することができない。 文の識別モデルも、文をこえる依存関係の表現はできない。云々ある単語のベクトル表現を、 その前に出現する単語のベクトル表現*αの和とする。 和は種類では…

Gilad Mishne

http://staff.science.uva.nl/~gilad/ ブログ、Webマイニングの人。 International conference on weblogs and social media でチュートリアル

アンケート詳細:Googleの大規模日本語データ公開に関する特別セッション

http://d.hatena.ne.jp/uchiuchiyama/20070321/details_about_google_questionnaire 現在,提供データの候補として単語 n-gram および文節係り受けを考えています.ご自身の研究で利用してみたいデータは以下のいずれでしょうか?(ひとつ選択) 1. 単語 n-g…

Levenshtein Automata を用いた顔文字コピペの認識とクラスタリング

編集距離k以下マッチングにより微妙な差し替えに対応する

anond.hatelabo.jp をトポロジカルソート

Cygwin でソースから入れるときの依存確認

9. DLL を $CYGWIN/bin からコピー DLL コピー後の状態 $XYZZY/bin/w3m-0.5.1/ $XYZZY/bin/w3m-0.5.1/ ├ cygcrypto-0.9.8.dll ├ cygiconv-2.dll ├ cygintl-3.dll ├ cygssl-0.9.8.dll ├ cygwin1.dll ├ cygz.dll ├ inflate.exe ├ mktable.exe ├ w3m.exe ├ w3mb…

UIMA 101 -- 前編 - UIMAことはじめ

http://www-06.ibm.com/jp/developerworks/ysl/library/y-uima101a/index.shtml

X(7) manual page -- Display Names

http://www.xfree86.org/current/x.7.html#sect4 hostname:displaynumber.screennumber

Sparse Matrix

行列の和を計算するメソッドが for ( i: 1 .. M ) for ( j: 1 .. N ) c[i][j] = a[i][j] + b[i][j] なのは、まずい。 空間計算量はハッシュが均一と仮定するとO(非ゼロ要素数)だが、 時間計算量が O(次元数 ^ 2) になってしまい、 SparseMatrixにする意味が…

位置情報を数値1つで表す手法「Z-ordering」

http://toremoro.tea-nifty.com/tomos_hotline/2007/03/p2p1zordering_d8ba.html Z-orderingは文字の通り空間をZのように埋め尽くし、一次元の数値で表してしまう技法だ。 空間充填曲線で敷き詰めたとき始点からその点まであるいた距離を、 ある点の座標と…

大山崇のホームページ

http://www.nirarebakun.com/ 計算幾何系のアプレットがたくさん。 Javaソースも置かれている。

コミュニケーション能力を高めるために

http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html もっと良く話すための方法を多角的に論じている。 三森ゆりかの言語技術をベースにした、応用編という感じ。読んだけど後で読む。 ああ、意味が分からないですね。 流し読みしたけど、もう…

Prof. Mark Johnson の Dirichlet processes and unsupervised grammar learning

Bayesian な 単語分割、文字列レベルから区切り softwaresがすばらしい。 なにがすばらしいかというと、C++で書かれているのがすばらしい。統計処理言語 R ってなんですか?

MLS は Voronoi 図 に落とせるんじゃないの?

それとも additive weight Voronoi 図 か。 根拠はない。Spatial Query Processing Utilizing Voronoi Diagrams

私のブックマーク「Web内容マイニング」人工知能学会誌, vol.22, no.2 (2007)

http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/22-2.html クローラ HTMLパーサ 言語処理ツール のブックマーク perl -MEncode::Guess -e'$b = join q{}, <>; $e=guess_encoding($b, qw/euc-jp shiftjis 7bit-jis utf-8/); print $e->name, "\n"; prin…

プログラミングを独習するには10年かかる

http://www.yamdas.org/column/technique/21-daysj.html teach yourself * (days or weeks or months) いくつかのプロジェクトで、一番のプログラマーになるか、そうでなければしんがりのプログラマーになること。あなたが一番なら、プロジェクトを指揮し、…

浮動小数点演算を非lazyにする strictfp

class やメソッドの前に付ける修飾子のひとつで、 これによって修飾されたブロックでは、 すべての浮動小数点演算の途中結果の精度が、値の型に応じた精度に限定される。 ぎゃくにいうと、 非strictfpな式では、途中でオーバーフローするような計算でもただ…