net
http://en.wikipedia.org/wiki/international_phonetic_alphabet これだけで、音声学のよい復習になります。情報処理推進機構ではないのに注意。追記 音声学を勉強したような顔をしてますが、本を読んだだけです。 言語学の中で音声学だけはトレーニングを受…
http://nlp.iit.tsukuba.ac.jp/must/ Matsuyoshi-Utsuro-Satoh-TsuchiyaでMUST複合辞の表層表現のリストと、 その正例・負例へのポインタ(毎日新聞記事)リストとして提供されている。 ...
http://perlcritic.com/ Some Ways Are Better Than Others Perl のスタイルチェッカー
http://164.67.141.39:8080/ramgen/ipam/smil/7-28-05-pm-2.smil Lafferty先生によるCRFチュートリアルのビデオ
http://www.elsevier.com/wps/find/journaldescription.cws_home/622839/description論文誌graphical modelsは、bayesianの言うgraphical modelsではなく 3d reconstructionの文脈でのそれ。
http://www.cs.cmu.edu/~roni/ Adaptive Statistical Language Modeling: A Maximum Entropy Approachの人。 Language and Statistics 2007他。
http://www.aozora.gr.jp/cards/000061/files/377_2754.html イ(甲)、イ(乙)の原典。むかしの日本語には母音が七つあったという話。
http://homepage.mac.com/tokuda.cs/iw/index.html コンピュータ科学の絵本
http://citeseer.ist.psu.edu/ostendorf95from.html HMMの拡張である Hidden semi-Markov Models または Segmental HMM。 遷移のときにシンボル列を出力する。
http://videolectures.net/ 講義動画を集めるサイト。 機械学習関係の講義がとても多い。
http://www.cs.ubc.ca/~murphyk/bayes/bayes.html directed graphical model が中心だけど、 undirected model の文献紹介もある。graphical models な講義 10-708 Probabilistic Graphical Models, Fall 2006 EE512 Algorithms for Graphical Models (AGM)…
http://www.cs.wisc.edu/~jerryzhu/pub/wsme-csl-00.pdf 長距離言語モデルの代表選手の一つ。
http://research.microsoft.com/~meek/Factorization of discrete probability distributions 対数線形モデルとマルコフ確率場の等価性をあたえた Hammersley-Clifford theorem の拡張 Collaborative filteringついでに。 Hammersley-Clifford theorem は原…
http://www.cs.wright.edu/~swang/ Latent Maximum Entropyの人であり、 長距離言語モデルの代表選手の一人。
http://python.matrix.jp/tips/string/encoding.html
http://wordie.org/ Like Flickr, but without the photos. ソーシャル辞書というか、単語リストの collabolative filteringというか。好きな単語を投稿していき、コメントを付けていく。(Thu May 3 17:32:43 2007) http://labs.cybozu.co.jp/blog/akky/arch…
http://www.librarything.com/ 本のための collaborative filtering。 17万人のユーザーと14万件のレビューとそのタグ付けがある。日本語だと本棚.orgとかブクログとかがあるけど、 これだけ大規模でオープンになっているのは、他になさそう。量が多ければ多…
チュートリアルマニアなので。 樺島祥介 (東京工業大学大学院総合理工学研究科) “More is different”の話 Lecture Note: PDF 渡邊澄夫 (東京工業大学精密工学研究所) 物理学者でない人のための統計力学 lecture note もアップされてる。
http://staff.science.uva.nl/~gilad/ ブログ、Webマイニングの人。 International conference on weblogs and social media でチュートリアル
http://d.hatena.ne.jp/uchiuchiyama/20070321/details_about_google_questionnaire 現在,提供データの候補として単語 n-gram および文節係り受けを考えています.ご自身の研究で利用してみたいデータは以下のいずれでしょうか?(ひとつ選択) 1. 単語 n-g…
9. DLL を $CYGWIN/bin からコピー DLL コピー後の状態 $XYZZY/bin/w3m-0.5.1/ $XYZZY/bin/w3m-0.5.1/ ├ cygcrypto-0.9.8.dll ├ cygiconv-2.dll ├ cygintl-3.dll ├ cygssl-0.9.8.dll ├ cygwin1.dll ├ cygz.dll ├ inflate.exe ├ mktable.exe ├ w3m.exe ├ w3mb…
http://www-06.ibm.com/jp/developerworks/ysl/library/y-uima101a/index.shtml
http://www.xfree86.org/current/x.7.html#sect4 hostname:displaynumber.screennumber
http://toremoro.tea-nifty.com/tomos_hotline/2007/03/p2p1zordering_d8ba.html Z-orderingは文字の通り空間をZのように埋め尽くし、一次元の数値で表してしまう技法だ。 空間充填曲線で敷き詰めたとき始点からその点まであるいた距離を、 ある点の座標と…
http://www.nirarebakun.com/ 計算幾何系のアプレットがたくさん。 Javaソースも置かれている。
http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html もっと良く話すための方法を多角的に論じている。 三森ゆりかの言語技術をベースにした、応用編という感じ。読んだけど後で読む。 ああ、意味が分からないですね。 流し読みしたけど、もう…
http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/22-2.html クローラ HTMLパーサ 言語処理ツール のブックマーク perl -MEncode::Guess -e'$b = join q{}, <>; $e=guess_encoding($b, qw/euc-jp shiftjis 7bit-jis utf-8/); print $e->name, "\n"; prin…
http://www.yamdas.org/column/technique/21-daysj.html teach yourself * (days or weeks or months) いくつかのプロジェクトで、一番のプログラマーになるか、そうでなければしんがりのプログラマーになること。あなたが一番なら、プロジェクトを指揮し、…
http://d.hatena.ne.jp/okamoto7/20070219#p2 問題とそれを解くためのアルゴリズムが分離されていない。 あたかも「私はDPマッチングが何を計算するものか知らないが、便利そうなので使った」と主張してるようにしか思えない。 「○○を距離として定義し、それ…
http://d.hatena.ne.jp/odz/20070212/1171345311 これに気づかないのはけっこう危険ですね。 int cmp(const int *a, const int *b) { return *a - *b; }たとえば INT_MIN - INT_MIN はオーバーフローにより 0 でない値をとる。 Nearly All Binary Searches a…