net

IPA の項目がすばらしく充実している件

http://en.wikipedia.org/wiki/international_phonetic_alphabet これだけで、音声学のよい復習になります。情報処理推進機構ではないのに注意。追記 音声学を勉強したような顔をしてますが、本を読んだだけです。 言語学の中で音声学だけはトレーニングを受…

MUST1 -- 日本語複合辞用例データベース v1.0

http://nlp.iit.tsukuba.ac.jp/must/ Matsuyoshi-Utsuro-Satoh-TsuchiyaでMUST複合辞の表層表現のリストと、 その正例・負例へのポインタ(毎日新聞記事)リストとして提供されている。 ...

Perl Critic

http://perlcritic.com/ Some Ways Are Better Than Others Perl のスタイルチェッカー

CRF tutorial

http://164.67.141.39:8080/ramgen/ipam/smil/7-28-05-pm-2.smil Lafferty先生によるCRFチュートリアルのビデオ

Graphical Models - Elsevier

http://www.elsevier.com/wps/find/journaldescription.cws_home/622839/description論文誌graphical modelsは、bayesianの言うgraphical modelsではなく 3d reconstructionの文脈でのそれ。

Roni Rosenfeld's Home Page

http://www.cs.cmu.edu/~roni/ Adaptive Statistical Language Modeling: A Maximum Entropy Approachの人。 Language and Statistics 2007他。

国語音韻の変遷

http://www.aozora.gr.jp/cards/000061/files/377_2754.html イ(甲)、イ(乙)の原典。むかしの日本語には母音が七つあったという話。

はじめて出会うコンピュータ科学

http://homepage.mac.com/tokuda.cs/iw/index.html コンピュータ科学の絵本

From HMMs to Segment Models -- A Unified View of Stochastic Modeling for Speech Recognition - Ostendorf, Digalakis, Kimball (ICASSP1996)

http://citeseer.ist.psu.edu/ostendorf95from.html HMMの拡張である Hidden semi-Markov Models または Segmental HMM。 遷移のときにシンボル列を出力する。

VideoLectures - exchange ideas & share knowledge

http://videolectures.net/ 講義動画を集めるサイト。 機械学習関係の講義がとても多い。

Graphical Models

http://www.cs.ubc.ca/~murphyk/bayes/bayes.html directed graphical model が中心だけど、 undirected model の文献紹介もある。graphical models な講義 10-708 Probabilistic Graphical Models, Fall 2006 EE512 Algorithms for Graphical Models (AGM)…

WHOLE-SENTENCE EXPONENTIAL LANGUAGE MODELS -- A VEHICLE FOR LINGUISTIC-STATISTICAL INTEGRATION

http://www.cs.wisc.edu/~jerryzhu/pub/wsme-csl-00.pdf 長距離言語モデルの代表選手の一つ。

Chris Meek's Homepage

http://research.microsoft.com/~meek/Factorization of discrete probability distributions 対数線形モデルとマルコフ確率場の等価性をあたえた Hammersley-Clifford theorem の拡張 Collaborative filteringついでに。 Hammersley-Clifford theorem は原…

Shaojun Wang

http://www.cs.wright.edu/~swang/ Latent Maximum Entropyの人であり、 長距離言語モデルの代表選手の一人。

日本語文字列コード問題まとめ

http://python.matrix.jp/tips/string/encoding.html

Wordie

http://wordie.org/ Like Flickr, but without the photos. ソーシャル辞書というか、単語リストの collabolative filteringというか。好きな単語を投稿していき、コメントを付けていく。(Thu May 3 17:32:43 2007) http://labs.cybozu.co.jp/blog/akky/arch…

LibraryThing | Catalog your books online

http://www.librarything.com/ 本のための collaborative filtering。 17万人のユーザーと14万件のレビューとそのタグ付けがある。日本語だと本棚.orgとかブクログとかがあるけど、 これだけ大規模でオープンになっているのは、他になさそう。量が多ければ多…

情報統計力学の深化と展開 チュートリアル

チュートリアルマニアなので。 樺島祥介 (東京工業大学大学院総合理工学研究科) “More is different”の話 Lecture Note: PDF 渡邊澄夫 (東京工業大学精密工学研究所) 物理学者でない人のための統計力学 lecture note もアップされてる。

Gilad Mishne

http://staff.science.uva.nl/~gilad/ ブログ、Webマイニングの人。 International conference on weblogs and social media でチュートリアル

アンケート詳細:Googleの大規模日本語データ公開に関する特別セッション

http://d.hatena.ne.jp/uchiuchiyama/20070321/details_about_google_questionnaire 現在,提供データの候補として単語 n-gram および文節係り受けを考えています.ご自身の研究で利用してみたいデータは以下のいずれでしょうか?(ひとつ選択) 1. 単語 n-g…

Cygwin でソースから入れるときの依存確認

9. DLL を $CYGWIN/bin からコピー DLL コピー後の状態 $XYZZY/bin/w3m-0.5.1/ $XYZZY/bin/w3m-0.5.1/ ├ cygcrypto-0.9.8.dll ├ cygiconv-2.dll ├ cygintl-3.dll ├ cygssl-0.9.8.dll ├ cygwin1.dll ├ cygz.dll ├ inflate.exe ├ mktable.exe ├ w3m.exe ├ w3mb…

UIMA 101 -- 前編 - UIMAことはじめ

http://www-06.ibm.com/jp/developerworks/ysl/library/y-uima101a/index.shtml

X(7) manual page -- Display Names

http://www.xfree86.org/current/x.7.html#sect4 hostname:displaynumber.screennumber

位置情報を数値1つで表す手法「Z-ordering」

http://toremoro.tea-nifty.com/tomos_hotline/2007/03/p2p1zordering_d8ba.html Z-orderingは文字の通り空間をZのように埋め尽くし、一次元の数値で表してしまう技法だ。 空間充填曲線で敷き詰めたとき始点からその点まであるいた距離を、 ある点の座標と…

大山崇のホームページ

http://www.nirarebakun.com/ 計算幾何系のアプレットがたくさん。 Javaソースも置かれている。

コミュニケーション能力を高めるために

http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html もっと良く話すための方法を多角的に論じている。 三森ゆりかの言語技術をベースにした、応用編という感じ。読んだけど後で読む。 ああ、意味が分からないですね。 流し読みしたけど、もう…

私のブックマーク「Web内容マイニング」人工知能学会誌, vol.22, no.2 (2007)

http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/22-2.html クローラ HTMLパーサ 言語処理ツール のブックマーク perl -MEncode::Guess -e'$b = join q{}, <>; $e=guess_encoding($b, qw/euc-jp shiftjis 7bit-jis utf-8/); print $e->name, "\n"; prin…

プログラミングを独習するには10年かかる

http://www.yamdas.org/column/technique/21-daysj.html teach yourself * (days or weeks or months) いくつかのプロジェクトで、一番のプログラマーになるか、そうでなければしんがりのプログラマーになること。あなたが一番なら、プロジェクトを指揮し、…

「DPマッチングで計算した結果を距離として用いる」という言い方について

http://d.hatena.ne.jp/okamoto7/20070219#p2 問題とそれを解くためのアルゴリズムが分離されていない。 あたかも「私はDPマッチングが何を計算するものか知らないが、便利そうなので使った」と主張してるようにしか思えない。 「○○を距離として定義し、それ…

比較関数

http://d.hatena.ne.jp/odz/20070212/1171345311 これに気づかないのはけっこう危険ですね。 int cmp(const int *a, const int *b) { return *a - *b; }たとえば INT_MIN - INT_MIN はオーバーフローにより 0 でない値をとる。 Nearly All Binary Searches a…