nlp

Document Space

http://www.ipam.ucla.edu/schedule.aspx?pc=ds2006 テキストモデリング関係の理論のワークショップ。 MP3の録音とか公開されてる。

Bayesian Methods for NLP

http://www.isi.edu/~hdaume/bayes/

Link of NLP/CL Reading List, Cources and Survey Papers

http://www.jaist.ac.jp/~n-yoshi/research/reading.html

オモロ検索エンジン SAGOOL サグール

http://sagool.jp/ 印象評価済みのデータの検索? ページ遷移なしで読み進められるUIが面白い。

conference ranking - Google Search

http://www.google.com/search?hl=en&q=conference+ranking&btng=search 計算機科学関係の学会ランキング。

Science and Engineering quotes

nlp

There is the value of the worldview created by science... The world looks so different after learning science. (Feynman) The world does look different after Engineering because you have changed the world. (?)via nlp blog: NLP is an Enginee…

Syntactic Theory -- instructors manual for the second edition

http://hpsg.stanford.edu/book/slides/index.html Syntactic Theory: a formal introduction, Second Edition Instructor's Manual Emily M. Bender, Ivan A. Sag, Thomas Wasow スライドが置いてある。

格フレーム検索@京大黒橋研

http://reed.kuee.kyoto-u.ac.jp/cf-search/ Web から抽出された格フレーム辞書の検索。 用例へのリンクつき。複合辞 として使われる用言を調べると面白い。 複合辞は意味が非構成的になる複合用言のことで、 たとえば「〜にとって」とか。「ある」「いる」…

SVDPACK

http://www.netlib.org/svdpack/ 潜在意味解析 Latent Semantic Analysis に使う 特異値分解 Singular Value Decomposition のパッケージ。 論文相当の User's guide 付き。特異値は非正方行列に対して定義される固有値のようなもので、 A trans(A)の固有値…

Ruby/CHISE

http://eto.com/2003/ruby/index.html.ja Unicode Ideographs の字形分解、字形合成のインターフェース。 "森".decompose_all とかできるらしい。

Spectral Based Information Retrieval

http://www.ee.unimelb.edu.au/multimedia/research/cubin_laurence_park_spectralphd.pdf DCT x IR基本に使う情報が、単語の頻度ではなく空間周波数。 どっちも Frequency なのはご愛嬌。slides質問単語と文書の類似度を、 その単語のその文書における空間…

Data Clustering -- A Review - Jain, Murty, Flynn (1999)

http://citeseer.ist.psu.edu/jain99data.html Clustering のサーベイ。

CS 224N / Ling 280 — Natural Language Processing

http://www.stanford.edu/class/cs224n/syllabus.html FSNLP の Manning 先生の授業。 資料が多く公開されている。 今年も開講中。

Linguistics Meta-Index

http://www-nlp.stanford.edu/links/linguistics.html (計算|)言語学のサイトのリスト。 Manning 先生による。

Bayesian Methods for Natural Language Processing / NIPS 2005

http://www.isi.edu/~hdaume/bayesnlp/ Bayesesian NLP の(現在のところ)の総本山? Resourcesと、 Participants から辿れる論文はReading List。 熟読すべし。

Gad M. Landau

http://cs.haifa.ac.il/~landau/ Construction of Aho Corasick Automaton in Linear Time for Integer Alphabets など。

Syllabus (11-761 Spring 2006 Course Syllabus)

http://www.cs.cmu.edu/~roni/11761-s06/syllabus.htm サイコロ本の講義。

The Personal Page of Gonzalo Navarro

http://www.dcc.uchile.cl/~gnavarro/eindex.html 自然言語の全文字列索引付けとか、 あいまい検索とか。

Christopher D. Manning, Hinrich Schuetze, Foundations of Statistical Natural Language Processing

http://nlp.stanford.edu/fsnlp/ 2006年辻井研M1輪講で読む本のひとつ。 表紙はサイコロ。 Foundations of Statistical Natural Language Processing: Errata

NAACL ARCHIVES

http://www.cs.cornell.edu/home/llee/naacl/archives/ Conference とか Workshop の重要な講演、 チュートリアルくらいは調べよう、 ということで、North American chapter of the Assoc. for Computational Linguistics のアーカイブ。

B. Jedynak and S. Khudanpur, "Maximum Likelihood Set for Estimating a Probabilty Mass Function," 2005.

http://www.clsp.jhu.edu/~sanjeev/pubs/nc2005.pdf Good-Turing のスムージング法、Bayesian な確率推定に代わる方法。 難しそう。

Latent Dirichlet Allocation

http://citeseer.ist.psu.edu/blei03latent.html ベイズ推定によるテキストモデル(長距離言語モデル)

Hal Daum'e III - about me

http://www.isi.edu/~hdaume/ Yet Another Haskell Tutorial Why Not C? Support Vector Machines for NLPBayes for NLPのチュートリアル、 テキストも作成中とか。

On the Estimation of 'Small' Probabilities by Leaving-One-Out

http://doi.ieeecomputersociety.org/10.1109/34.476512 [2006-01-24]の論文。前半は、一般性の高い確率論で、事象の出現数同値類と Leaving-one-out による確率平滑化について。 後半は、言語モデリングにおけるCount equivalence class 出現数同値類 「頻…

Class-Based n-gram Models of Natural Language (1992)

http://citeseer.ist.psu.edu/577345.html n-gram の n を大きくしたとき、データ量もそれに応じて増やさない場合、精度向上につながらないことがある、 と明言している。

NLPs on the net

http://www.google.com/search?q=nlp&hl=ja&lr=&start=0&sa=n 最大勢力:Neuro-Linguistic Programming ex. NLPインスティテュート あとは色々 NLP Non Linear Programming The Assoc. for Natural Language Processing Home Page Natural Language Processi…

Harmonic Modeling for Polyphonic Music Retrieval (2004)

http://citeseer.ist.psu.edu/pickens04harmonic.html コンテンツベースの音楽検索についての博士論文。 多声のパッセージを検索質問とし、曲を検索結果とする。

Model-based Feedback in the Language Modeling Approach to Information Retrieval (2001)

http://citeseer.ist.psu.edu/zhai01modelbased.html 言語モデル的アプローチによる情報検索に、ユーザーからのフィードバックを上手く組み込む方法。

Hermann Ney, Member, Ute Essen, Reinhard Kneser, On the Estimation of 'Small' Probabilities by Leaving-One-Out(1995)

http://csdl.computer.org/dl/trans/tp/1995/12/i1202.htm Leaving-one-out というバックオフ手法について。

茶筌と kakasi の読み付与

> chasen 今日 キョウ 今日 名詞-副詞可能 の ノ の 助詞-連体化 輪講 リンコウ 輪講 名詞-サ変接続 の ノ の 助詞-連体化 際 サイ 際 名詞-非自立-副詞可能 、 、 、 記号-読点 御 ゴ 御 接頭詞-名詞接続 紹介 ショウカイ 紹介 名詞-サ変接続 し シ する 動…