nlp
http://www.ipam.ucla.edu/schedule.aspx?pc=ds2006 テキストモデリング関係の理論のワークショップ。 MP3の録音とか公開されてる。
http://www.isi.edu/~hdaume/bayes/
http://www.jaist.ac.jp/~n-yoshi/research/reading.html
http://sagool.jp/ 印象評価済みのデータの検索? ページ遷移なしで読み進められるUIが面白い。
http://www.google.com/search?hl=en&q=conference+ranking&btng=search 計算機科学関係の学会ランキング。
There is the value of the worldview created by science... The world looks so different after learning science. (Feynman) The world does look different after Engineering because you have changed the world. (?)via nlp blog: NLP is an Enginee…
http://hpsg.stanford.edu/book/slides/index.html Syntactic Theory: a formal introduction, Second Edition Instructor's Manual Emily M. Bender, Ivan A. Sag, Thomas Wasow スライドが置いてある。
http://reed.kuee.kyoto-u.ac.jp/cf-search/ Web から抽出された格フレーム辞書の検索。 用例へのリンクつき。複合辞 として使われる用言を調べると面白い。 複合辞は意味が非構成的になる複合用言のことで、 たとえば「〜にとって」とか。「ある」「いる」…
http://www.netlib.org/svdpack/ 潜在意味解析 Latent Semantic Analysis に使う 特異値分解 Singular Value Decomposition のパッケージ。 論文相当の User's guide 付き。特異値は非正方行列に対して定義される固有値のようなもので、 A trans(A)の固有値…
http://eto.com/2003/ruby/index.html.ja Unicode Ideographs の字形分解、字形合成のインターフェース。 "森".decompose_all とかできるらしい。
http://www.ee.unimelb.edu.au/multimedia/research/cubin_laurence_park_spectralphd.pdf DCT x IR基本に使う情報が、単語の頻度ではなく空間周波数。 どっちも Frequency なのはご愛嬌。slides質問単語と文書の類似度を、 その単語のその文書における空間…
http://citeseer.ist.psu.edu/jain99data.html Clustering のサーベイ。
http://www.stanford.edu/class/cs224n/syllabus.html FSNLP の Manning 先生の授業。 資料が多く公開されている。 今年も開講中。
http://www-nlp.stanford.edu/links/linguistics.html (計算|)言語学のサイトのリスト。 Manning 先生による。
http://www.isi.edu/~hdaume/bayesnlp/ Bayesesian NLP の(現在のところ)の総本山? Resourcesと、 Participants から辿れる論文はReading List。 熟読すべし。
http://cs.haifa.ac.il/~landau/ Construction of Aho Corasick Automaton in Linear Time for Integer Alphabets など。
http://www.cs.cmu.edu/~roni/11761-s06/syllabus.htm サイコロ本の講義。
http://www.dcc.uchile.cl/~gnavarro/eindex.html 自然言語の全文字列索引付けとか、 あいまい検索とか。
http://nlp.stanford.edu/fsnlp/ 2006年辻井研M1輪講で読む本のひとつ。 表紙はサイコロ。 Foundations of Statistical Natural Language Processing: Errata
http://www.cs.cornell.edu/home/llee/naacl/archives/ Conference とか Workshop の重要な講演、 チュートリアルくらいは調べよう、 ということで、North American chapter of the Assoc. for Computational Linguistics のアーカイブ。
http://www.clsp.jhu.edu/~sanjeev/pubs/nc2005.pdf Good-Turing のスムージング法、Bayesian な確率推定に代わる方法。 難しそう。
http://citeseer.ist.psu.edu/blei03latent.html ベイズ推定によるテキストモデル(長距離言語モデル)
http://www.isi.edu/~hdaume/ Yet Another Haskell Tutorial Why Not C? Support Vector Machines for NLPBayes for NLPのチュートリアル、 テキストも作成中とか。
http://doi.ieeecomputersociety.org/10.1109/34.476512 [2006-01-24]の論文。前半は、一般性の高い確率論で、事象の出現数同値類と Leaving-one-out による確率平滑化について。 後半は、言語モデリングにおけるCount equivalence class 出現数同値類 「頻…
http://citeseer.ist.psu.edu/577345.html n-gram の n を大きくしたとき、データ量もそれに応じて増やさない場合、精度向上につながらないことがある、 と明言している。
http://www.google.com/search?q=nlp&hl=ja&lr=&start=0&sa=n 最大勢力:Neuro-Linguistic Programming ex. NLPインスティテュート あとは色々 NLP Non Linear Programming The Assoc. for Natural Language Processing Home Page Natural Language Processi…
http://citeseer.ist.psu.edu/pickens04harmonic.html コンテンツベースの音楽検索についての博士論文。 多声のパッセージを検索質問とし、曲を検索結果とする。
http://citeseer.ist.psu.edu/zhai01modelbased.html 言語モデル的アプローチによる情報検索に、ユーザーからのフィードバックを上手く組み込む方法。
http://csdl.computer.org/dl/trans/tp/1995/12/i1202.htm Leaving-one-out というバックオフ手法について。
> chasen 今日 キョウ 今日 名詞-副詞可能 の ノ の 助詞-連体化 輪講 リンコウ 輪講 名詞-サ変接続 の ノ の 助詞-連体化 際 サイ 際 名詞-非自立-副詞可能 、 、 、 記号-読点 御 ゴ 御 接頭詞-名詞接続 紹介 ショウカイ 紹介 名詞-サ変接続 し シ する 動…