learning

CRFでない最大エントロピー法をgibbs sampling で解く

Finkel+2005, Incorporating non-local information into Information Extraction Systems by Gibbs sampling最大エントロピーモデル ・素性値の経験分布での期待値とモデルによる期待値が一致するという制約 ・制約から対数線形モデルを導出 ・尤度関数の線…

Kernel Averaged Perceptron の話

要約すると、 カーネルパーセプトロンを使うくらいならサポートベクターマシンを使ったほうがいい という話。 以下、パーセプトロンとかカーネルとか基本的なところばかり書きます。 <パーセプトロン> 正負ラベルを予測する二値分類を行うパーセプトロンの…

hcrf (HCRF13d) パッケージのためのlinuxパッチ

patch -p5 で適用 diff -u -r ./HCRF13d/makefile64 ./HCRF/makefile64 --- ./HCRF13d/makefile64 2007-10-18 17:20:46.000000000 +0900 +++ ./HCRF/makefile64 2008-07-08 17:31:08.000000000 +0900 @@ -1,10 +1,12 @@ -# +# -*- makefile -*- # Author: Mi…

LETOR -- Benchmark Dataset for Learning to Rank

http://research.microsoft.com/users/letor/ "learning to rank" タスクのデータセットが公開されている。

Jun Wu, Maximum Entropy Langauge Modeling with Non-Local Dependencies

http://www.cs.jhu.edu/~junwu/publications.html文脈中のhead word素性、近接Nグラム素性(通常のNグラムに相当)、単語のクラス素性、

Maximum Entropy Models with Inequality Constraints -- A Case Study on Text Categorization

http://www.springerlink.com/content/v6mn41027420jp56/

工藤 拓, 松本 裕治, 素性の組み合わせを実現する Power Set Kernel とその高速化

SVMでもちいられている多くのカーネルと、 MEなどでもちいられている組み合わせ素性を比較した場合、 カーネルは可読性が低い。 MEの組み合わせ素性は、それの重みをみることで簡単にどの組み合わせが有効かをみることができる。 一方、カーネル法の場合、カ…

系列ラベリング問題に関するメモ

http://cl.naist.jp/~masayu-a/article/2006-05-26.pdf

neural networks と bayesian networks

Feed Forward Neural Networks (Multi-layer Perceptron)と Baysian Networks (Belief Networks) は、DAG で表現された学習・推論のモデルであるという点で似ている。FFNNでは、1つのノードは入力の線形和に対する閾値関数として定義され、 線形和の重みと閾…

CRF tutorial

http://164.67.141.39:8080/ramgen/ipam/smil/7-28-05-pm-2.smil Lafferty先生によるCRFチュートリアルのビデオ

From HMMs to Segment Models -- A Unified View of Stochastic Modeling for Speech Recognition - Ostendorf, Digalakis, Kimball (ICASSP1996)

http://citeseer.ist.psu.edu/ostendorf95from.html HMMの拡張である Hidden semi-Markov Models または Segmental HMM。 遷移のときにシンボル列を出力する。

VideoLectures - exchange ideas & share knowledge

http://videolectures.net/ 講義動画を集めるサイト。 機械学習関係の講義がとても多い。

Graphical Models

http://www.cs.ubc.ca/~murphyk/bayes/bayes.html directed graphical model が中心だけど、 undirected model の文献紹介もある。graphical models な講義 10-708 Probabilistic Graphical Models, Fall 2006 EE512 Algorithms for Graphical Models (AGM)…

Chris Meek's Homepage

http://research.microsoft.com/~meek/Factorization of discrete probability distributions 対数線形モデルとマルコフ確率場の等価性をあたえた Hammersley-Clifford theorem の拡張 Collaborative filteringついでに。 Hammersley-Clifford theorem は原…

2D Conditional Randon Fields for Web Information Extraction

http://research.microsoft.com/users/znie/icml2005_2d-crf.pdf However, as the information on a Web page is two-dimensionally laid out, previous linear-chain CRFs have their limitations for Web information extraction.

無限級数頻度素性をもちいたベクトル空間モデルによるNBテキスト分類

Xiaojin Zhu (Jerry Zhu)

http://www.cs.wisc.edu/~jerryzhu/ Semi-supervised learning 専門家。 NLPよりでもある。

EDA(Estimation of Distribution Algorithm)

http://ibisforest.org/index.php?eda Genetic Algorithm revisited

CS645 -- Fundamentals of machine learning and statistical data analysis

http://www.cs.arizona.edu/classes/cs645/spring07/index.html PRML輪講

Kernel Based Algorithm for Mining Huge Data Sets

http://www.learning-from-data.com Yet another kernel book

おおかみ見つけちゃうぞ

http://shinh.skr.jp/expwolf/ Naive Bayes 分類器で、人狼か人間かを当てる。ソースはアップされてないから確証はないけど、 きっと各人の全発言を単語1-gramモデルで捉えて、 人狼分布と人間分布と、狼・人の事前分布を学習してやってるんだと思う。狼に関…

A Hybrid Generative/Discriminative Approach to Semi-supervised Classifier Design

http://www.kecl.ntt.co.jp/as/members/fujino/papers/aaai05-fujino.pdf Fujino, A., Ueda, N., and Saito, K., "A hybrid generative/discriminative approach to text classification with additional information," Information Processing & Management…

Bibliography on Automated Text Categorization

http://liinwww.ira.uka.de/bibliography/ai/automated.text.categorization.html

Machine Learning Advanced Tutorial Lecture Series

http://www.gatsby.ucl.ac.uk/~zoubin/tutorials06.html 近隣分野の研究者・博士向けチュートリアル講義。

Error-Correcting Output Coding for Text Classification - Berger (1999)

http://citeseer.ist.psu.edu/8956.html 2値分類器を合わせて多値分類。まず、ラベルにビット列を適当に(?)割り当てて、 ラベル集合を等長符号化する。 訓練サンプルについているラベルの符号の i ビット目を正解として、 第 i 番目の2値分類器を訓練する…

カーネル法の最前線 — SVM, 非線形データ解析, 構造化データ

http://www.ism.ac.jp/~fukumizu/ism_lecture_2006/ 福水先生による。

Bayesian Methods for NLP

http://www.isi.edu/~hdaume/bayes/

Nonparametric Bayesian Learning conference list

[[Workshop on Learning with Nonparametric Bayesian Methods June 29, 2006|http://www2.informatik.hu-berlin.de/~bickel/npb_workshop.html]] Nonparametric Bayes NIPS*05 Workshop — Nonparametric Bayesian Methods Bayesian Methods for Natural Lan…

JSAI SIG-DMSM

http://www.med.shimane-u.ac.jp/med_info/sig-dmsm/ 人工知能学会の「データマイニングと統計数理研究会」 第一回は7月11日統数研で。

The Elements of Statistical Learning, Hastie, Tibshirani and Friedman (2001)

http://www-stat-class.stanford.edu/~tibs/elemstatlearn/ 0387952845 Manning & Schultze よりも、Jurafsky & Martin + Hastie et alとの評を見て。例によって、経済学部図書館にある。