neta

TSPとしてのいろは歌(文字の都市)

文字2-gram確率の最大化だけを目的としたいろは歌生成は、 文字=都市の巡回セールスマン問題インスタンスに相当する。日本語の音韻的制約(iaはあるけどiuはないとか)を反映した程度の ゆるい文法性しか付与できないと思われる。文字N-gram化することも可…

無限級数頻度素性をもちいたベクトル空間モデルによるNBテキスト分類

無限級数頻度による文脈拡張にもとづく言語モデル

鈴木潤さん@NLP2007 のネタから。N-gram言語モデルは長距離の依存関係を表現することができない。 文の識別モデルも、文をこえる依存関係の表現はできない。云々ある単語のベクトル表現を、 その前に出現する単語のベクトル表現*αの和とする。 和は種類では…

Levenshtein Automata を用いた顔文字コピペの認識とクラスタリング

編集距離k以下マッチングにより微妙な差し替えに対応する

anond.hatelabo.jp をトポロジカルソート

MLS は Voronoi 図 に落とせるんじゃないの?

それとも additive weight Voronoi 図 か。 根拠はない。Spatial Query Processing Utilizing Voronoi Diagrams

音素交代アナグラム

kotoba october hatena hetana

人狼BBS成分解析

発言を全部見て、多クラス分類する。本気で成分(生成モデルのパラメータ)解析。

"Name that picture"

"Name That Song!": A Probabilistic Approach to Querying on Music and Text (2003)をいんすぱいやして。

nandemo rss clone

なんでもRSSが対応できないのは、 日付が振られていない文章である。baseline (original nandemo rss 予想) HTMLの木を作る このとき、xxxyyyzzz は xxxyyyzzz にする 日付を特定する 全部のエレメントに日付を含むかどうかを振る 打ち切りレベルを上から下…

whoiswerewolf

[2006-12-16-1]のつづき。ネット上の人狼サービスを調べた。 “汝ハ人狼ナリヤ?”−−−「汝は人狼なりや?」情報まとめサイトに多くのサービスの情報が集積されている。 人狼BBS まとめサイト - FrontPage ninjinさんのサービスならここ。人狼の悪夢村の数は8…

おおかみ見つけちゃうぞ

http://shinh.skr.jp/expwolf/ Naive Bayes 分類器で、人狼か人間かを当てる。ソースはアップされてないから確証はないけど、 きっと各人の全発言を単語1-gramモデルで捉えて、 人狼分布と人間分布と、狼・人の事前分布を学習してやってるんだと思う。狼に関…

p2p * sns

吉本晴洋, 繁富利恵, 副田俊介, 金子知適, 田浦健次朗, ``P2P人狼BBS, '' The 11th Game Programming Workshop, 2006 で 孤島から瓶を流す会 を実現したら、面白いことになるかも。ランダムに誰かにコネクションをはる、 はられたコネクションは、どちらかが…

Technological singularity - Wikipedia, the free encyclopedia

http://en.wikipedia.org/wiki/technological_singularity コンピュータの進化が加速度的に続いている → 人間の知性を越える臨界点が存在 → 人間を越える知性は、さらに優れた知性を設計するGood-Turing 法の Good も1965年に同じようなことをいっていたとか…