rwなloopbackファイルシステムの作り方

# ブロックサイズ 1Mbyte, ブロック数 500 で作成(500Mbyteのディスクになる) dd if=/dev/urandom of=/cygdrive/e/fonts.img bs=1M count=500

Java で文字の Unicode コードブロックを調べる

import java.io.*; public class A { public static void main(String[] args) throws IOException { BufferedReader reader = new BufferedReader(new InputStreamReader(System.in)); String line; while ( (line = reader.readLine()) != null ) { for ( …

hcrf (HCRF13d) パッケージのためのlinuxパッチ

patch -p5 で適用 diff -u -r ./HCRF13d/makefile64 ./HCRF/makefile64 --- ./HCRF13d/makefile64 2007-10-18 17:20:46.000000000 +0900 +++ ./HCRF/makefile64 2008-07-08 17:31:08.000000000 +0900 @@ -1,10 +1,12 @@ -# +# -*- makefile -*- # Author: Mi…

use したモジュールの位置を出力する

perlは一度読んだファイルをこの変数の中に押し込む。たとえばこんな感じ。 % perl -MEncode -le 'print "$_:$INC{$_}" for sort keys %INC' Encode.pm:/usr/local/lib/perl5/5.10.0/darwin-thread-multi-2level/Encode.pm Encode/Alias.pm:/usr/local/lib/p…

Programming Collective Intelligence

http://1a26.com/pdf/programming/programming%20collective%20intelligence.pdf

large set of target labeling

lm

ラベルの汎化(クラスタリング)が必要伝統的な class-based model による

matplotlib をインストール

matlab 風のDSLでグラフを描けるようにするライブラリ。 http://www.scipy.org/Installing_SciPy/Linux 上記を参考に、ATLAS, numpy, matplotlib をインストールした。 ATLASはインタラクティブな設定に加えて、Makefileの一部に -fPICを追加。 (そもそも、…

git から svn を透過的に使う

Tracking and contributing to the trunk of a Subversion-managed project: # Clone a repo (like git clone): git-svn clone http://svn.foo.org/project/trunk # Enter the newly cloned directory: cd trunk # You should be on master branch, double-c…

「Ruby 1.9 を語る」 by まつもとゆきひろ

http://mono.kmc.gr.jp/~yhara/d/?date=20071215#p03 String * String#eachが廃止された。つまり、String自身はもうEnumerableではない。 * なぜか? o String#eachは、何について繰り返すべきか自明でない(行?文字?バイト?) o 1.9では、明示的にいずれか…

Ubuntu でパッケージを手動インストール

1. packages.ubuntu.com で検索し、XXX.deb ファイルを入手 2. sudo dpkg -i XXX..deb

"HTML-Element" sucks

Perl はオブジェクトのメモリ管理に参照カウント方式をとっている。 つまり、オブジェクトが参照されている数、が0になったらオブジェクトを解放する。 この方式には、循環参照があるオブジェクト集合を解放できないという問題がある。 循環参照のあるオブジ…

語彙系コミュニティ

nlp

Multiword Expressions: Multiword Expressions http://multiword.sourceforge.net/ACL SIGLEX http://www.clres.com/siglex.html

STRAIGHT trial page

http://www.wakayama-u.ac.jp/~kawahara/straighttrial/ STRAIGHT は音声分析・合成ツール。 人間の音声を可読性の高い成分に分解し、再構成することができる。STRAIGHT linksにあるように、ここ数年国内外の多くの音声研究者が利用している。

「物理モデルによる音声合成」と比べてみた言語のモデルの現状

「音声にはモデルがあるけれど言語にはない」 という言葉がずっと気になっていた。 最近になって、少し意味が分かってきたような気がする。ここで音声にあるモデルというのは、 基本的に「発声に関わる神経と筋肉のモデル」である。 もちろん発声という行動…

Pattern Matching Pointers (maintained by Stefano Lonardi)

http://www.cs.ucr.edu/~stelo/pattern.html#resources 文字列アルゴリズム、情報検索周辺の学会、本、ソフトウェア

crontab(5) -- tables for driving cron - Linux man page

http://linux.die.net/man/5/crontab all data after the first % will be sent to the command as standard input. % を含むコマンドは crontab に書けない。 \% でエスケープする必要がある。

LETOR -- Benchmark Dataset for Learning to Rank

http://research.microsoft.com/users/letor/ "learning to rank" タスクのデータセットが公開されている。

Jun Wu, Maximum Entropy Langauge Modeling with Non-Local Dependencies

http://www.cs.jhu.edu/~junwu/publications.html文脈中のhead word素性、近接Nグラム素性(通常のNグラムに相当)、単語のクラス素性、

Maximum Entropy Models with Inequality Constraints -- A Case Study on Text Categorization

http://www.springerlink.com/content/v6mn41027420jp56/

工藤 拓, 松本 裕治, 素性の組み合わせを実現する Power Set Kernel とその高速化

SVMでもちいられている多くのカーネルと、 MEなどでもちいられている組み合わせ素性を比較した場合、 カーネルは可読性が低い。 MEの組み合わせ素性は、それの重みをみることで簡単にどの組み合わせが有効かをみることができる。 一方、カーネル法の場合、カ…

Concrete Abstraction

http://jaortega.wordpress.com/2007/01/31/a-scheme-bookshelf/ yet another introduction to (functional) programming

アルゴリズムとデータ構造演習

http://hagi.is.s.u-tokyo.ac.jp/ade/pre/1.html 課題1-A: シェルを実装せよ。 課題2-A: データを圧縮・解凍するプログラムを実装せよ。 課題3-A: スパムフィルタを実装せよ。 この課題が授業の目標:伝えられた仕様を大体何でも実装できるようになるこ …

Valgrind -- Tool Suite

http://valgrind.org/info/tools.html Official Home Page for valgrind, a suite of tools for debugging and profiling. Automatically detect memory management and threading bugs, and perform detailed profiling. The current stable version is val…

Pastry -- A substrate for peer-to-peer applications

http://freepastry.org/ Pastry - A scalable, decentralized, self-organizing and fault-tolerant substrate for peer-to-peer applications

That or Which

http://www.chass.utoronto.ca/~cpercy/courses/6362-lee.htm ・prescriptive には、that は限定用法のみ、which は非限定用法のみ。 ・現在の日常の用法では、カンマやポーズがあれば非限定、prescriptive の傾向も残る (3) I want her to give me back the…

へんな立体—脳が鍛えられる「立体だまし絵」づくり

http://www.amazon.co.jp/dp/441680752x 書店で見かけた面白いパズル(?)の本。 杉原厚吉氏の『へんな立体—脳が鍛えられる「立体だまし絵」づくり』という本です。 この本には、一見絵にしか描けないようにみえるけど、実は作れる、という立体がたくさん載…

ruby-1.8 では同名でスコープの違うローカル変数を作れない

http://www.ruby-lang.org/ja/man/?cmd=view;name=%ca%d1%bf%f4%a4%c8%c4%ea%bf%f4#a.a5.ed.a1.bc.a5.ab.a5.eb.ca.d1.bf.f4 ローカル変数スコープ(クラス、モジュー ル、メソッド定義の本体)における小文字で始まる識別子への最初 の代入はそのスコープに属…

Text algorithms by M. Crochemore and W. Rytter

http://web.njit.edu/~rytter/teaching/texts/book.html 少し古い(1994)文字列アルゴリズムの本。

boost

regex [cxx][programming] boost::regex は Perl みたいな感じで正規表現を使わせてくれるライブラリ。 #include <iostream> #include <boost/regex.hpp> int main() { using namespace std; using boost::regex; using boost::sregex_token_iterator; string s("a/b c/d e/f"); sregex_</boost/regex.hpp></iostream>…

アナグラム

意外な単語がアナグラムだったりします。 thread HATRED reproduce PROCEDURE thousand HANDOUTS generate TEENAGER process CORPSES PROCESS ruby -e'class String; def sort(); self.split(//).sort.join;end;end; dic={}; ARGV.each{|f| File.open(f).eac…