2007-02-14から1日間の記事一覧

thread2dat.pl

perl -pe' s{^(http://.*?)/.*/(.*?)/(\d{10}).*$}{$1/$2/$3.dat\n}'

「知っていない」問題を状態化否定で解く

lx

状態化してから否定 押す→押している→押していない 知る 知っている 知っていない動作動詞 _!~_ _~!~_ ___!___変化動詞 _!~ _|~!~|_ ~|_!_|~押す→押さない→押さないでいる 知る 知らない 知らないでいる

音素交代アナグラム

kotoba october hatena hetana

2ch板の全レスダウンロード

perl -Mstrict -MWWW::2ch -e'my $bbs=WWW::2ch->new(url => $ARGV[0], cache=>q{/tmp/www2ch-cache}); $bbs->load_setting; $bbs->load_subject; print map $_->url."\n", $bbs->subject->threads' http://academy5.2ch.net/gengo/ | xargs wget -w 1 -m

EM segmentation

関係ない話から。 segmentation といいつつ、文字や文よりも統計処理に向いている単位を探すというのがタスク。 たぶん segmentation / 分割 / 区切り という用語はふさわしくないけれど、 惰性で使っている。 過去の人が使っているから…確率分割済みコーパ…

Gnuplot の plot コマンドの引数のファイルにはシェルコマンドがかける

gnuplot> plot "perl -e'print map { $_=$_%2; qq{$_\n} } (0..10)')" w l