私のブックマーク「Web内容マイニング」人工知能学会誌, vol.22, no.2 (2007)

http://www.ai-gakkai.or.jp/jsai/journal/mybookmark/22-2.html
クローラ
HTMLパーサ
言語処理ツール
のブックマーク

perl -MEncode::Guess -e'$b = join q{}, <>; $e=guess_encoding($b, qw/euc-jp shiftjis 7bit-jis utf-8/); print $e->name, "\n"; print $e->decode(substr $b,0,100), "\n"'