2005-07-18から1日間の記事一覧

クラスタリングとしての見方

区間集合のクラスタリング 区間(領域):全体文字列上の区間。接頭辞と接尾辞も含意。

やはり Perl はメモり喰いな言語。

http://www.drk7.jp/mt/archives/000803.html 「100MByte 程度のデータが Perl 内部では 1GByte 程度もメモリを喰う」

perlによる大規模データの取り扱い

http://www.lr.pi.titech.ac.jp/~abekawa/perl/perl_bigdata.html 大規模データのハッシュをファイル化するとか。 メモリに乗せきれない量のデータを扱う。