2005-07-12から1日間の記事一覧

fstabの設定 from Gentoo インストール記

http://bd.tank.jp/gentoo/install6.html {{google_search('xfs fsck 自動')}}で発見。 JFS は reiserfs と違って、起動時の fsck を自動的にやってくれないなあ… と思っていたら、違ったらしい。 fstab を適当に書いていたせい。 正しくは /dev/ROOT / xfs …

projects/segment/segnaive/Segment.java

Perlの配列は、連結リストとしても使える。 それは便利なんだけど。 ふと考えてみると、どちらも単位時間でできるとは思えない。 いままであまり考えていなかったが、「挿入・削除」「インデックスアクセス」のどちらが とっても遅いということがない以上、…

Segment.java のメモリ使用量

大きなデータを食わせたら、すぐにヒープが足りない、といわれる。SuffixArray の中で持つ「元の配列」に、連結の履歴を全て保った単語が書かれている。 同じ単語の情報は重複するので、辞書へのポインタにすべき。→ bigramに置き換えるときに、Bigram イン…

StringBuilder

http://java.sun.com/j2se/1.5.0/docs/api/java/lang/stringbuilder.html StringBuffer の代替。 1スレッドでしか使わない場合はこっちの方がいいらしい。

Javaプログラムのクラス別実行時間測定

http://www005.upp.so-net.ne.jp/khayashi/profiling.html プロファイラの呼び出しの仕方。 JDK1.2頃はこんな感じ。 $ java -Xrunhprof:cpu=times,heap=all,file=test.prof Segment いまはこう。 $ java -agentlib:hprof=cpu=times,heap=all,file=test.prof …

HPROF, A Heap/CPU Profiling Tool in J2SE 5.0

http://java.sun.com/developer/technicalarticles/programming/hprof.html Sun による、JDK付属プロファイラの説明。

バグ修正

同じ単語が連続する場合のカウントミス(オーバーラップしたものをカウントしてはいけない) 現在の実行速度: 300kB では3時間程度 600kB では8時間程度 メモリ使用量は、大体 10MB くらいに収まっている。