2005-10-27から1日間の記事一覧

WebGraph

http://webgraph.dsi.unimi.it/ It provides simple ways to manage very large graphs, exploiting modern compression techniques. 巨大なグラフを保存・操作するための Java ライブラリ。

MG4J Managing Gigabytes for Java

http://mg4j.dsi.unimi.it/ MG4J (Managing Gigabytes for Java) is a free full-text indexing system for large document collections 巨大データに対する索引管理プログラム?

When Indexing Equals Compression -- Experiments with Compressing Suffix Arrays and Applications

http://www.cs.duke.edu/~jsv/papers/catalog/node89.html A fairly new article of yet another compression algorithm for suffix arrays.

Reconstructing a Suffix Array

http://www.cas.mcmaster.ca/~franek/proceedings/psc05.pdf アルファベットの順序を再定義したときの接尾辞配列の再構築。アルファベットを拡大したときの再構築手法が欲しい。

Computer room

http://www.isl.cs.gunma-u.ac.jp/~shingo/labo/index.html PPM の改良とか、接尾辞配列構築の2段階ソート法の発展形とか。

Perl で内部コードを UTF-8, 入出力を EUC-JP にする

use encoding 'euc-jp'; # 内部コードをUTFにし、ソースコードをeuc-jpとみなす use open ':encoding(euc-jp)'; # ファイル入出力にeuc-jpとutf-8のコード変換を掛ける use open ':std'; # 標準入出力も変換する入出力にファイルを使わない場合は、単に use …

wheel 以外にも su を許可する

/etc/pam.d/su の # auth required pam_wheel.so use_uid をコメントアウト。

dvips の日本語フォントを変える

dvips はデフォルトで東風フォントを使う。 東風フォントは大きくしたとき特にアンバランスさが気になる。 ということで、 Ghostscript 7.07 - TeX Wiki あたりを参考に、 GhostScript が使う仮想的なフォントである Ryumin-Light や GothicBBB-Medium など…