markup

python + docutils で全角文字の幅計算が合わないらしい問題

ReStructuredText ではテーブルをアスキーアート的に揃えてやらないと文法エラーになるわけですが、 日本語などの文字は monospace 時に2文字分の場所をとることになっているので、 重み付きで文字数を数えないといけない。 古い python + docutils はそれを…

UIMA 101 -- 前編 - UIMAことはじめ

http://www-06.ibm.com/jp/developerworks/ysl/library/y-uima101a/index.shtml

XML and overlapping hierarchies

http://nl.ijs.si/et/talks/tsujiilab-crossing/crossing.pdf ...

2007 CSS Study Meeting

http://ja.reddit.com/goto?rss=true&id=yxja

Wiki to XML, through SGML

http://www.xml.com/pub/a/2004/03/03/sgmlwiki.html

XSLT

XSLT登竜門 : 目次 リンク集 - XSL Transformations(XSLT) - - Personnel 最速インターフェース研究会 :: XSLエディタを作ってみた

PDFBox - Java PDF Library

http://www.pdfbox.org/ PDF から中身抽出できるライブラリ。 java -cp lib//PDFBox-0.7.3.jar:../FontBox-0.1.0/lib/FontBox-0.1.0.jar:$CLASSPATH org.pdfbox.ExtractText xxx.pdf xxx.txt ギリシャ文字もunicode文字として出してくれたりする。

XHTML を XML に逆変換

#! /usr/bin/env perl use warnings; use strict; use WWW::Mechanize; use WWW::Mechanize::Link; use URI::URL; use URI::file; use URI::Escape; use Getopt::Long; use Pod::Usage; use XML::Simple; use Data::Dumper; use Encode; use encoding qw/utf…

Embedding metadata in XHTML and extracting them as RDF

http://www.kanzaki.com/docs/sw/xh2rdf.html XHTML で見た目情報と混在している論理情報を、 XSLT で抽出する。

RecipeML - Examples

http://www.formatdata.com/recipeml/examples.html 自然言語のレシピにアノテーションするアプローチ。 The Needless-Markman Hoax Chocolate-Chip Cookie 2cups butter 4cups flour Measure oatmeal and blend in a blender to a fine powder Cream the bu…

Higher-Order Functional Programming with XSLT 2.0 and FXSL

http://www.idealliance.org/papers/extreme/proceedings/html/2006/novatchev01/eml2006novatchev01.html XSLT は関数型プログラミングをサポートしたらしい。

ブロック要素をセンタリング

のような効果が欲しいとき使えるCSS。table タグは使いたくないけれど、table タグの効果が欲しい。 ということで、 水平方向のmargin:autoと、 display:table を組み合わせる。 <h1 style="border:1px black solid; display:table; margin: 0 auto;">test</h1>水平方向の margin:auto は、LaTeX の\hfill と同様に解釈される。 displa…

reStructuredText -> LaTeX

Wiki っぽい簡単なマークアップから、LaTeX ソース(など)への変換ができる。 この手のツールの中では、一番広く使われている感じ。とりあえず、docutils と、 rst-mode.el を入れて、 Meadow/Emacs memo -- ロードパス を参考にして、load-path が通ってる…

HTML Slidy

http://www.w3.org/talks/tools/slidy/ W3C による、CSS + XHTML + JavaScript のプレゼンテーションツール。ポジションとしては LaTeX + Beamer に近いが、 動的効果が得意で、数式が苦手。 フォントサイズを表示中に切替えられるのと、 エディタとブラウザ…

CSS Dencitie

http://www6.plala.or.jp/go_west/nextcss/ CSSの仕様、ブラウザの実装などを網羅的に解説。 中級者入門という、まとまった記事もある。