corpus

アンケート詳細:Googleの大規模日本語データ公開に関する特別セッション

http://d.hatena.ne.jp/uchiuchiyama/20070321/details_about_google_questionnaire 現在,提供データの候補として単語 n-gram および文節係り受けを考えています.ご自身の研究で利用してみたいデータは以下のいずれでしょうか?(ひとつ選択) 1. 単語 n-g…

USENET as a Text Corpus

http://www.cs.fit.edu/~mmahoney/dissertation/corpus.html