lx
http://www.chass.utoronto.ca/~cpercy/courses/6362-lee.htm ・prescriptive には、that は限定用法のみ、which は非限定用法のみ。 ・現在の日常の用法では、カンマやポーズがあれば非限定、prescriptive の傾向も残る (3) I want her to give me back the…
「知ってる?」 に対するもっとも適切な応答が 「知ってる」 もしくは 「知らない」 という非対称なペアであること、あるいはもっと端的には、 「知っていない」という表現がほとんど非文法的であることが近年問題になっているわけですが、 簡単に内省による…
http://en.wiktionary.org/wiki/category:russian_language 語学(と研究?)用に、発音記号付きの、機械可読の、 オープンな、ロシア語(さらに、できれば多言語)の電子辞書リソースを探していたのですが、 思いがけず Wiktionary が使えそうなレベルに達…
あるいは「可みたい」と「噛みたい」 この種類の対立は、トピックモデルで解消すべきことのような気がする。 この種の同音異義表現は、仮名漢字変換において盲点になっているのでは、と思った。人間にとって同音異義語であることが意識されやすい同音異義語…
http://nlp.iit.tsukuba.ac.jp/must/ Matsuyoshi-Utsuro-Satoh-TsuchiyaでMUST複合辞の表層表現のリストと、 その正例・負例へのポインタ(毎日新聞記事)リストとして提供されている。 ...
http://www.aozora.gr.jp/cards/000061/files/377_2754.html イ(甲)、イ(乙)の原典。むかしの日本語には母音が七つあったという話。
青年文法学派(Junggrammatiker)の歴史言語学 〜プラーグ学派の音韻論 〜構造主義言語学の未知言語記述 〜生成文法の統語論 の流れを教えてもらった。互いに交換可能である部分列を同じクラスに属するものとみなす。 同時に、その部分列をひとつのまとまりと…
http://wordie.org/ Like Flickr, but without the photos. ソーシャル辞書というか、単語リストの collabolative filteringというか。好きな単語を投稿していき、コメントを付けていく。(Thu May 3 17:32:43 2007) http://labs.cybozu.co.jp/blog/akky/arch…
コンパクトな日本語文法の本。 学校文法から現在の文法研究に何歩か踏み出したところ というはしがきの言葉のとおり、学校文法が扱わない細かい現象をそれなりに網羅している。 文例も豊富。 参考文献へのポインタがもう少し細かく用意されているとありがた…
http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html もっと良く話すための方法を多角的に論じている。 三森ゆりかの言語技術をベースにした、応用編という感じ。読んだけど後で読む。 ああ、意味が分からないですね。 流し読みしたけど、もう…
Interpretation(テクストの分析と解釈・批判)のすすめ。主語が推測可能なゼロ主語文をかけるようになるために、 主語を書いてから消す訓練。全体像から詳細へいく論理的説明文 結論をいってからそれを支える根拠を言う討論 ナンバリング:最初にアイテムの…
状態化してから否定 押す→押している→押していない 知る 知っている 知っていない動作動詞 _!~_ _~!~_ ___!___変化動詞 _!~ _|~!~|_ ~|_!_|~押す→押さない→押さないでいる 知る 知らない 知らないでいる
kotoba october hatena hetana
http://en.wikipedia.org/wiki/without_loss_of_generality a.k.a. WLOG
http://www.gutenberg.org/catalog/world/search Project Gutenberg が全文検索可能になっていた件について たとえば Chrismas carol のあのことばも一発でいつからあった?全部落とす方法
http://www.behindthename.com/links.php 「人名の語源」資料サイトの集積
http://www.geocities.jp/niwasaburoo/ 日本語教育のための現代日本語の文法 統語論的な日本語文法からすると、 意味論が混ざりすぎているけれど、 いつ意味的情報が必要になるがよく分かる。
http://www.formatdata.com/recipeml/examples.html 自然言語のレシピにアノテーションするアプローチ。 The Needless-Markman Hoax Chocolate-Chip Cookie 2cups butter 4cups flour Measure oatmeal and blend in a blender to a fine powder Cream the bu…
The International Corpus of English Homepage 無料 メールを送ってパスワードをもらう UCL/CECL Centre for English Corpus Linguistics ICLE Corpus 学習者コーパス プロジェクトへの協力が必要 Learner Corpus Data 自由に使えるけど、量が少ない
http://www.linguistics.ucla.edu/faciliti/research/skim_diss.pdf
http://www.kilgarriff.co.uk/publications/2005-k-lineer.pdf 共起性判定に、ランダム出現の帰無仮説を使うことへの鋭い批判。 全ての言語現象(単語の出現というのも言語現象のひとつ)の間には、 相関がある。だから、データが無限にあれば、どんな単語同…
http://en.wikipedia.org/wiki/artifact って「人工物」ぢゃあないのですか。 # もちろん colorless permanent でもない自然科学では、 any perceived distortion or other data error caused by the instrument of observation 要するに「人災としての誤差…
http://listserv.linguistlist.org/cgi-bin/wa?a1=ind0608&l=corpora#6 「コロケーション自動抽出手法は何がいい?」 Corpora List より。
http://www.linguiste.org/phonetics/ipa/chart/ IPA の一覧と簡易入力。 適当な転写+選択式のインクリメンタル検索入力ができるといいんだけど。
http://gii2.nagaokaut.ac.jp/gii/blog/lopdiary.php?blogid=8 多言語データの基盤整備・分析を行う「言語天文台」プロジェクト。
http://orwell.ru/library/others/style/index.htm
http://archive.idrc.ca/books/edit/eindex.html#sguide The Chicago Manual of Style Indiana University Style Guide
http://openlab.jp/edict/letmesee/index.html.ja CGI動作の辞書ビューア。 データはFPWBOOKが使える。作業は以下のとおり。 プログラムのインストール /var/www/localhost/cgi-bin 以下に置く。 /etc/lighttpd/lighttpd.conf /etc/lighttpd/mod_cgi.conf で…
http://www.math.helsinki.fi/engl.html
http://www.bibiko.de/kanji/ grapheme-base の検索をサポートしている。