lx

That or Which

http://www.chass.utoronto.ca/~cpercy/courses/6362-lee.htm ・prescriptive には、that は限定用法のみ、which は非限定用法のみ。 ・現在の日常の用法では、カンマやポーズがあれば非限定、prescriptive の傾向も残る (3) I want her to give me back the…

なんどめかの「知っていない」

lx

「知ってる?」 に対するもっとも適切な応答が 「知ってる」 もしくは 「知らない」 という非対称なペアであること、あるいはもっと端的には、 「知っていない」という表現がほとんど非文法的であることが近年問題になっているわけですが、 簡単に内省による…

Category-Russian language - Wiktionary

http://en.wiktionary.org/wiki/category:russian_language 語学(と研究?)用に、発音記号付きの、機械可読の、 オープンな、ロシア語(さらに、できれば多言語)の電子辞書リソースを探していたのですが、 思いがけず Wiktionary が使えそうなレベルに達…

「虜みたい」と「取り込みたい」

lx

あるいは「可みたい」と「噛みたい」 この種類の対立は、トピックモデルで解消すべきことのような気がする。 この種の同音異義表現は、仮名漢字変換において盲点になっているのでは、と思った。人間にとって同音異義語であることが意識されやすい同音異義語…

MUST1 -- 日本語複合辞用例データベース v1.0

http://nlp.iit.tsukuba.ac.jp/must/ Matsuyoshi-Utsuro-Satoh-TsuchiyaでMUST複合辞の表層表現のリストと、 その正例・負例へのポインタ(毎日新聞記事)リストとして提供されている。 ...

国語音韻の変遷

http://www.aozora.gr.jp/cards/000061/files/377_2754.html イ(甲)、イ(乙)の原典。むかしの日本語には母音が七つあったという話。

構造主義言語学の音声-言語モデル

lx lm

青年文法学派(Junggrammatiker)の歴史言語学 〜プラーグ学派の音韻論 〜構造主義言語学の未知言語記述 〜生成文法の統語論 の流れを教えてもらった。互いに交換可能である部分列を同じクラスに属するものとみなす。 同時に、その部分列をひとつのまとまりと…

Wordie

http://wordie.org/ Like Flickr, but without the photos. ソーシャル辞書というか、単語リストの collabolative filteringというか。好きな単語を投稿していき、コメントを付けていく。(Thu May 3 17:32:43 2007) http://labs.cybozu.co.jp/blog/akky/arch…

加藤重広, 『日本語文法 入門ハンドブック』

コンパクトな日本語文法の本。 学校文法から現在の文法研究に何歩か踏み出したところ というはしがきの言葉のとおり、学校文法が扱わない細かい現象をそれなりに網羅している。 文例も豊富。 参考文献へのポインタがもう少し細かく用意されているとありがた…

コミュニケーション能力を高めるために

http://www.toyama-cmt.ac.jp/~kanagawa/language/communicate.html もっと良く話すための方法を多角的に論じている。 三森ゆりかの言語技術をベースにした、応用編という感じ。読んだけど後で読む。 ああ、意味が分からないですね。 流し読みしたけど、もう…

三森ゆりか, 外国語を身につけるための日本語レッスン

Interpretation(テクストの分析と解釈・批判)のすすめ。主語が推測可能なゼロ主語文をかけるようになるために、 主語を書いてから消す訓練。全体像から詳細へいく論理的説明文 結論をいってからそれを支える根拠を言う討論 ナンバリング:最初にアイテムの…

「知っていない」問題を状態化否定で解く

lx

状態化してから否定 押す→押している→押していない 知る 知っている 知っていない動作動詞 _!~_ _~!~_ ___!___変化動詞 _!~ _|~!~|_ ~|_!_|~押す→押さない→押さないでいる 知る 知らない 知らないでいる

音素交代アナグラム

kotoba october hatena hetana

Without loss of generality

http://en.wikipedia.org/wiki/without_loss_of_generality a.k.a. WLOG

Advanced Search - Project Gutenberg

http://www.gutenberg.org/catalog/world/search Project Gutenberg が全文検索可能になっていた件について たとえば Chrismas carol のあのことばも一発でいつからあった?全部落とす方法

Behind the Name -- links

http://www.behindthename.com/links.php 「人名の語源」資料サイトの集積

現代日本語文法概説

http://www.geocities.jp/niwasaburoo/ 日本語教育のための現代日本語の文法 統語論的な日本語文法からすると、 意味論が混ざりすぎているけれど、 いつ意味的情報が必要になるがよく分かる。

RecipeML - Examples

http://www.formatdata.com/recipeml/examples.html 自然言語のレシピにアノテーションするアプローチ。 The Needless-Markman Hoax Chocolate-Chip Cookie 2cups butter 4cups flour Measure oatmeal and blend in a blender to a fine powder Cream the bu…

non-native english written corpora list

The International Corpus of English Homepage 無料 メールを送ってパスワードをもらう UCL/CECL Centre for English Corpus Linguistics ICLE Corpus 学習者コーパス プロジェクトへの協力が必要 Learner Corpus Data 自由に使えるけど、量が少ない

The Role of Prosodic Phrasing in Korean Word Segmentation

http://www.linguistics.ucla.edu/faciliti/research/skim_diss.pdf

Language is never, ever, ever, random

http://www.kilgarriff.co.uk/publications/2005-k-lineer.pdf 共起性判定に、ランダム出現の帰無仮説を使うことへの鋭い批判。 全ての言語現象(単語の出現というのも言語現象のひとつ)の間には、 相関がある。だから、データが無限にあれば、どんな単語同…

Artifact

http://en.wikipedia.org/wiki/artifact って「人工物」ぢゃあないのですか。 # もちろん colorless permanent でもない自然科学では、 any perceived distortion or other data error caused by the instrument of observation 要するに「人災としての誤差…

Collocation extraction

http://listserv.linguistlist.org/cgi-bin/wa?a1=ind0608&l=corpora#6 「コロケーション自動抽出手法は何がいい?」 Corpora List より。

International Phonetic Alphabet (IPA) Chart in Unicode and XHTML/CSS

http://www.linguiste.org/phonetics/ipa/chart/ IPA の一覧と簡易入力。 適当な転写+選択式のインクリメンタル検索入力ができるといいんだけど。

Language Observatory

http://gii2.nagaokaut.ac.jp/gii/blog/lopdiary.php?blogid=8 多言語データの基盤整備・分析を行う「言語天文台」プロジェクト。

Oliver Strunk -- The Elements of Style - Index

http://orwell.ru/library/others/style/index.htm

IDRC Books -- Editorial Guidelines and Instructions

http://archive.idrc.ca/books/edit/eindex.html#sguide The Chicago Manual of Style Indiana University Style Guide

let me see...

http://openlab.jp/edict/letmesee/index.html.ja CGI動作の辞書ビューア。 データはFPWBOOKが使える。作業は以下のとおり。 プログラムのインストール /var/www/localhost/cgi-bin 以下に置く。 /etc/lighttpd/lighttpd.conf /etc/lighttpd/mod_cgi.conf で…

Pronunciation of mathematical expressions

http://www.math.helsinki.fi/engl.html

Japanisch-Deutsches Kanji-Lexikon - Hans-Jörg Bibiko 2006

http://www.bibiko.de/kanji/ grapheme-base の検索をサポートしている。