ネ言 negen

たいしたことは書きません

ブログコーパス

 現代日本語の研究などに「Yahoo!ブログ」の記事を収集・提供へ (Internet Watch)

 提供するブログデータは、インターネット全体に公開されているブログを対象に、4月25日以降に投稿された記事から最低500万語のサンプルを収集。季節ごとに数回サンプルを抽出する。


 国立情報学研究所プレスリリース
 (リンク先のプレスリリース資料はPDFファイル。閲覧注意)

Web2.0 の大きな特徴に「ユーザ参加型情報発信」あるいはCGM がありますが、ブログはその代表です。

取り組み自体は評価できるし、俺も利用したいが、プレスリリース資料に載っている上のコメントに少し引っかかった。今どき、「Web2.0」はないだろうw もはや死語だぞ。

さあて、さっそくYahoo!ブログにもネ言を作って、コーパスに協力するかねえw