ブログコーパス
現代日本語の研究などに「Yahoo!ブログ」の記事を収集・提供へ (Internet Watch)
提供するブログデータは、インターネット全体に公開されているブログを対象に、4月25日以降に投稿された記事から最低500万語のサンプルを収集。季節ごとに数回サンプルを抽出する。
国立情報学研究所プレスリリース
(リンク先のプレスリリース資料はPDFファイル。閲覧注意)
取り組み自体は評価できるし、俺も利用したいが、プレスリリース資料に載っている上のコメントに少し引っかかった。今どき、「Web2.0」はないだろうw もはや死語だぞ。