GSK2009-B 新聞記事GDAコーパス2004

2021年3月31日をもって配布を終了いたしました。
Description: 本データは新聞記事テキスト(3,000記事、約37,000文、約910,000語)に対して形態素・統語構造・語義・照応と共参照の情報を付与したコーパスである。これらの付加情報は全て人手修正されている。また、コーパスの記述形式はGDA(Global Document Annotation)に準拠する。 本データは付加情報のみを提供し、テキスト自体は含まれていない。テキストを含む完全なコーパスを復元するには「CD-毎日新聞’94データ集」を別途購入する必要がある。 語義の情報として岩波国語辞典第五版における語義の識別番号が付与されている。識別番号に対応する語義の定義文を得るには「岩波国語辞典第五版タグ付きコーパス2004」を入手する必要がある。
なお、本データを閲覧・検索するためのGUIツール『GDAコーパスブラウザ』がGSKから無償配布されている。
Creator: 三菱電機株式会社
Price: 商用利用不可。教育・研究目的限定。
個人・会員22,000円、個人・非会員44,000円、団体・会員44,000円、団体・非会員88,000円。別途、送料3,300円。
Date:2012.2
Format:1 CD-ROM (60.7MB)
Format.encoding:Shift-JIS
Language:Japanese
利用事例:言語情報処理ポータルのページに移動します