GSK2007-C Web日本語Nグラム第1版
Description: | Nグラムは一般に公開されている日本語のWebページでGoogleがクロールしたものから抽出されている。ただし、閲覧に特別な認証が必要なページや、metaタグにnoarchive,noindex 等が指定されているページは対象に入っていない。抽出対象となった文数は約200億文で、出現頻度20回以上の1~7グラムを収録している。 データの詳細については付属のREADMEも参照のこと。 |
---|---|
Creator: | グーグル株式会社 |
Price: |
教育・研究目的使用限定。営利目的利用不可。 個人・会員22,000円、個人・非会員44,000円、団体・会員44,000円、団体・非会員88,000円。別途、送料3,300円。 |
Date: | 2007.7 |
Format: | 6 DVD-R (26GB gzipで圧縮済み) |
Format.encoding: | UTF8 |
Language: | Japanese |
利用事例: | 言語情報処理ポータルのページに移動します |
上記言語資源の入手にあたっては、利用申請書兼誓約書(Web日本語Nグラム第1版) に必要事項をご記入いただき、メール、FAX、郵便等にて、事務局までお送り下さい。 折り返し、ご請求書をお送りしますので、宛名等ご指定のある場合は申請時にお知らせください。なお、利用申請書兼誓約書には必ず署名・捺印をお願いいたします。メールでの申込受付は署名・捺印された文書をスキャンしたPDFファイルに限らせていただきます。それ以外はFAXまたは郵便にてご送付下さい。 また、利用申請書兼誓約書の記入にあたっては「会員種別と利用種別の個人・団体について」をご確認下さい。