ライセンシング
1.言語資源の使われ方
新聞や雑誌の記事は、本来、記述内容を販売する目的で開発されています。これに対して近年、情報処理分野では、記事などを言葉の使われ方の実例集とみてそこから様々な言語的特徴を抽出する、言語資源としての利用法が重要視されています。記事などから抽出する言語的特徴としては、例えば、単語の出現頻度が挙げられます。このような特徴データは、情報検索や機械翻訳といった言語処理システムの精度を向上させるために用いられます。
辞書、辞典など言葉や物事を説明した文書も言語資源として有用です。辞書や辞典は、本来は人間が読むことを目的として開発されていますが、近年、計算機による言語処理用に利用する手法が重要視されています。例えば、辞書を分析することで単語の意味的な分類を半自動的に抽出し、言語処理システムに応用する技術が研究開発されています。
このように、新聞、雑誌、辞書といった言語資源は、本来の用途とは異なり、記述された言葉が分解されて利用されます。言葉の集まりの中から言語的特徴が抽出され、それが言語処理システムに応用されます。ただし、研究用途に限っては、記述された文章がそのまま出力される場合があります。例えば、情報検索の様々な手法を比較検討する場面では、検索対象の文章が検索の入力や結果としてそのまま表示される場合があります。
2.言語資源提供者のメリット
新聞社・出版社などが保有する新聞や雑誌の記事、あるいは、辞書会社などが保有する辞書や辞典などは、上述したように、言語処理研究に利用するという間接利用が重要視されてきています。GSKを仲介させることで、既存データを元々の目的とは異なる新たな利用領域に言語資源として提供でき、販売促進につながります。研究機関・研究者が保持している言語処理用データ等は、元々、計算機による言語処理用に開発されています。しかし、多くの場合、保有者自身でデータの流通を促進することは容易ではありません。GSKを仲介させることで、保有データを流通させやすくなり、有効利用が促進されます。
なお、研究目的で言語資源を利用した場合には、論文など成果報告に提供者名を記載し、言語研究という情報社会の基盤への言語提供者の貢献を明らかにすることをルールとします。
3.流通のしくみ
言語資源をご提供いただける皆様には、以下のようなモデルをお勧めしております。これらは基本的なモデルであって、多少の変更はご相談の上、対応させていただきます。
(1) 仲介業務モデル
契約業務も含め利用者からの購入希望の受付業務をGSKに委託するタイプです。GSKのホームページを介して幅広い言語処理関係の研究者への情報の通知などの営業業務も含め、データのご利用を検討していただいているお客様に対する販売業務を代行致します。また、GSKでは定型的な契約書を用意しており、ご提供者のお考えに沿った契約書の原案の提供などもお手伝いいたします。
なお、複数の組織によってまとめ上げられた物件に関しましては、GSKはそれぞれの提供者との間で販売業務委託を締結させていただき、ご利用いただくお客様へはそれぞれの契約手続き書類を同時に発送致します。
(2) 広告依頼モデル
データや商品の案内などを公開広告する営業業務をGSKに委託するタイプです。言語処理関係の研究者が頻繁に参照するGSKのサイトをご利用頂き、そこに言語資源の広告などの情報を公開することで、営業のお手伝いを致します。
(3) 言語資源無償提供モデル
言語に関わるシステム開発を行っている方に有効なデータを幅広く利用していただくため、GSKを介してライセンス上も問題のないデータやソフトウェアを提供するモデルです。販売されている言語資源の一部を無償公開する際にも、本モデルをご利用いただけます。GSKでは、提供していただくデータやソフトウェアの内容に応じて公開方法を検討致します。
4.GSKのポリシー
(1) 価格について
価格(前節の図における代金、広告料、実費)に関しましては、皆様とGSKの間で十分に協議した上で決定致します。
(2) 利用目的について
GSKでは、言語資源の研究目的の利用だけでなく、企業向けの商用利用についても積極的に進めていきます。GSKと皆様で商用利用の価格について十分協議し決定することで、これまで顕在化していなかった商用ニーズが発掘され、皆様にとって大きな利益になると考えております。また、この際のライセンス形態は、ご提供いただく言語資源を直接製品に組み込むわけではありませんので、売り切りの形にしたいと考えております。
(3) 契約について
皆様がお選びになるモデルに応じた契約書の雛形をご用意致しますので、それをベースに協議の上締結致します。言語資源の利用許諾契約に関しましても、雛形(サインレスの形態も含む)をご用意致しております。