セットアップ
本ツールは Java Version 6 (ver.1.6) で実装されています。Java が動作する標準的な環境(Windows, Mac OS X, Linux)があれば本ツールを使用することができます。
Windows の場合、パッケージに Java Runtime Environment (JRE) が含まれていますので、そのまま使用することができます。Mac OS X や Linux の場合、お使いのPCに Java Version 6 (ver.1.6) がインストールされている必要があります。最新の Java のインストールについては以下のページを御覧下さい。
Javaホームページ
本ツールではテキストの表示ならびにヘルプの表示にウェブブラウザを使用します。Java Script、XSLTに対応しているウェブブラウザが必要です。以下のブラウザで動作確認をしています。
- Internet Explorer 8
- Firefox 3.6.12
- Safari 5.0.2
閲覧・検索対象のコーパスとして、『新聞記事GDAコーパス2004』『岩波国語辞典第五版タグ付きコーパス2004』のいずれか、もしくは両方が必要です。これらのコーパスの入手方法については以下のページを御覧下さい。
GSKホームページ
- GSKホームページから本ツール『GDAコーパスブラウザ』をダウンロードします。
- ダウンロードした GDA_Corpus_Browser_XXX.zip (XXX はバージョン番号)を展開し、PC上の任意の場所に置きます。
- 以上でセットアップは完了です。
ただし、展開されたファイルまたはフォルダはいずれも本ツールの実行に必要です。ファイル・フォルダを移動または消去したり、名前を変更しないようにして下さい。
- 以前のバージョンの設定を引き継ぐためには、設定ファイルをコピーします。具体的には、古いバージョンのフォルダにある config.txt を新しいツールのあるフォルダ(GDA_Corpus_Browser.jarがあるフォルダ)にコピーします。
ツールを最初に起動したとき、「設定ファイルの読み込みに失敗しました」というメッセージが表示されることがありますが、無視して下さい。このメッセージは2回目以降の起動では表示されません。
- 検索インデックスの作成はやり直す必要があります。新しいバージョンのツールを起動して、再度インデックスを作成して下さい。→検索インデックスの作成
- 本ツールをアンインストールするには、ツールのあるフォルダを削除して下さい。
本ツールは『新聞GDAコーパス』『岩波GDAコーパス』の両方を閲覧・検索の対象としています。基本的に両方のコーパスを持っている場合を想定して設計されていますが、どちらか一方のコーパスのみをお持ちの利用者も本ツールを使用することができます。起動方法によって以下の3つのモードの使い分けが可能です。
本ツールの起動方法は以下の通りです。
- Windows の場合
以下の exe ファイルをダブルクリックして下さい。Windows の設定によっては拡張子(.exe)が表示されない場合もあります。
- GDACB.exe
(標準モード)
- GDACB_news.exe
(新聞のみモード)
- GDACB_iwa.exe
(岩波のみモード)
- Mac OS X の場合
ターミナルを起動し、ツールを展開したディレクトリ(GDA_Corpus_Browser.jarというファイルがあるディレクトリ)に移動します。
cd (ツールを展開したディレクトリ)
その後、以下のコマンドを入力して下さい。
- java -jar GDA_Corpus_Browser.jar
(標準モード)
- java -jar GDA_Corpus_Browser.jar news
(新聞のみモード)
- java -jar GDA_Corpus_Browser.jar iwa
(岩波のみモード)
- Linuxの場合
ツールを展開したディレクトリ(GDA_Corpus_Browser.jarというファイルがあるディレクトリ)に移動します。
cd (ツールを展開したディレクトリ)
その後、以下のコマンドを入力して下さい。
- java -jar GDA_Corpus_Browser.jar
(標準モード)
- java -jar GDA_Corpus_Browser.jar news
(新聞のみモード)
- java -jar GDA_Corpus_Browser.jar iwa
(岩波のみモード)
Mac OS X または Linux をお使いの場合、以下のようなエラーメッセージが表示されてツールが起動できないときは、Java の Version が古いことが原因と考えられます。
Exception in thread "main" java.lang.UnsupportedClassVersionError: Bad version number in .class file
このときの対応策は以下の通りです。
- Mac OS X の場合の対応
まず「ソフトウェアアップデート」で最新のJavaがインストールされていることを確認して下さい。さらに、以下のいずれかの対処方法を試みて下さい。
- ターミナルから、GDA_Corpus_Browser.jarと同じディレクトリにあるrun_for_mac.shを以下のように起動させて下さい。(お使いの環境によっては動作しないこともあります)
- sh run_for_mac.sh
(標準モード)
- sh run_for_mac.sh news
(毎日のみモード)
- sh run_for_mac.sh iwa
(岩波のみモード)
- /Applications/Utilities/Java Preferences.appを起動し、「概要」タブの「Javaアプリケーション」の枠内で、`Java SE 6'をリストの先頭に移動させます(マウスのドラッグによる移動が可能です)。その後、上で説明したコマンドを入力して下さい。
この方法では、PC上でデフォルトで起動される Java のバージョンが 6 に設定されることに注意して下さい。
- Linux の場合の対応
Java Version 6 (1.6)をインストールして下さい。その後、上で説明したコマンドを入力して下さい。
- GDAコーパスのあるフォルダの設定
最初にツールを起動すると
GDAフォルダ(新聞)が指定されていません。
というメッセージが表示され、設定画面が表示されます。この中の「GDAフォルダ(新聞)」「GDAフォルダ(岩波)」の項目を以下のように設定して下さい。
- GDAフォルダ(新聞)
新聞GDAコーパスを含むフォルダを指定します。ここで指定するのは、『新聞記事GDAコーパス2004』と『毎日新聞94年CD-ROM』の2つのデータから復元されたコーパスを含むフォルダです。a01-1
から a20-2
までの40個のサブフォルダを含むフォルダを指定して下さい。なお、コーパスの復元方法につきましては、『新聞記事GDAコーパス2004』の配布CD-ROMに含まれるドキュメントをお読み下さい。
ツール内の「選択」ボタンを押すとファイルダイアログが表示されますので、新聞GDAコーパスを含むフォルダを選択して下さい。テキストフィールドにフォルダのパスを直接入力しても構いません。
- GDAフォルダ(岩波)
岩波GDAコーパスを含むフォルダを指定します。ここで指定するのは、GSKから配布された『岩波国語辞典第五版タグ付きコーパス2004』の中にあるcorpus
というフォルダです。dict01
から dict30
の30個のサブフォルダを含むフォルダを指定して下さい。
ツール内の「選択」ボタンを押すとファイルダイアログが表示されますので、岩波GDAコーパスを含むフォルダを選択して下さい。テキストフィールドにフォルダのパスを直接入力しても構いません。
設定画面はまだ閉じないで、続けて「ウェブブラウザ」の設定を行って下さい。
- ウェブブラウザ
本ツールでは、ファイル閲覧ビューからのファイルの表示、ヘルプの表示などでウェブブラウザを使用します。設定画面の中の「ウェブブラウザ」という項目で、使用するウェブブラウザを指定して下さい。
保存ボタンで設定を保存し、設定画面を閉じて下さい。
- 検索インデックスの作成
本ツールで検索を行うためには最初にインデックスを作成する必要があります。メニューバーの Option から インデックス作成 を選択して下さい。以下のようなウィンドウが表示されます。
「作成」ボタンを押すと、新聞GDAコーパスまたは岩波GDAコーパスのインデックスの作成を開始します。エラーメッセージが表示される場合は、上記の「GDAフォルダ(新聞)」もしくは「GDAフォルダ(岩波)」が正しく設定されていることを確認して下さい。作業の進捗状況はプログレスバーに表示されます。終了すると「インデックスファイルの作成が完了しました」というメッセージが表示されます。
このインデックスの作成が必要なのは1度だけです。インデックスはファイルに保存され、以後はツールを起動すればすぐに検索することができます。
[参考]
この作業で作成されるインデックスは以下のファイルに保存されます。
index/mainiti_sa.mer と index/mainiti_md.mer (新聞GDAコーパス)
index/iwanami_sa.mer と index/iwanami_md.mer (岩波GDAコーパス)