ホームに戻る

Kindleで使える英和辞典を英辞郎から作成してみる

Kindleには、もともと英英辞典が付属しています。
しかし、これらの辞書はネイティブ向けのため、私たち外国人にとっては、残念ながらあまり使い勝手が良い辞書とは言えません。
また、Kindleを英語の多読や学習に利用したいという人たちにとっても、英英辞典はハードルの高い存在です。
実際、英和辞典を利用できれば、もっと気楽にKindleで英語の本を読んでみようと思う人も出てくることでしょう。
 * Kindleが日本に上陸し,Kindle Paperwhite にはプログレッシブ英和辞典が搭載されるようになりました.
     しかし,収録語数が多く熟語を引くことができる英辞郎は,まだまだ便利で手放せない存在です.

今回の作業では、市販の 「英辞郎」 をもとにKindle用の英和辞典を作成します。
英辞郎は、大辞典を越える項目数を誇る、専門分野から俗語まで幅広くカバーしてくれる英和辞典です。
その一方で、項目数があまりに膨大な巨大辞書であるため、そのままKindle用の辞書を作成するにはいくつか問題があります。

そこで今回の方法では、英辞郎の辞書から不要と思われる項目をカットし、辞書を約1/4に縮小します。
カットする内容は、似たような単語の熟語、長い熟語や長い例文、地名・人名・作品名・組織名などです。
また、単語そのものはほとんどカットしていないため、単語の収録語数自体はほとんど減っていません。
見出しの項目数は約40万語あり、一般の中辞典(10~14万語)を超える項目数が確保されています。
そのため、調べても出てこない単語は少なく、使い勝手はそう悪くないだろうと思います。

英辞郎の項目をカットしたり、CSVファイルをHTMLファイルに変換する作業には、Perlのスクリプトを利用します。
といっても、すでに完成したスクリプトを利用するだけの作業なので、とくにPerlの知識は必要ありません。

一方、すこしPerlの知識があれば、スクリプトの内容を修正し、自分好みの辞書に編集・加工することも可能です。
実際、今回利用しているスクリプトも、別の方が作成したスクリプトを流用させてもらい、それを改造したしたものです。
そうしたスクリプトに関する説明は、別の項目を設け、あらためて触れる予定でいます。

英辞郎を購入しよう

この作業で利用できるのは、Unicodeに対応している第四版~第八版の英辞郎です。
とくにオススメしたいのは英辞郎 第五版。
現在、中古の値段が安くなっているうえ、こちらで使用している第五版と第四版には、すでに作業の実績があるためです。
在庫も豊富で入手しやすく、アマゾンあたりでも送料込500円~700円程度で購入できるでしょう。
    *中古品では、付属品のCD-ROMが欠品となったものもあるので注意!

第五版は問題ありませんが、第四版の場合、 Windows7 ではうまく動作しない可能性もあります。
そのさいはネット上からダウンロードした最新の PDIC/Unicode をインストールすれば、Windows7上でも正常に英辞郎を利用できるようになります。

ダウンロードした PDIC/Unicode のインストールは、英辞郎のインストールが済んでから行います。
英辞郎が古くてアプリが起動しない場合でも、新しい PDIC/Unicode をインストールすれば、勝手に英辞郎の辞書を検索できるよう設定してくれます。

ダウンロード版の英辞郎を利用する場合は、次の点に注意してください。
辞書データを PDIC/Unicode に登録するさい、品詞のラベルに使用する括弧 《 》 の設定画面が出ます。
品詞ラベルの括弧については、ネットやディスク版の英辞郎と同じ 【 】 を設定するようにしてください。
そうしないと、辞書加工用のスクリプトが正常に動作しなくなります。

それでは、さっそく作業手順の説明に入りましょう。

作業の流れ

作業の概要は次のとおりです。
初回では1時間くらいかかるかも知れませんが、手慣れると15分くらいで終了できる作業です。

  1.英辞郎の辞書をCSVファイルに変換する.

  2.英辞郎のCSVファイルから不要な項目を削除する.

  3.英辞郎のCSVファイルをHTMLファイルに変換する.

  4.英辞郎のHTMLファイルからKindle用辞書を作成する.

つまりは、次の順序でファイルを変換していくことになります。

  英辞郎 → CSVファイル → HTMLファイル → Kindle用辞書

一連の作業で利用するCSVやHTMLファイルは、エディタで中身を見られるテキストファイルです。
そのため、作業の途中でおかしな点があれば、ファイルの中身を直接確認してみることも可能です。

1.英辞郎の辞書をCSVファイルに変換する

PDIC/Unicode のソフトを起動し、次の作業を行います。
 * 説明中の *** は,使用する環境で文字や数字が異なる部分.

 1.ファイルメニューから 「辞書設定<詳細>」 を選択.

 2.辞書設定の画面右側にある辞書の一覧から Eijiro***.dic を選択し右クリック.
   ポップアップメニューの中から 「辞書の変換」 を選択.

 3.辞書変換の設定画面で 「変換先ファイル形式」 を 「CSV形式」 に設定.
   変換した辞書の保存先は,何もしなければライブラリの 「ドキュメント」 フォルダ内となる.
   OKボタンをクリックすると,変換結果のウインドウを表示し変換終了.

 4.「ドキュメント」 フォルダ内に eijiro_***.csv ファイルが保存されているのを確認して作業終了.

 * 説明の便宜上,ここで作成した英辞郎のCSVファイル名は eijiro_dic.csv としておきます.
   以下の説明では,すべて eijiro_dic.csv というファイル名で話をすすめます.

2.英辞郎のCSVファイルから不要な項目を削除する

ここからは、Perlを使った作業になります。
まずは、Perlが正常にインストールされているか、Perlのインストールを確認しておきましょう。

 1.作業フォルダを作り,そのフォルダ内に次の4つのファイルをコピーして入れておく.
   eijiro_dic.csv, cutdic.pl, Linked.pl, csv2html.pl

   * 説明画面では,D: ドライブに作成した Workフォルダを使用.
   * ファイル名が .pl となっているものは,Perlのプログラムを実行するスクリプト.
     これらスクリプトは 「辞書作成作業用スクリプト」 の EijiroTools.zip ファイルに入っています.

 2.コマンドプロンプトでその作業フォルダ(ディレクトリ)まで移動し,次のスクリプトを実行する.
   perl cutdic.pl eijiro_dic.csv >eijiro_s.csv

 3.処理中のカウンターが停止し作業が終了すると,eijiro_s.csv というファイルが完成.
   このときできた eijiro_s.csv が,縮小された英辞郎の辞書ファイル.

3.英辞郎のCSVファイルをHTMLファイルに変換する

縮小版英辞郎のCSVファイル eijiro_s.csv を、HTMLファイルに変換します。
おなじく作業はコマンドプロンプトの画面で、Perlのスクリプトを使います。

 1.eijiro_s.csv の中からリンク項目のリストを作成するため,次のスクリプトを実行する. 
   perl Linked.pl eijiro_s.csv >linked.txt

 2.eijiro_s.csv ファイルをHTMLファイルに変換するため,次のスクリプトを実行する.
   perl csv2html.pl eijiro_s.csv >eijiro_s.html

 3.カウンターが停止し処理が終わったことを確認し,コマンドプロンプトのウインドウを閉じる.
   linked.txteijiro_s.html というファイルができているので,
   その eijiro_s.html ファイルをもとに,つぎのKindle用辞書作成作業をおこなう.

4.英辞郎のHTMLファイルからKindle用辞書を作成する

ここからの作業は、Windowsの画面に戻って行います。
eijiro_s.html という英辞郎ファイルをもとに、Kindle用の電子書籍辞書(prcファイル)を作成します。
利用するアプリケーションは、Mobipocket Creator です。

 1.Mobipocket Creator を起動.
   左側 Create New Publication の項目から, Personal Dictionary/Glossary を選択.

 2.設定画面の Enter the Publication Name の項目に作業フォルダ名を入力.
   ここでは説明の便宜上 EIJIRO_S と入力しておきますが,名称は自由.

   下の項目の内容を確認し,Create ボタンをクリックする.
   Create in folder: ../Documents/My Publications
   Language: Japanese
   Encoding: International (UTF8)

 3.Publication Files の画面になるので,eijiro_s.html ファイルを画面右側にドラッグする.

 4.表紙のグラフィックが用意してあれば――
   左側 Cover Image の項目を選択し,辞書の表紙となるグラフィックを設定.
   Update ボタンをクリックする.
   * 表紙が必要なければ,この設定は行なわなくていい.

 5.画面左側 Book setings の項目を選択し,以下の内容を設定.
   Input language: English
   Output language: Japanese
   Dictionary very short name: EJR  ← 名前は自由でかまわない. ただし3文字まで.
   Update ボタンをクリックする.

 6.画面左側 Metadata の項目を選択し,以下の内容を設定.
   eBook Title: Eijiro for Kindle  ← 名称は自由. これが正式な辞書名となる.
   Language: Japanese
   Main subject: Dictionaries
   Publishing Date: 04/01/2012  ← 洋式で作業日の日付を入れる. (この例では 2012年4月1日)
   画面の一番下にあるUpdate ボタンをクリックする.

 7.画面右上の Build アイコンをクリックし,Build Publication の画面に切り換える.
   Compressin options: Standard Compressin を選択.
   Encryption options: No encryption を選択.
   Build ボタンをクリックする.

   * ファイルの圧縮には,高圧縮のHigh Compressionも指定することができますが,あまりオススメしません.
      というのも,圧縮作業に数時間かかるうえ,Kindleでの動作が多少重くなるという欠点があるためです.

 8.ビルドが終了し,Build finished の画面に切り変われば作業終了.
   OKボタンを押さず,そのまま Mobipocket Creator を終了してかまわない.

   * Warningが多数出ますが,これは辞書内でリンクが切れたもので,辞書の使用には差し支えないものです.

   また,
   Preview it with the Mobipocket Reader for PC を選択.
   OKボタンをクリックすると――
   Mobipocket Reader が起動し、辞書の仕上りを確認することができる.

 9.ライブラリのドキュメントフォルダ内に My Publications というフォルダ,その中に EIJIRO_S というフォルダができており,
   そのフォルダ内に作成されている EIJIRO_S.prc というファイルが,今回作成したKindle用の英辞郎となる.
   
 * prcファイルは mobiファイルと同じ形式のファイルです.
   そのためファイル名が .prc のままでも .mobi に変更しても,問題なく利用することができます.
   ただし,ここでは
.prc のままにしておきます.

5.作成した英辞郎をKindle本体にコピーする

PCとKindleをUSBケーブルでつなぎ、上の作業で作成したKindle用の英辞郎をKindle本体にコピーします。
 1.PCのフォルダに作成された EIJIRO_S.prc ファイルを,Kindleの documents フォルダ内にコピーする.
    EIJIRO_S.prc のファイルは, Kindleのメニュー画面では Eijiro for Kindle という書籍名で表示される.

 2.Kindle本体にコピーした英辞郎を,通常使用する英語辞書に設定する.
     KindleのSettingsDictionaries の画面で,
Eijiro for Kindle
を選択しOKボタンを押せば作業完了.
     Kindleで英辞郎を使用できるようになる.

6.辞書作成に関する情報

この作業で作成する辞書は、MOBIPOCKET社の仕様にもとづいて作成しています。
辞書の仕様を知る必要がある場合は、MOBIPOCKET社の辞書に関する情報を参照してください。


ホームに戻る