ホームに戻る
Kindleで使える英和辞典を英辞郎から作成してみる
Kindleには、もともと英英辞典が付属しています。
しかし、これらの辞書はネイティブ向けのため、私たち外国人にとっては、残念ながらあまり使い勝手が良い辞書とは言えません。
また、Kindleを英語の多読や学習に利用したいという人たちにとっても、英英辞典はハードルの高い存在です。
実際、英和辞典を利用できれば、もっと気楽にKindleで英語の本を読んでみようと思う人も出てくることでしょう。
* Kindleが日本に上陸し,Kindle Paperwhite にはプログレッシブ英和辞典が搭載されるようになりました.
しかし,収録語数が多く熟語を引くことができる英辞郎は,まだまだ便利で手放せない存在です.
今回の作業では、市販の 「英辞郎」 をもとにKindle用の英和辞典を作成します。
英辞郎は、大辞典を越える項目数を誇る、専門分野から俗語まで幅広くカバーしてくれる英和辞典です。
その一方で、項目数があまりに膨大な巨大辞書であるため、そのままKindle用の辞書を作成するにはいくつか問題があります。
そこで今回の方法では、英辞郎の辞書から不要と思われる項目をカットし、辞書を約1/4に縮小します。
カットする内容は、似たような単語の熟語、長い熟語や長い例文、地名・人名・作品名・組織名などです。
また、単語そのものはほとんどカットしていないため、単語の収録語数自体はほとんど減っていません。
見出しの項目数は約40万語あり、一般の中辞典(10~14万語)を超える項目数が確保されています。
そのため、調べても出てこない単語は少なく、使い勝手はそう悪くないだろうと思います。
英辞郎の項目をカットしたり、CSVファイルをHTMLファイルに変換する作業には、Perlのスクリプトを利用します。
といっても、すでに完成したスクリプトを利用するだけの作業なので、とくにPerlの知識は必要ありません。
一方、すこしPerlの知識があれば、スクリプトの内容を修正し、自分好みの辞書に編集・加工することも可能です。
実際、今回利用しているスクリプトも、別の方が作成したスクリプトを流用させてもらい、それを改造したしたものです。
そうしたスクリプトに関する説明は、別の項目を設け、あらためて触れる予定でいます。
英辞郎を購入しよう
この作業で利用できるのは、Unicodeに対応している第四版~第八版の英辞郎です。
とくにオススメしたいのは英辞郎 第五版。
現在、中古の値段が安くなっているうえ、こちらで使用している第五版と第四版には、すでに作業の実績があるためです。
在庫も豊富で入手しやすく、アマゾンあたりでも送料込500円~700円程度で購入できるでしょう。
*中古品では、付属品のCD-ROMが欠品となったものもあるので注意!
第五版は問題ありませんが、第四版の場合、 Windows7 ではうまく動作しない可能性もあります。
そのさいはネット上からダウンロードした最新の PDIC/Unicode をインストールすれば、Windows7上でも正常に英辞郎を利用できるようになります。
ダウンロードした PDIC/Unicode のインストールは、英辞郎のインストールが済んでから行います。
英辞郎が古くてアプリが起動しない場合でも、新しい PDIC/Unicode をインストールすれば、勝手に英辞郎の辞書を検索できるよう設定してくれます。
ダウンロード版の英辞郎を利用する場合は、次の点に注意してください。
辞書データを PDIC/Unicode に登録するさい、品詞のラベルに使用する括弧 《 》 の設定画面が出ます。
品詞ラベルの括弧については、ネットやディスク版の英辞郎と同じ 【 】 を設定するようにしてください。
そうしないと、辞書加工用のスクリプトが正常に動作しなくなります。
それでは、さっそく作業手順の説明に入りましょう。
作業の流れ
作業の概要は次のとおりです。
初回では1時間くらいかかるかも知れませんが、手慣れると15分くらいで終了できる作業です。
1.英辞郎の辞書をCSVファイルに変換する.
2.英辞郎のCSVファイルから不要な項目を削除する.
3.英辞郎のCSVファイルをHTMLファイルに変換する.
4.英辞郎のHTMLファイルからKindle用辞書を作成する.
つまりは、次の順序でファイルを変換していくことになります。
英辞郎 → CSVファイル → HTMLファイル → Kindle用辞書
一連の作業で利用するCSVやHTMLファイルは、エディタで中身を見られるテキストファイルです。
そのため、作業の途中でおかしな点があれば、ファイルの中身を直接確認してみることも可能です。
1.英辞郎の辞書をCSVファイルに変換する
PDIC/Unicode のソフトを起動し、次の作業を行います。
* 説明中の *** は,使用する環境で文字や数字が異なる部分.
1.ファイルメニューから 「辞書設定<詳細>」 を選択.
2.辞書設定の画面右側にある辞書の一覧から Eijiro***.dic を選択し右クリック.
ポップアップメニューの中から 「辞書の変換」 を選択.
3.辞書変換の設定画面で 「変換先ファイル形式」 を 「CSV形式」 に設定.
変換した辞書の保存先は,何もしなければライブラリの 「ドキュメント」 フォルダ内となる.
OKボタンをクリックすると,変換結果のウインドウを表示し変換終了.
4.「ドキュメント」 フォルダ内に eijiro_***.csv ファイルが保存されているのを確認して作業終了.
* 説明の便宜上,ここで作成した英辞郎のCSVファイル名は eijiro_dic.csv としておきます.
以下の説明では,すべて eijiro_dic.csv というファイル名で話をすすめます.
2.英辞郎のCSVファイルから不要な項目を削除する
ここからは、Perlを使った作業になります。
まずは、Perlが正常にインストールされているか、Perlのインストールを確認しておきましょう。
1.作業フォルダを作り,そのフォルダ内に次の4つのファイルをコピーして入れておく.
eijiro_dic.csv, cutdic.pl, Linked.pl, csv2html.pl
* 説明画面では,D: ドライブに作成した Workフォルダを使用.
* ファイル名が .pl となっているものは,Perlのプログラムを実行するスクリプト.
これらスクリプトは 「辞書作成作業用スクリプト」 の EijiroTools.zip ファイルに入っています.
2.コマンドプロンプトでその作業フォルダ(ディレクトリ)まで移動し,次のスクリプトを実行する.
perl cutdic.pl eijiro_dic.csv >eijiro_s.csv
3.処理中のカウンターが停止し作業が終了すると,eijiro_s.csv というファイルが完成.
このときできた eijiro_s.csv が,縮小された英辞郎の辞書ファイル.
3.英辞郎のCSVファイルをHTMLファイルに変換する
縮小版英辞郎のCSVファイル eijiro_s.csv を、HTMLファイルに変換します。
おなじく作業はコマンドプロンプトの画面で、Perlのスクリプトを使います。
1.eijiro_s.csv の中からリンク項目のリストを作成するため,次のスクリプトを実行する.
perl Linked.pl eijiro_s.csv >linked.txt
2.eijiro_s.csv ファイルをHTMLファイルに変換するため,次のスクリプトを実行する.
perl csv2html.pl eijiro_s.csv >eijiro_s.html
3.カウンターが停止し処理が終わったことを確認し,コマンドプロンプトのウインドウを閉じる.
linked.txt と eijiro_s.html というファイルができているので,
その eijiro_s.html ファイルをもとに,つぎのKindle用辞書作成作業をおこなう.
4.英辞郎のHTMLファイルからKindle用辞書を作成する
ここからの作業は、Windowsの画面に戻って行います。
eijiro_s.html という英辞郎ファイルをもとに、Kindle用の電子書籍辞書(prcファイル)を作成します。
利用するアプリケーションは、Mobipocket Creator です。
1.Mobipocket Creator を起動.
左側 Create New Publication の項目から, Personal Dictionary/Glossary を選択.
2.設定画面の Enter the Publication Name の項目に作業フォルダ名を入力.
ここでは説明の便宜上 EIJIRO_S と入力しておきますが,名称は自由.
下の項目の内容を確認し,Create ボタンをクリックする.
Create in folder: ../Documents/My Publications
Language: Japanese
Encoding: International (UTF8)
3.Publication Files の画面になるので,eijiro_s.html ファイルを画面右側にドラッグする.
4.表紙のグラフィックが用意してあれば――
左側 Cover Image の項目を選択し,辞書の表紙となるグラフィックを設定.
Update ボタンをクリックする.
* 表紙が必要なければ,この設定は行なわなくていい.
5.画面左側 Book setings の項目を選択し,以下の内容を設定.
Input language: English
Output language: Japanese
Dictionary very short name: EJR ← 名前は自由でかまわない. ただし3文字まで.
Update ボタンをクリックする.
6.画面左側 Metadata の項目を選択し,以下の内容を設定.
eBook Title: Eijiro for Kindle ← 名称は自由. これが正式な辞書名となる.
Language: Japanese
Main subject: Dictionaries
Publishing Date: 04/01/2012 ← 洋式で作業日の日付を入れる. (この例では 2012年4月1日)
画面の一番下にあるUpdate ボタンをクリックする.
7.画面右上の Build アイコンをクリックし,Build Publication の画面に切り換える.
Compressin options: Standard Compressin を選択.
Encryption options: No encryption を選択.
Build ボタンをクリックする.
* ファイルの圧縮には,高圧縮のHigh Compressionも指定することができますが,あまりオススメしません.
というのも,圧縮作業に数時間かかるうえ,Kindleでの動作が多少重くなるという欠点があるためです.
8.ビルドが終了し,Build finished の画面に切り変われば作業終了.
OKボタンを押さず,そのまま Mobipocket Creator を終了してかまわない.
* Warningが多数出ますが,これは辞書内でリンクが切れたもので,辞書の使用には差し支えないものです.
また,
Preview it with the Mobipocket Reader for PC を選択.
OKボタンをクリックすると――
Mobipocket Reader が起動し、辞書の仕上りを確認することができる.
9.ライブラリのドキュメントフォルダ内に My Publications というフォルダ,その中に EIJIRO_S というフォルダができており,
そのフォルダ内に作成されている EIJIRO_S.prc というファイルが,今回作成したKindle用の英辞郎となる.
* prcファイルは mobiファイルと同じ形式のファイルです.
そのためファイル名が .prc のままでも .mobi に変更しても,問題なく利用することができます.
ただし,ここでは .prc のままにしておきます.
5.作成した英辞郎をKindle本体にコピーする
PCとKindleをUSBケーブルでつなぎ、上の作業で作成したKindle用の英辞郎をKindle本体にコピーします。
1.PCのフォルダに作成された EIJIRO_S.prc ファイルを,Kindleの documents フォルダ内にコピーする.
EIJIRO_S.prc のファイルは, Kindleのメニュー画面では Eijiro for Kindle という書籍名で表示される.
2.Kindle本体にコピーした英辞郎を,通常使用する英語辞書に設定する.
KindleのSettings → Dictionaries の画面で, Eijiro for Kindle を選択しOKボタンを押せば作業完了.
Kindleで英辞郎を使用できるようになる.
6.辞書作成に関する情報
この作業で作成する辞書は、MOBIPOCKET社の仕様にもとづいて作成しています。
辞書の仕様を知る必要がある場合は、MOBIPOCKET社の辞書に関する情報を参照してください。
ホームに戻る