DiDi Dictionary Viewer に「英辞郎まとめて変換」機能

こういうのを必要としている方々にはここで書いたほうが届きやすそうなのでお知らせ:

PDICCocoa で引ける DiDi Dictionary Viewer*1 に、PDIC形式の辞書を英辞郎ビューアで引ける形に一括変換する「英辞郎まとめて変換」機能が付きました。Perlでやるより高速(当社比で3〜4倍)かつTerminalも不要なので、英辞郎ビューアLOVEの方にもオススメです。

MouseoverDictionary での利用に便利なPDIC一行テキストへの変換も可能です。
DiDi Dictionary Viewer自体でもそこそこ快適に*2辞書検索ができます。(PDIC形式の辞書なら英辞郎以外でも検索できます)
詳しくは DiDi配布サイト にて。

*1:Mac OS X 10.4.xのみで動作。10.3.9より前の環境への対応予定はありません。

*2:英辞郎ビューアに乗り換える必要がなくなるかは分かりませんが。英辞郎はお好きな検索ソフトでどうぞ。

DiDi Dictionary Viewer (Universal Binary)

OS X 10.4.x 限定ですが・・・

GWにこんなのを試作しましたので、宜しければお試しください。(フリーです)

http://didi.ntzone.info/

Universal Binaryです。
いまのところPDIC形式(Unicode辞書を含む)に対応しているのみです。

なお、これはPDIC Viewerのバージョンアップではありません。(機能的に重複する部分がありますが)

「英辞郎 第三版」のデータをPDIC1行テキスト形式に変換するためのPerlスクリプト

【お知らせ】PDICCocoa で引ける DiDi Dictionary Viewer に、PDIC形式の辞書を各種テキスト形式に変換する機能が追加されました。今のところ(「英辞郎まとめて変換」以外は)UTF-8での出力ですが、宜しかったらご利用ください。フリーウェアです。 (2007/5/25)

(この記事の背景はこちらの■追記■を参照)

英辞郎 第三版」(アルク刊)同梱の辞書データをPDICバイナリ形式からPDIC1行テキスト形式に変換するスクリプト*1を用意しました。パスをMac OS X用に書いていますが適宜書き換えれば*2他のOSでも行けると思います。

英辞郎ビューアで使いたい場合は、さらにもうちょい変換が必要です →「英辞郎 第三版」を英辞郎ビューアで引く


英辞郎 第三版」(アルク刊)の辞書データが必要です。
英辞郎のテキストデータが欲しいだけならEDPで最新データをTEXT形式で売ってます*3のでそちらもご検討ください。
http://www.eijiro.jp/
その場合このツールは(たぶん)不要です。

CPANに載せるつもりで*4作りかけたライブラリを同梱しています*5。ライブラリ自体は検索にも軽く対応しかかっています。ライセンスはPerlライセンスにするつもりですが、とりあえず二次配布は控えていただけると有難いです。

フリーウェアです。無保証です。

http://pdicviewer.naochan.com/pdic-conv-0.1.tar.gz からダウンロードして下さい。

■使い方
(1)「英辞郎 第三版」のインストーラ英辞郎データをインストール。 → デスクトップに PDICViewer1024EE というフォルダができます。
(2)このツールをどこか(ホームディレクトリ推奨)に展開し、convert-all.sh を走らせる。

% cd ~
% tar ztf pdic-conv-0.01.tar.gz
% cd pdic-conv
% ./convert-all.sh
[eijiro98]
[reiji98]
[ryaku98]
[waeiji98]
%

(3)ちょっと時間がかかる*6ので休憩。コーヒーをキーボードにこぼさないように。
(4)~/pdic-conv/ に
    eijiro98.txt, reiji98.txt, ryaku98.txt, waeiji98.txt
   というファイルができるので、後は煮るなり焼くなり・・・お好きなように*7

*1:拙作 PDIC Viewer にも同等の機能はついていますが

*2:Windows その他の OS で使う場合は、convert-all.sh の DICT_DIR を適宜書き換えて下さい。たぶん動きます。

*3:¥1,980

*4:できればPlaggerプラグインとかも作るつもりで

*5:Encode::BOCU-1 というライブラリ(拙作)と合わせて使えば Unicode (BOCU-1) なPDIC辞書も読めるはずですが

*6:うちのMacBook Proだと7〜8分

*7:当然のことですが、このツールを利用して変換して得られたPDIC1行テキスト形式の辞書データの使用は個人的な範囲にとどめて下さい。

MouseoverDictionary

Mouseover Dictionary - 英辞郎のデータに対応したFirefox用のマウスオーバー英和辞書extension (by maru様)

下の記事のスクリプトで作った eijiro98.txt*1 で試してみました。

すごい。便利。英辞郎ユーザなら是非お試しを!

*1:1637000個のデータ

「英辞郎 第三版」を英辞郎ビューアで引く

【お知らせ】
PDICCocoa で引ける DiDi Dictionary Viewer に、PDIC形式の辞書を英辞郎ビューアで引ける形に一括変換する「英辞郎まとめて変換」機能が付きました。Perlでやるより高速(当社比で3〜4倍)かつTerminalも不要なので、英辞郎ビューアLOVEの方にもオススメです。

MouseoverDictionary での利用に便利なPDIC一行テキストへの変換も可能です。
DiDi Dictionary Viewer自体でもそこそこ快適に辞書検索ができます。(PDIC形式の辞書なら英辞郎以外でも検索できます)
(2007/5/25)

(この記事の背景はこちらの■追記■を参照)

MouseoverDictionary に対応したついでに。

Macユーザには附属のPDICよりも沼田くんの英辞郎ビューアシリーズの方がオススメである。この中では私はminiが好き。第3版ですんなり使えるかあとで試す。

(ogijunの)あとで書く日記

すんなりは無理です荻野さん:

まずは下の拙記事を参考にPDICバイナリ形式からPDIC1行テキスト形式に変換します。英辞郎ビューアは「PDIC1行テキスト形式」には対応していないようなので、さらに

s|^|■|g
s| /// | : |g
s| \\ | / |g

のような変換(ここsedスクリプトを置いておきました。SJISです)をかます必要があります。

convert-all.sh の

  perl ./pdic-dump.pl $f > $name.txt

のところを

  perl ./pdic-dump.pl $f | sed -f eview.sed > $name.txt

みたいにすればスムーズです。

■追記 (2007/2/24)
このままだと

ただこちらの方法では大文字から始まる単語(「America」など)が引けなくなりますので、私の方でもコンバータを作成中です。来月中には出来上がると思いますので、よろしくお願いいたします。

和英辞郎ソータと書籍版「英辞郎」第3版(英辞郎ビューア作者・沼田さんのサイトより)

大文字で始まる単語が検索結果に出てこないようなので、sort -f もついでにかまして・・・とかする必要があります。

面倒くさいので別パッケージにまとめました:
http://pdicviewer.naochan.com/pdic-conv-0.1e.tar.gz

Terminal使わせて申し訳ないのですが

% curl -O http://pdicviewer.naochan.com/pdic-conv-0.1e.tar.gz

% tar zxf pdic-conv-0.1e.tar.gz
pdic-conv/
pdic-conv/convert-all.sh
pdic-conv/eview.sed
pdic-conv/lib/
pdic-conv/lib/Dictionary/
pdic-conv/lib/Dictionary/PDIC/
pdic-conv/lib/Dictionary/PDIC/Dump.pm
pdic-conv/lib/Dictionary/PDIC/Record.pm
pdic-conv/lib/Dictionary/PDIC/Version.pm
pdic-conv/lib/Dictionary/PDIC.pm
pdic-conv/lib/Dictionary/PDICText.pm
pdic-conv/lib/Dictionary/Util/
pdic-conv/lib/Dictionary/Util/Binary.pm
pdic-conv/lib/Dictionary/Util/LittleEndian.pm
pdic-conv/pdic-dump.pl
pdic-conv/README.TXT

% cd pdic-conv

% ./convert-all.sh
[eijiro98]
[reiji98]
[ryaku98]
[waeiji98]

%

Perlで書いたのでちょっと時間かかります。(10分ぐらいは待って下さい)

~/pdic-conv/ に eijiro98.txt, reiji98.txt, ryaku98.txt, waeiji98.txt というファイルが出来るので、英辞郎ビューアの環境設定でこれらのファイルを指定してください。

あと沼田プロダクツはいつもUIも設計も考え抜かれているので、おそらくTerminalが怖くて触れないようなタイプのMacユーザでも安心して使うことができるものを作ってくれると思います。期待して待ちましょう。

(英辞郎ビューア作者の)沼田くんによる第三版対応表明 - (ogijunの)あとで書く日記

英辞郎ビューア作者の沼田さんが近日中にちゃんとした(おそらく高速な)コンバータを作ってくださるそうですので、それまでの繋ぎ程度にお役に立てればと思います。

■追々記 (2007/4/02)
英辞郎 第三版」第2刷以降のCD-ROMには上記の拙作コンバータが同梱されます。

PDIC Viewerをインストールするとデスクトップに PDICViewer1024EE というフォルダが出来ますが、その中にconverterフォルダが新設されました。(converterフォルダが無ければ第1刷です。上記の記事に従って下さい)
converterフォルダ内の README.TXT に変換のしかたの説明がありますのでそれに従ってください。

■追々記 (2007/5/16) [NEW]
Cocoa版のPDIC検索ソフトを試作しました。よろしかったらどうぞ。
http://ntzone.info/

英辞郎 第三版(アルク)

出てます。

英辞郎第三版 (<CDーROM>(HY版))

英辞郎第三版 ((HY版))

データの賞味期限切れ(?)に伴うとみられる「第二版 改訂版」的なリリース。
第二版のデータを最新のものに差し替えて、あと検索ソフト(Mac用には拙作「PDIC Viewer」が同梱)がマイナーバージョンアップ、という程度。企画自体はほぼ第二版のままっぽい。

1人の語学オタク(かつソフト作者)としては PDIC Viewer もなかなか便利なソフト*1だと思うのですが、1人の英辞郎ユーザとしての立場から言うと、

よりも

をお勧めします。英辞郎しか検索しない(辞書フォーマットがPDIC*3である必然性のない)方は、EDPから最新データ(¥1,980)を買う*4ことを選択肢に入れたほうがいいです。

英辞郎」書籍版の良いところは、

  • 大抵どこの本屋でもすぐに手に入る
  • データもソフトもとりあえず揃っているので(DLの面倒なしに)すぐに使える
  • ということはネットアクセス不要
  • 解説つき

というあたりでしょうか。

あと、

  • 発音記号を見たい(←PDIC Viewer開発の主要な動機の1つ)

方には PDIC Viewer をお勧めします。英辞郎の全単語に発音記号が収録されているわけではありませんが。

■追記■
昨年末に遅ればせながらIntelMacユーザになったのですが、Universal化していない拙作ビューアはスピード感がない*5ですね・・・*6。一英辞郎ファンとしては、皆さんにも英辞郎を快適に利用してほしいので、こういうバンドリング*7不本意です。

時間がとれれば IntelMac ばりばり対応の高速ビューアを是非書きたいと思っていますが、当面は業務で手一杯なので無理っぽいです。 GWにこんなのを作りました。よろしかったらどうぞ。
あと、K.SekiさんもCocoaでビューアを作って下さっているようです。

というわけで、お詫びと言っては何ですが、こんなエントリを書いてみました。

英辞郎ビューア良いですよ。ぜひお試しください。

*1:中国語辞書とか引くとき特にそう思う

*2:英辞郎 第三版」には含まれないのでPDICから自力で変換するか、EDPからデータを買うかする詳しくは2/12の記事をご参照ください

*3:アルクさんがPDICにこだわる理由はアルクさんに訊いてもらうとして

*4:今みたら、EPWING版もありますね・・・¥5000ですが

*5:個人的には「英辞郎簡易検索」モードのスピードで十分満足ですが、ここで特に言いたいのはテーブル表示のこと

*6:いやPowerMac版でもそう思うのですが・・・やはりCarbonは駄目ですかね

*7:締切り前日ぐらいにアルク編集部さんから第三版についての連絡が突然来て、Universal化もしないまま、同梱前にとりあえずRosettaで動くことを編集部にて確認できた程度です。ちなみに当時うちにはまだPowerMac環境しかありませんでした