ATOKの辞書ファイルを編集したよ

仕事で、ATOKに幾つかの辞書を入れています。

普通に紙の辞書を引けばいいんですが、入力中は速度が命なので、できれば変換するだけで正しい選択肢が出て来てほしい。

そこで導入したのが、かんぴょうさんで公開されている「好きじゃん辞書」と、共同通信社の「記者ハンドブック」のATOK版でした。この二つで、案件ごとの字遣いの指定にも簡単に対応することができて、とても助かっていました。

ところが

2010年11月に常用漢字の一部が改訂されたことにより、好きじゃん辞書のデータと相違点ができてしまいました。相違点を完全に把握するまでは、いちいち紙の辞書や追加データの一覧表をチェックしなければならないので、かなり仕事に支障が出るのではないかと心配に。

そこで、思い切って「好きじゃん辞書」の内容を修正しちゃうことにしました。簡単に手順を説明すると、

  1. 仕事先から頂いた、新旧辞書の相違点をプリントアウトします。
  2. 「好きじゃん辞書」のデータファイルを修正します。ここは手入力で、いちいち確認しながらやります。ここで間違えると仕事に影響するので真剣にやります。
  3. 不要と思われる単語を削除します。
  4. ATOKの辞書ファイルのバックアップを取ります。
  5. ATOKのユーザー辞書データをいったんクリアします。
  6. 用意した「好きじゃん辞書」自己修正版のテキストファイルを辞書登録します。
これで完成です。

これだけだと途中で予期せぬエラーが出たり果てしなく面倒くさかったりするので、コツを見ていきましょう。

1はプリンターさえあれば問題ないと思います。2も、テキストファイルを触れる人なら問題ないと思うのでここでは飛ばします。

3から、プログラム依存します。

できるだけ辞書データを軽くしたかったので、どの辞書にも対応していない単語に関しては思い切ってばっさりカットすることにしました。登録単語数は数十万語あり、削除したい単語も相当数にのぼります。いちいち検索して手作業していたのでは何日掛かるか分かりません。
DEARIEさんの、こちらの手順を参考にして、削除したい行を一気に片付けます。作業ウインドウがものすごい勢いで進んでいくのでぼーっと見てしまいました。機械に任せる意味半減とかそのへんは気にしたら負けです。
不要な単語が削除できたら、これを出力します。ここでのポイントは、出力するファイルは必ず絶対パスで指定するということ。ここで相対パスにしてしまうと、エラーが出て出力することができません。

無事に出力できたら、取り込むテキストファイルは完成です。そうそう、ファイル名は必ず半角英数のみにしておきましょう。ここで下手に全角文字を入れたりすると後ほどエラーが出て取り込みに失敗します。ええ、「改良版」とか調子に乗っちゃ駄目だってことです。

では辞書登録に取り掛かりましょう。

4で、念のため現在の辞書ファイルをバックアップしておきます。これは「ATOKの登録単語を一斉変換する」を参考にしました。

5で、ユーザー辞書データをクリアします。これも参照サイト様は4と同様です。

6で、3で作成したテキストファイルをユーザー辞書に登録し直したら終了です。

このやり方で、ユーザー辞書の大掛かりなメンテナンスがかなり楽にできました。先人の皆さまに感謝です!

0 件のコメント :

コメントを投稿