PC-Transerでユーザ辞書を一括登録する方法


●ユーザ辞書登録支援機能

PC-Transerのユーザ辞書登録支援機能には、「未知語検索」があります。

未知語検索を行うと、基本辞書と設定されている専門辞書、ユーザー辞書にない単語を検索します。検索画面には辞書登録ボタンがついており、クリックすると検索語が見出し語の欄に入力されて辞書ウインドウが開きます。


[01]

この方法だと1つずつ登録していかなければなりません。

●辞書ソースの形式

実際に、ユーザ辞書を一括登録する場合は、テキスト・エディタなどで辞書ソースファイルを作成しておいて一気に取り込みます。

辞書ソースの記述形式は次のようになります。

見出し語(品詞,見出し語活用形タイプ,不規則活用形):[意味素性]訳語:辞書フラグ:ケース記述

専門用語は名詞(句)がほとんどです。
いちばん簡単な記述方法で作成してみましょう。

<例>

adjustment(n,*):決算処理
advanced computer technology(n,*):先進的コンピュータ技術
adverse opinion(n,*):不適正意見
advisory partner(n,*):アドバイザリー・パートナー
analyst's report(n,*):アナリストによる報告書
application system(n,*):適用業務システム
appointment(n,*):業務依頼

見出し語と訳語の間に (n,*): を挿入するだけです。

nは名詞を表し、*は複数形が規則変化するという意味で、:は見出し語と訳語の区切りです。

エクセルなどの表計算ソフトにどんどん登録して行き、このような形でテキスト形式に保存して、
PC-Transerの辞書ツールで変換します。

結局、見出し語の抜き出しは手作業になります。何を登録するかは翻訳者の判断になるからです。

但し、最初にラフな辞書を作りたいと言う場合は、それなりの作り方をします。


● 見出し語のピックアップと一括登録

見出し語をできるだけ早く大量にリストアップする方法はいくつかあると思いますが、ヒントを一つ紹介します。

手順としては次のようになります。

見出し語リストの作成

(1)英文を単語で分割します。
  テキストエディタやワープロの「検索・置換」を使って、半角スペースを改行に置換します。


[2]検索置換ダイアログ


検索置換が終わると次のようになります。


[3]置換後

(2)句として登録するものを再度つなぎ合わせます。

手作業です。(「Back space」キーなどを使って)

[4]結合

(3)abc順にソートして重複するものを省きます

エクセルなどの表計算ソフトでできます。データの並び替え+フィルタプションの設定です。

エクセルに貼り付けたら、A列を選択して、さらに並び替えボタンをクリックします。

[5]エクセル貼り付けとデータの並び替え


「データ」メニューから「フィルタ」→「フィルタオプションの設定」をクリック。

[6]フィルタオプション

「重複するレコードは無視する」にチェックを入れて「OK」ボタンをクリック。

[7]フィルタオプションの設定


このように重複するデータが折りたたまれた状態で表示されています。
左側の数字が飛んでいるのはその間に同じデータがあるということです。

[8]フィルタの実行結果


全て選択してSheet2にコピー・アンド・ペーストするとデータが一つずつになります。
左側の数字を見てください。

[9]Sheet2に貼り付け


(4)辞書に登録する必要のない基本語を削除します。

手作業です。
行を削除するには、行番号をクリックして行全体を選択しておいて右クリックします。
メニューが表示されたら「削除」をクリックします。

[10]不要語の削除(行削除)

(5)複数形でしか使われないものはそのままにして残りを単数形に直します。

  手作業です。

(6)名詞以外のものは別ファイルに分けます。

  手作業です。(このリストは一括登録せずに一つずつ辞書登録画面から入力します)

このようにして作成した見出し語リストをMTにかけます

(1)対訳エディタに読み込んだときに繋がってしまわないように見出し語の間に1行入れます。

 テキスト・エディタやワープロの検索・置換を使って、改行を改行2つに置換すれば1行入ります。


(2)専門辞書を設定します。

「設定」ボタンをクリックして、設定画面を開き、「辞書」タブをクリックして辞書設定画面にします。
「追加」ボタンをクリックして表示される辞書一覧から使用する辞書を選択します。
「表示色」も設定しておくと、どの辞書の訳語が一目でわかります。


[11]辞書設定

(3)一括翻訳します。

こんな感じに出力されます。
訳語を直接修正しても構いません。「自動的な要約」を「自動要約」にしてみました。


[12]翻訳画面

(4)訳語をチェックして、不適切なものを修正します。

訳語変更機能を使えば、一覧にある訳語はクリックだけで変更できます。


[13]対訳出力画面

(5)対訳テキスト形式で保存します。

テキスト出力は、用途に応じて原文ファイル、訳文ファイル、対訳ファイル、編集ファイルの形式で保存できます。
ここでは対訳ファイル形式で保存します。


[14]テキスト出力

これで、見出し語と訳語のペアができました。

あとは、辞書ソースの形に整形します。

(1)対訳テキストファイルは次のような形式になっています。

テキスト・エディタで開くと次のようになります。


[15]

--/Mは機械翻訳のみ、--/Hは人間が訳文に手を加えたことを表します。


(2)テキストエディタやワープロの検索・置換機能を使って次のような形式にします。

英文(タブ)和文(改行)

検索・置換の指定方法は色々ありますが、MS-WORDを使った指定は以下のようになります。

改行(^p)を検索してタブ(^t)に置換する。

検索・置換の結果次のようになります。

--/M(タブ)英文(タブ)和文(タブ)--/H(タブ)英文(タブ)和文(タブ)

さらに、次の作業を行います・

^t--/^$^tを検索して^pに置換します。^$は任意の英字です。最初と最後は手で修正します。

検索・置換の結果次のようになります。

英文(タブ)和文
英文(タブ)和文

最後に辞書ソースの記述をします。

(タブ)を(n,*):に置き換えます。

次のようになったら完成です

英文(n,*):和文
英文(n,*):和文

後は、「ツール」→「辞書一括登録」でトランサー形式の辞書に変換します。

翻訳ソフトによって辞書ソースの形式が異なりますが、MS-Wordなどの検索・置換とエクセルなどの表計算ソフトがあればほとんど対応できるはずです。


作成:小室誠一2001年3月14日


MT研究会 オンライン講座 掲示板 研究レポート・試用レポート リンク集 メール

Copyright© 1999-2004 Babel KK All Rights Reserved.