業務用翻訳ソフトとして評価の高いPC-Transerはバージョン6から対訳データベース機能を搭載しました。
最新バージョンのPC-Transer V9はスクリプト機能が強化され、対訳データベース作成ツールとしても一段と便利になりました。
詳細は株式会社ノヴァのホームページをご覧ください:http://www.nova.co.jp/
電子化された原文と訳文がそれぞれテキストファイルで手元にある場合に、センテンスを対応させて対訳ファイルの形にしておくと利用価値が大変高まります。自分で翻訳したものをその都度対訳ファイルにして蓄積しておくと優れた対訳コーパスとなります。
ここでは、Eqipment Leaseという契約書の、電子化された原文と訳文のファイルを利用して、PC-Transerで対訳ファイルを作成する手順を説明します。
PC-Transerを起動し、「ツール」メニューから「スクリプト」をクリックします。
スクリプト一覧の画面が表示されますので、「原文・訳文読込」を選択(反転表示)して「実行」ボタンをクリックします。
「原文ファイルの指定」画面が開きますので、原文ファイルequipment lease-eng.txtを選択して「開く」ボタンをクリックします。
次に「訳文ファイルの指定」画面が開きますので、訳文ファイルequipment lease-jpn.txtを選択して「開く」ボタンをクリックします。
自動的に原文、訳文が対訳エディタに読み込まれます。
翻訳ソフトは自動的に文末を判定して、文単位でセルに入れていきますので、原文と訳文の対応関係が合わなくなることがあります。
下図では、第2文のInc.のドットがピリオドと解釈されて("Lessee")が別の文として次のセルに入ってしまい、訳文とずれています。
このような場合は、("Lessee")の後ろにカーソルを置き、「Shift」キーと「Enter」キーを同時に押します。あるいは、「編集」メニュー→「片側改行挿入」をクリックでも同じです。
次に、("Lessee")の前にカーソルを置き、「Back space」キーを押します。
これだけの操作で以下のように正しい対応関係に修正できました。
最後まで修正が済んだら、保存します。
「ファイル」メニューから「テキスト出力」をクリックします。
「テキスト出力」画面が開きますので、「用途」のテキストボックスの右側の下向き三角ボタンをクリックして「対訳ファイル」を選択します。
ファイル名は自動的に入力されていますが、拡張子が.outになっているか確認して、もし.txtなどになっていたら.outに訂正してください。もちろんこの時点で任意のファイル名に変更しても構いません。
入力が済んだら「保存」ボタンをクリックします。
保存した対訳ファイルはテキスト形式なのでWZエディタなどで検索して利用することが可能です。
ここでは、さらにPC-Transer形式の対訳データベース・ファイルに変換して利用する手順を説明します。
これは、バージョン6以降のPC-Transerに共通の手順です。
PC-Transerの対訳エディタ画面の「対訳DB」ボタンをクリックしてください。
対訳データベース検索画面が開きます。
「ファイル」メニューから「インポート」をクリックしてください。
「インポート−ファイル指定」画面が開きます。
「使用中データベースファイル」の欄にはデフォルトで「システムデータベース」と「ユーザDB」が設定されています。
インポート元の「ファイル指定」ボタンをクリックしてください。
先ほど作成したequipment lease.outファイルを選択して「開く」ボタンをクリックします。
ファイルが表示されない場合は、ファイルの種類を「対訳ファイル(*.out)」にしてください。
インポート元にファイル名が入りました。
次にインポート先の「ファイル指定」ボタンをクリックします。
「開く」画面が表示されます。
ファイルの場所はPC-Transerがインストールされたフォルダ内の「dic」フォルダにします。
新規にデータベースを作成するので、ファイル名の欄にlawと入力しました。
既存のデータベースに追加する場合はそのファイルを選択します。ただし、システムデータベースには追加できません。
準備ができたら「開く」ボタンをクリックします。
新規作成の場合は以下のようなメッセージが表示されますので「はい」をクリックしてください。
データベース一覧で表示する名前を指定します。ここではファイル名と同じくlawと入力しました。
コメントはこのデータベースに関する説明です。法律文書と入力しました。
準備ができたら「OK」ボタンをクリックしてください。
インポート元ファイルとインポート先ファイルの指定が終わったら「OK」ボタンをクリックします。
処理が終わるとインポート件数が表示されます。
「OK」をクリックします。
「終了」ボタンをクリックして「インポート」画面を閉じてください。
これで、対訳ファイルのソースをPC-Transer形式に変換する作業は終わりました。
この対訳データベースを利用するには、さらに設定する必要があります。
対訳データベース検索画面の「設定」ボタンをクリックしてください。
設定画面が開いたら、「データベース」タブをクリックします。
現在設定されているデータベースの一覧画面が表示されます。
ここで「追加」ボタンをクリックします。
「開く」画面が表示されたら、先ほど変換した対訳データベース・ファイルlaw.tyx(拡張子が.outから.tyxに変わっています)を選択して、「開く」ボタンをクリックします。
データベース一覧画面に追加されました。
PC-Transerでは各データベースごとに色分けすることができます。
試しにlawの色を指定してみましょう。
「表示色」ボタンをクリックします。
「色」画面が表示されますので、任意の色をクリックします。ここでは赤を選択しました。
選択が終わったら「OK」ボタンをクリックします。
一覧画面のlawの部分が赤くなりました。
対訳エディタでデータベース機能を使って訳文生成を行うと、lawのデータベースにヒットした訳文が赤色文字で表示されます。
訳文生成方法の設定はPC-Transerのマニュアルをご覧ください。
Copyright(c)2002 Babel K.K.All Rights Reserved ■月刊「eとらんす」 ■MT研究会