翻訳のための機械翻訳の活用方法


(株)バベル トランスメディア・センター
小室 誠一


目次

1. 翻訳ソフトをどう使うか


ここでは、パソコン用 (Windows95/98対応) 英日翻訳ソフトの活用法を紹介する。


翻訳ソフトの新しい形

・PCの低価格化と高性能化
・Windows95の登場
・インターネットの普及
・低価格の翻訳ソフトの登場

これまで、「機械翻訳」は訳文出力機能のみが使用され、訳文の修正は、他のワープロやエディタで行われることが多かった。
現在では、「翻訳ソフト」として手軽に利用できるようになったため、対訳エディタの編集機能まで含めた総合的な使い方が出来るようになった。

翻訳ソフトを使うメリット

・品質の向上
-文体、用語の統一が比較的容易に出来る。
-人間でなければ出来ない作業にエネルギーを注ぐことが出来る。
-迅速に下訳が作成出来るので、訳文の推敲に十分に時間を割くことが出来る。

・労力の軽減
 入力作業の負担が減る。

・データベースの構築
 翻訳作業=対訳データベース作成作業

・大量・短納期対応
 通常の手翻訳の2倍の生産が目標

●斜め読みのツールとして

・WWWブラウザ対応の翻訳ソフト
WWWは翻訳作業時の情報収集に欠かせないツールとなった
→ レイアウト保持機能をもった翻訳ソフトは、ホームページにざっと目を通すのに便利
・専門辞書を活用した斜め読み
- 翻訳関連資料の斜め読み(短時間で大量に)
- 翻訳対象文の斜め読み(概要の把握)

●翻訳文作成支援ツールとして

・「翻訳ソフト」を、翻訳業務用の対訳エディタであると捕らえる
従来は、MT出力結果をワープロやエディタで修正していた
→ 後編集作業まで対訳エディタを利用して行う

「翻訳」は通訳などと違って、訳文を作成してはじめて成り立つ
-入力作業の労力軽減
-入力ミスの防止
-訳抜けの防止
・完全な訳文を求めるより、訳文のパーツを利用する
MTは訳し上げる傾向がある
→長いセンテンスは、正確に訳せている場合でも非常に読みにくい

訳文の語順が不自然なことが多い
→意味のまとまり毎にMT出力し、簡単な後編集をして、自然な語順に繋ぎあわせる


2. 翻訳ソフトを使用する場合の作業手順例

決まった手順はないが、できるだけ従来の翻訳の手順に沿って利用するのがコツ。また、一つの決まった手順に固執しないことが大切。

●前処理

MT出力をする前の準備作業。この処理を十分に行わないと正しい出力は得られない。
・文末判定/スペルチェック
一文が正確に切出されているか
→ ピリオド、コロン、セミコロン、?、!等をチェックする。

切ってはいけないところで文が切れていないか
→ U.S.のドット等

スペルミスを訂正する
→ 特にスキャナ+OCRで電子化した場合は、十分にチェックする

*上記に不備があると正しく出力されないのはわかりきったことだが、意外にこれらのミスが多い
・辞書設定/ユーザー辞書登録
専門辞書、ユーザー辞書の組み合わせ、及び優先順位を決める
→ テスト出力を何度か行うことが大切
用語集を取り込む
→ テキストソースの一括登録

英語のまま出力するものもできるだけ登録する
→構文解析を助ける
・翻訳設定/命令文の訳、文体、助動詞や前置詞の訳語
文書の種類・ジャンルによって設定する
→ 「です・ます」「である」、命令文を平叙文で訳す、youを訳出しない等

●一次出力

・前処理の不足を補う
-スペルチェックの不備
-ユーザー辞書の追加登録
-辞書設定の変更
-助動詞などの翻訳設定

●中間編集

この段階では出力文には極力手を加えない

「翻訳ソフト」を使いこなすということは、中間編集をいかにスムーズに短時間で行えるかということ。
この作業を十分に行うと、後編集が楽に出来る。というよりも、不十分だと、出力文が役に立たないことが多くなる。

・訳語変更(学習機能)
訳語の選択肢から最も適当なものを選ぶ。
→ 訳語候補の多いソフトが使いやすい
・辞書登録
キーワードは必ず登録する
→訳語の統一
→訳語集が作成できる
・文分割
文の「形」を見て分割すること
→ 接続詞、関係代名詞、前置詞、文詞構文、挿入句等、意味の固まり毎に
・フレーズ指定
並列句など、係り受けが曖昧なものに対して行う。
フレーズ指定すると、原文と訳文の該当個所が反転表示されるので対応が一目で分かる。
・品詞変更
動詞を中心に行う。
英語の場合、名詞も動詞も同じ綴りの単語が多く、品詞解析が誤りやすい。動詞の取り違えは、完全な誤訳になるが、品詞変更をすると正しい訳文が得られることが多い。

●後編集

出力文に直接手を加える。

・一定のルールに基づいて(翻訳英文法など)修正を行う
- 恣意的に行うと却って能率が落ちる
- 後編集の段階では、意識的にパターン化した修正をする
・出来るだけ出力文を利用する
- この段階ですべて書き直さなくてはならないとすれば、「中間編集」が不十分ということ
- 訳文のパーツを組み立てるようなつもりで編集する
・語順、句読点に注意する
訳文が読みにくいのは、主に語順と読点によることが多い
→ 長い修飾句から順番に並べる。逆になる場合は、読点を打つ
*さらに「翻訳」レベルの訳文にする場合は、後編集した訳文だけを見てリライトし、最後に英文と突き合わせてチェックして作成する

●対訳データベース機能

最近の翻訳ソフトが力を入れているのが対訳データベース機能。
→ ルールベース翻訳からデータベース翻訳へ

- 翻訳精度を上げるという効果
- 後編集済の訳文の再利用が可能

これまでは、同じパターンの文章でも何度も同じように修正して行く必要があり、機械翻訳の最大の弱点だった。

・翻訳メモリー型の翻訳支援ソフトの機能を一部取り入れてい

・完全一致文、文型一致文、類似文の検索・置換(PC-Transer EJ Ver6)

・文型一致文の検索・置換は翻訳ソフトならではの機能

これからの翻訳ソフトが、このデータベース機能を充実させれば、テキストベースの翻訳業務に無くてはならない最強のツールとなるだろう。

3. 訳文データの活用

・Trados、TranslationManager などの翻訳支援ソフトの翻訳メモリーに変換する
特に初期翻訳の際に、MTで迅速に下訳を作成し、対訳データベースに変換して利用する。
この場合、セグメンテーションの違いに注意する必要がある。
・PC-Transer、ATLAS、LogoVistaなどの翻訳ソフトの訳例登録をする。特に、文型登録が有効

文型登録例:
--/H
The Hiroshima Mayor ended his speech with an appeal for world peace and nuclear disarmament.
広島市長は、世界平和と核軍縮を訴えて彼のスピーチを終えた。
--/H
<$1> ended <$3> with an appeal for <$2>.
<$1>は、<$2>を訴えて<$3>を終えた。
PC-Transer EJ Ver.6 に登録したデータベースを対訳ファイル形式(*.out)で出力

・対訳ファイル/ユーザー辞書ファイルをテキスト書き出しして蓄積
PDIC (Personal Dictionary)、GREP(グローバル)検索等で活用

4. 翻訳ソフト操作のトレーニング法

翻訳ソフトを使いこなすには、トレーニングが必要。
理屈ではなく、実際に操作することによって、中間編集に馴れること。
また、どこまで手を入れるか、さじ加減を体得する。
・対訳エディタの編集機能を使い込む
出力文に手を入れずにどれだけ使える訳文を出力できるか

- 時間をかけても徹底的に行う
- 編集機能の使い方に馴れる
- 翻訳ソフトの癖を知る
MTスラッシュ・リーディング
切って繋いで下訳作成

- 最終的に、文分割が最も手軽で有効な方法
- つなぎの言葉をうまく補えば、最小の労力でおよその意味が分かる訳文が短時間で作成できる

5. 翻訳ソフト使用上の注意

・出力文に引きずられないこと
対訳モードで英文を参照しながら編集していると、訳文として不十分なものを見逃しやすくなる。
・頻繁に上書き保存をすること
フリーズすることがたまにあるので注意する。
・最終的に原文との突き合わせチェックを行うこと
センテンス単位で作業していると間違いに気づかないことがある。
→ 思わぬ間違いを見落とさない様にパラグラフ単位でチェックする

6. 翻訳ソフト選びのポイント

用途:斜め読みか、訳文作成か。

□ 斜め読みの場合は:

一次出力の善し悪しと、辞書ツールの使い勝手で決める。

□訳文作成の場合は:
・対訳エディタの使いやすさ
軽快に動作する、安定している、エディタとしての基本機能がついていること。
カット、コピー、ペースト、検索・置換等
・必要な編集機能
訳語対応/訳語変更/フレーズ指定/品詞指定

訳語候補の多いものほど使いやすい。
・辞書機能
ユーザー辞書一括登録/テキストソース書き出し/詳細登録

- 一括登録機能がついていないものは、業務に使えない
- テキストソース書き出しにより、辞書のメンテナンス、用語集の作成が出来る
- 詳細登録が出来ると、より自然な訳文が得られる
・出力形式
対訳テキストファイル保存

- ユーザ辞書一括作成
- 対訳データベースの作成

7. 終わりに

・「翻訳ソフトをワープロのように使いこなす」のが目標
・「道具」は使い方が間違っていると役に立たない
・使う人が増えればさらに便利なツールとなって行く
・翻訳力のある人ほど使いこなせる


MTスラッシュ・リーディングの例


文分割を中心とした「中間編集」により、短時間で粗訳を作成する例を示す。
PC-Transer EJ Ver6 を使用。
題材は、朝日新聞ホームページの英語ニュース、2月23日の「Saitama produce back in stores」から抜粋

(以下の例は、中間編集の考え方を示すものであり、翻訳の内容はここでは問題にしない)

(1) 一次出力

基本辞書のみで出力
TOKOROZAWA, Saitama Prefecture--Major department stores are selling Tokorozawa-grown vegetables again just days after the produce was declared free of dangerous amounts of dioxin. 所沢(埼玉県)(生産がダイオキシンの危険な量から自由であると宣言されたあと、メジャーなデパートは再びちょうど日をTokorozawa-grown野菜に売っている)。
Several stores began stocking the vegetables after the prefectural government on Thursday revealed a news report of high levels of chemical contamination was mistaken. 木曜日の県庁が化学的な汚染の高いレベルのレポートが誤っていたというニュースを現したあと、いくつかの店は野菜をたくわえ始めた。
The stores initially pulled Tokorozawa-area vegetables from their shelves after a Feb.1 TV Asahi report suggested the produce, particularly spinach, contained dangerously high-levels of cancer-causing dioxin. テレビ朝日レポートが提案した2月1日以後、店は初めに所沢-地域野菜を彼らの棚から引き離した生産する(特にホウレンソウ)ガン-引き起こしているダイオキシンの含まれた危険なほど高いレベル。
The report prompted a dramatic drop in the price of vegetables and cost the prefecture's agricultural industry an estimated 300 million yen. レポートに、野菜の価格のドラマティックな下落を促して、県の農業の産業は約3億円費やした。


(2) 中間編集

文分割、訳語変更、ユーザ辞書登録、フレーズ指定

登録した語句:

agricultural industry(n,*):農業
cancer-causing(a):癌を引き起こす (S)
chemical contamination(n,*):化学薬品の汚染
high levels of(a):高レベルの (O)
initially(adv):最初は
major(a,*):大手の (O)
prompt(v,*):拍車をかける (I)::[ON]{に}
reveal(v,*):明らかにする (X)::[ON]{を}
Tokorozawa-area(a):所沢地区の (O)
Tokorozawa-grown(a):所沢産の
*ユーザー辞書を、テキストソースに一括書き出ししたもの

直接出力文に手を入れたのは以下の部分:

● ちょうど日後に → ちょうど日後に
● 生産物は → 生産物
● 誤っていた → 誤っていたという
● 2月1日以後 → 2月1日以後
TOKOROZAWA, Saitama Prefecture-- 所沢(埼玉県) −
Major department stores are selling Tokorozawa-grown vegetables again 大手のデパートは、再び所沢産の野菜を売っている
just days after ● ちょうど数日後に
the produce was declared free of dangerous amounts of dioxin. ● 生産物には、ダイオキシンの危険な量がないと宣言された。
Several stores began stocking the vegetables いくつかの店は、野菜をたくわえ始めた
after the prefectural government on Thursday revealed a news 木曜日に県庁がニュースを明らかにした後で、
report of high levels of chemical contamination was mistaken. ● 高レベルの化学薬品の汚染の報道は、誤っていたという。
The stores initially pulled Tokorozawa-area vegetables from their shelves 店は、最初は所沢地区の野菜を棚から引き上げた
after a Feb. 1 ● 2月1日以後に
TV Asahi report suggested the produce, particularly spinach, contained dangerously high-levels of cancer-causing dioxin. テレビ朝日報道が、生産物(特にホウレンソウ)が危険なほど高レベルの癌を引き起こすダイオキシンを含むことを示唆した。
The report prompted a dramatic drop in the price of vegetables 報道は、野菜の価格の劇的な低下に拍車をかけた
and cost the prefecture's agricultural industry an estimated 300 million yen. そして、県の農業は約3億円失う。


(3) まとめ

通常は、(2)の段階から後編集作業に入るが、取りあえず繋げて纏めてみた。
(2)と相違している部分は、全て出力文に直接手を入れてある。
TOKOROZAWA, Saitama Prefecture--Major department stores are selling Tokorozawa-grown vegetables again just days after the produce was declared free of dangerous amounts of dioxin. 所沢(埼玉県)− 大手のデパートは、生産物には、危険な量のダイオキシンが含まれないと宣言されたちょうど数日後に、再び所沢産の野菜を売っている。
Several stores began stocking the vegetables after the prefectural government on Thursday revealed a news report of high levels of chemical contamination was mistaken. 木曜日に県庁が、高レベルの化学薬品の汚染の報道は誤っていたというニュースを明らかにした後で、店は、野菜を仕入れ始めた。
The stores initially pulled Tokorozawa-area vegetables from their shelves after a Feb. 1 TV Asahi report suggested the produce, particularly spinach, contained dangerously high-levels of cancer-causing dioxin. 最初は、テレビ朝日報道が、生産物(特にホウレンソウ)が危険なほど高レベルの、癌を引き起こすダイオキシンを含むことを示唆した2月1日以後に、店は所沢地区の野菜を棚から引き上げた。
The report prompted a dramatic drop in the price of vegetables and cost the prefecture's agricultural industry an estimated 300 million yen. 報道は、野菜の価格の劇的な低下に拍車をかけた、そして、県の農業には約3億円の損失となった。



このページは、1999年2月26日に日本翻訳協会によって開催された、「第9回 翻訳フェア」のセミナーで使用したレジユメを掲載したものです。


Copyright © 1999-2014 Babel KK All Rights Reserved.