●機械翻訳の企業レベルでの需要がアップ
従来の機械翻訳は「文法ルールと辞書情報」から構成されてきたが、最近では「用例パターン翻訳」や対訳データの「翻訳メモリー」を組み込む傾向がある。そのような技術を総合したシステムをいかに活用できるか有効な方策を立てなければならない。今回の講演では「多段階統合翻訳により人間に迫る」という副題にもあるように、このような問題について言語的な基盤を踏まえて多角的かつ具体的に論じられた。 グローバリゼーションが進む中、英語をすばやく読む必要性が増し、機械翻訳が見直されてきたが、さらに企業レベルでの翻訳需要が出てきた。例えば、外国企業が日本に進出する場合に必要な書類の翻訳やソフトウエアのローカライゼーションなどである。インターネットでのチャットでも機械翻訳を使えば母語で発信し、母語で受信することができるようになった。 機械翻訳の訳文は、原文と訳文の微妙なズレにも周到に配慮して翻訳するプロの翻訳家の訳文には到底及ばないが、字面の訳語をどうにか繋ぎ合わせるだけで平気な普通の大学生のレベルは超えている。 |
|
●2000年前後からTM機能も搭載
現在ではパターン翻訳や前編集、後編集の自動化といったコアシステム以外の部分の補完的な機能の強化が行われている。また、2000年前後から機械翻訳もTM(翻訳メモリー)機能を搭載した。「用例パターン翻訳」では、対訳用例を選択して登録する。さらに、変動部分を変数として扱い、機械翻訳した訳文を埋め込んで出力することができる。「翻訳メモリー」ツールにはTrados、Transit、SDLなどがあり、ローカライズ会社の89%が導入している。これらのソフトでは機械的に対訳データを取り込む。 言語対の構造が近いものは十分に実務レベルにある。欧州言語で、ゲルマン語派やロマンス語派といった同じ言語派に属するものは言語構造や表現形式が似ているので語の置換レベルの浅い処理で直訳してもまともな翻訳になる。正訳率は90%〜95%となる。日韓は言語構造が近いが、韓国語は表音文字のため韓日はあまりよくないようだ。 英語を基軸にして欧州語日本語間の翻訳を行う「ブリッジ方式」が有効である。直接欧州語と日本語間の翻訳をするより良い結果が得られる。ただし、日英間の翻訳エンジンは最高レベルが必要になる。 この他、文脈処理や曖昧性の処理などにも触れられた。欧州言語間では修飾語句の係り受けの曖昧な文を曖昧なままで訳出できるが、日本の場合は、係り受けをはっきりさせてからでないと正しく訳出できない。日本語が言語対の場合の機械翻訳の難しさがこの辺りにあるようだ。 |
|
<関連WEBサイト>
アジア太平洋機械翻訳協会 http://it.jeita.or.jp/aamt/
機械翻訳システムPENSEE
http://www.oki.co.jp/OKI/RDG/JIS/pensee/
BABEL
MT研究会 http://www.babel.co.jp/mtsg/index.htm |