レポート


インターネット翻訳を支える機械翻訳技術
-----ホームページ翻訳の最前線----


最新の現状と展望

 セミナーでは4名の講演が行われたが、先ずAAMT会長の辻井潤一東京大学教授が機械翻訳の最新の状況と展望について語った。グローバル化が進むにつれて翻訳需要も急増し、多言語ホームページの作成支援やソフトウエアのローカライゼーションなどの市場が拡大している。そのため翻訳ソフトの役割が重要になってきた。一般ユーザ向けのWEB翻訳の他にも、文書・用語管理との融合、自動抄録、情報抽出技術、複数文書の組織化、多言語情報検索などの新技術を機械翻訳システムの一部に取り込む情報システムがこれまでとは違った翻訳システムの構想を可能にしてきている。また、翻訳技術そのものも、コーパスを中心とした翻訳手法が従来の手法と統合される形に整備されてきた。現時点での機械翻訳技術は成熟しており、今後、翻訳システムは多様化し周辺個別技術と融合して行く。

多様化するインターネット機械翻訳ソフト

 沖電気工業の村田氏は機械翻訳システムの歴史を振り返り、沖電気が1995年に世界初のWEB用機械翻訳システム「PENSEE for Internet」を発売し、現在では当たり前のようになっているが、英語のサイトをそのままのレイアウトを保ったまま読めるようになったと述べた。
 このようにWEB翻訳は、外国語で書かれたWEBページを自分が読むために翻訳するのが主流だが、自分が公開しているWEBページを外国の人に読んでもらうために発信者が翻訳を行うWEB上のサービスとしての機械翻訳システムが出現し始めている。機械翻訳を用いることで翻訳漏れのページがなくなり、日本語のページを更新するとそれに追従して常に最新の訳文を表示することができる。現在、翻訳品質を高めるためにパターンベース機械翻訳システムを研究開発しており、機械翻訳と人手翻訳を融合して行くとのことである。

 東芝の熊野氏は「The翻訳」の機能を紹介した。ブラウザ翻訳では、分野の異なるページを高品質に翻訳するために、文書内容から分野を推定し、その分野に応じた訳語を優先して出力する機能を備えている。既存の対訳文書データを入力すると、原文・訳文中の語句の対応を推定し、ユーザ辞書登録データの候補として表示する「辞書構築支援」は翻訳業務向けの機能だ。翻訳ソフトを効果的に利用するために、ブラウザ翻訳はソフト主体、翻訳文書作成は人の知的作業主体といったように、目的に応じて人とソフトが適切な分業体制をとることが大切だと締めくくった。

各製品の機能に大きな開き

 最後に宮澤信一郎秀明大学教授がインターネット機械翻訳の機能評価について発表した。翻訳品質評価の研究はよく行われている(Green and WhiteのWEBサイトが紹介された)が、翻訳機能全般の評価はまだ行われていない。宮澤教授が委員を務める「AAMTネットワーク翻訳研究会」では1999年4月現在市販されている英日翻訳ソフト13製品について機能評価を行った。その結果として、翻訳機能については、各製品でかなりの開きがあり、インターネットの様々な形式、XML、PDF、チャット、メールなどに十分に対応できていないことがわかった。また、辞書機能については、辞書マージ、共通辞書に対応していないものがある。ホームページには文字画像が多用されており翻訳されない部分が数多く生じるが、OCR機能により解決できる。最後に、HTMLが正しく再現されない例を挙げて講演を終えた。

 今回のセミナーで、会場の参加者は、機械翻訳が単に文書を翻訳するだけのものではなく、周辺技術と融合することによって、情報流通のバリアを乗り越えるツールとして大きな意味を持つことを再認識したことだろう。

<関連WEBサイト>

アジア太平洋機械翻訳協会
http://it.jeita.or.jp/aamt/

機械翻訳システムPENSEE
http://www.oki.co.jp/OKI/RDG/JIS/pensee/

The 翻訳シリーズ
http://www.hon-yaku.toshiba.co.jp/

ネット九州

http://www.net-kyushu.net/

Green and White
http://homepage2.nifty.com/oto3/

BABEL MT研究会
http://www.babel.co.jp/mtsg/index.htm


| HOME |