研究レポート


訳せる文と訳せない文

MT研究会会員 
桑田 英明


「訳せる文と訳せない文」は、翻訳ソフトの使用方法に関する個人的な学習過程をMT研究会の掲示板に書き込んだ文章です。したがってここに書かれている内容は詳細な検討を経たものではなく、いつでも修正の対象となります。

第2回以降では、ワシントンD.C.の観光案内文を、主にPC-Transer2000で翻訳しています。観光案内文は、内容が単純であるために比較的良い訳出結果が得られることが多いので、例文として選びました。

英語を不得意とする人が、翻訳ソフトを介在させてネイティブとのコミュニケーションを試みることを想定しています。その際に必要となるルールの抽出を目的としているので、できるだけ編集機能を使わないようにしています(編集機能を使うためにはある程度語学力が必要なため)。

<第1回>


昨日(01/4/2)のGreen and Whiteには、翻訳ソフトの試訳が掲載されています。その中からThe翻訳による試訳を引用しました。

For the first time in the modern era, non-Hispanic whites are officially a minority in California, amounting to a little less than half the population of the most populous state, compared with nearly three-quarters only a decade ago, according to census figures released today.

初めて、現代の時代に、ヒスパニックでない白は、カリフォルニアで公式に少数です、こと、に、少し最も人口の多い状態の半
分未満の人口、と比較して、ほとんど四分の三、10年前に今日リリースされた国勢調査数値によって、単に。

この文を翻訳ソフトが正しく解析することはできないでしょう。1文中に分詞構文が2つも使われています。上手く訳せない文の見本です。

翻訳ソフトが訳せない文はたくさんあります。それらを克服する研究も大切だと思います。しかし、訳せる文もたくさんあるのですから、そちらも示すべきでしょう。

ではどのような英文なら訳せるのでしょうか。上記の文を書きかえてThe翻訳で訳しました。

The figures released today by the Census Bureau show that non-Hispanic whites have lost the majority status in California. A decade ago, nearly 75% of the population of California was made up of non-Hispanic whites. But today the ratio has dropped to less than half of the state's population.

今日国勢調査局(Census Bureau)によってリリースされた数値は、ヒスパニックでない白人がカリフォルニアで大多数のステータスを失ったことを示します。10年前に、カリフォルニアの人口のほぼ75%はヒスパニックでない白人から構成されました。しかし、今日、比率は、州の人口の半分未満まで落ちました。(The翻訳V5)

1行目のshow の品詞を指定しなければなりませんでしたが、この程度の文章であれば今の翻訳ソフトでも十分翻訳できます。このような訳出結果を得られるので、翻訳ソフトは(条件次第で)使えるはず、と私は確信しています。

ちなみにPC-Transer2000でも同じような結果でした(編集の必要がないように、最初の部分を書きかえています)。

The figures, which were released today by the Census Bureau, show that non-Hispanic whites have lost the majority status in California. A decade ago, nearly 75% of the population of California was made up of non-Hispanic whites. But today the ratio has dropped to less than half of the state's population.

数字(それは国勢調査局によって今日発表されました)は、non-Hispanicな白人がカリフォルニアで大多数状態を失ったことを示します。十年前、カリフォルニアの人口のほぼ75%は、non-Hispanicな白人から成り立ちました。しかし、今日、比率は州の人口の半分より少ないものに落ちました。(PC-Transer2000)




<第2回>


前回紹介しました「訳せる文」と「訳せない文」との間にはどのような違いがあるのでしょうか。また、「翻訳ソフトは(条件次第で)使えるはず」と書きましたが、それはどのような「条件」になるのでしょうか。他の文章を使って少し探ってみようと思います。

PC-Transer2000でワシントンD.C.の観光案内文を訳してみました。「訳せる文」と「訳せない文」が適量含まれているので、訳出結果を何回かに分けて書き込みます。今回は、リンカーン・メモリアルが紹介されている部分です。

原文はここにあります。
http://www.district-of-columbia.com/editorspicks/DC%20Classics.htm

The Lincoln Memorial is one of the most inspiring monuments in Washington.

リンカーン・メモリアルは、ワシントンで最も胸が踊るモニュメントのうちの1つであります。(PC-Transer2000)

このような文は、翻訳ソフトが得意とする文です。簡単な修飾語句が付いているSVCの文です。解析は上手くいくので、単語の意味を選択するだけです。

Inside the Greek-styled structure is Daniel Chester French's statue of Lincoln overlooking the reflecting pool, with The Gettysburg Address and Lincoln's second inaugural speech inscribed on the walls.

壁に記入されるゲティースバーグ演説とリンカーンの第二の就任演説で、反映しているプールを見おろしているリンカーンのダニエル・チェスター・フレンチの像は、ギリシャ様式の建物にあります。(PC-Transer2000)

これだけの情報量が1文中に詰め込まれていれば、翻訳ソフト向きの文ではありません。文法的にも、倒置、分詞構文、付帯状況を含む複雑な文です。このような場合、編集機能を使うか、又は人間が訳すしかありません。したがって翻訳ソフトが介在するコミュニケーションでは、これは書いてはならない種類の文です。

翻訳ソフトを使う場合には、次のルールが必要になります。

●「倒置を使わない」

洗練された文を書くことよりも、翻訳ソフトが誤解析しない文を書くことを優先する。

●「付帯状況を使わない」

最初から内容別に文を分けて書く。複数の事柄が同時進行していることを強調したければ、At the same time を使う。

この例文を翻訳ソフト用に書きかえると次のようになります。

A Lincoln's statue, which was created by Daniel Chester French, is inside the Greek-styled structure. The statue is overlooking the reflecting pool. And it is surrounded by the inscription of The Gettysburg Address and Lincoln's second inaugural speech.

リンカーンの像(それはダニエル・チェスター・フレンチによって作られました)は、ギリシャ様式の建造物の中にあります。像は、反射している池を見おろしています。そして、それはゲティースバーグ演説とリンカーンの第二の就任演説の碑銘に囲まれています。(PC-Transer2000)

(注)訳語登録:Greek-styled(ギリシャ様式の)

This moving site has been the setting for numerous rallies including Martin Luther King's speech.

この感動的な場所は、マーティン・ルーサー・キングのスピーチを含む多数の集会のための場所であった。(PC-Transer2000)

訳語の選択を除けば、文法的には including 以下の形容詞句が rallies を修飾しているだけなので問題ありません。副詞句を含まない文で、形容詞句が直前の名詞を修飾する構造であれば、この文より少々長くなっても翻訳ソフト向きの文と言えそうです。

(注)「訳語登録」が面倒であったため、原文の一部を変更しています。原文には、Martin Luther King's "I Have a Dream" speech と書かれています。



<第3回>


今回の文章は、ホワイトハウスへのツアーについてです。文の構造は単純で翻訳ソフト向きの文(解析に成功する文)といえます。構造レベルの難点はありません。

One of the most recognized structures in the world, the White House, should be a part of any Washington itinerary.

世界(ホワイトハウス)で最も知られた建物のうちの1つは、どんなワシントン旅程の一部でなければなりません。(PC-Transer2000)

The White House, one of the most recognized structures in the world, should be a part of Washington itinerary.

ホワイトハウス(世界で最も知られた建物のうちの1つ)は、ワシントン旅程の一部でなければなりません。(PC-Transer2000)

文の構造は単純です。しかし、the White House が挿入句にされているので訳がおかしくなっています。本来、one of the most recognized structures が挿入句にされるべきです。

これは文構造の複雑さの問題ではありませんが、挿入のしかたにも注意が必要という見本になります。

●「直前の名詞を補完するためにのみ挿入句を使う」

をルールにすべきです。

Tuesday through Saturday, the White House tourguides take you through five rooms of the Presidents home.

火曜日に土曜日を通して、ホワイトハウス・ツアーガイドは、大統領家の5つの部屋中をあなたを連れて行きます。(PC-Transer2000)

From Tuesday through Saturday, the White House tourguides take you to five rooms of the Presidents home.

土曜日まで火曜日から、ホワイトハウス・ツアーガイドは、大統領家の5つの部屋中を、あなたを連れて行きます。(PC-Transer2000)

これも文の構造自体は単純です。しかし、(From)Tuesday through Saturday, の From が省略されているために上手く翻訳できないケースです。この表現方法に対応しているソフトもありますが、全てのソフトが対応しているわけではないので、

●「省略をしない」

というルールが必要になります。

タイピングのミスも訳が混乱する原因になります。この文では、the President's home のカンマが抜けています。PC-Transer2000はこれを問題なく訳しましたが、他のソフトは上手く訳せませんでした。take(人)home と解し、home を副詞として訳します。タイピング・ミスには注意すべきです。



<第4回>


ホワイトハウスの続きです。今回も、単純な文だけです。

Even if you do not get the chance to go inside, visiting the White House is fun.

たとえあなたが入るチャンスを得ないとしても、ホワイトハウスを訪問することは面白いです。(PC-Transer2000)

副詞節がSVCの文を修飾していますが、これくらいでは解析に失敗しません。しかし、visiting the White House is fun の後に and (S)+ V の文を続けると修飾関係が不明確なる(副詞節がどれを修飾するのか可能性が複数になる)ので、解析に失敗するはずです。And の使い方には注意しなければなりません。

Tourists and political activists perennially surround the White House, and it is not unusual to see White House correspondents recording their "stand-ups".

観光客と政治的活動家は絶えずホワイトハウスを囲みます、そして、彼らの「現場レポート」を記録しているホワイトハウス記者に会うことは珍しくはありません。(PC-Transer2000)

この文には、And が2ヶ所に使われています。最初の And では、修飾語付き名詞の位置が And の後にされているので、解析が上手くできています。

●「修飾語句付きの名詞は And の後ろに置く」

をルールにすべきです。

次の And は1つ前の文と違い、文全体を修飾する副詞節がありません。また、この文の And は単純に文と文をつないでいるだけで、動詞の並列もありません。この使い方ならば、解析は上手くいきます。しかし、これら2つの文を And でつないでおく必要はないので、それぞれ独立した文にしておく方が無難です。

●「名詞+名詞以外では And を使わない」

をルールにすべきですが、実行可能かどうかまだわかりません。



<第5回>


今回は、ジェファーソン・メモリアルについての紹介部分です。翻訳ソフトが解析に失敗する文です。

As author of the Declaration of Independence, President, Secretary of State, and designer of Monticello, Thomas Jefferson proved himself an accomplished architect of both buildings and nations.

独立宣言、大統領、国務長官とモンティセロ、彼自身両方の建物の完成した建築家ということを証明されるトーマス・ジェファーソンと国のデザイナーの著者。(PC-Transer2000)

この文では、4つの句と単語がAnd でつながれています。単純に2つの単語または2つの文を並列させるとき以外では、And は解析失敗の原因になります。この文でもそれが確認できます。

Thomas Jefferson proved himself...以下の文は、翻訳ソフトが解析に失敗しやすいSVOCの文です。しかし、前半部分の副詞句を切り離してやると、解析が正しくなされました。形容詞句付きのSVOCの文を解析できるのは立派だと思います。

しかし、副詞句と一緒だと解析に失敗します。これについてのルールを導き出すためには、もっと例文が必要です。

The Jefferson Memorial pays tribute to him by having a statue of Jefferson in the center of a colonnaded monument with excerpts of his writings engraved on the walls.

ジェファソン記念館は、壁に刻み込まれる彼の著作の抜粋付きの列柱のあるモニュメント中央に、ジェファーソンの像を持つことによって彼に敬意を払います。(PC-Transer2000)

解析には失敗したのは、by having a statue of Jefferson の部分だけでした。この部分をフレーズ指定してやると、解析は上手くいきました。

翻訳ソフトを使う場合には、

●「具体的な意味を持つ動詞を使う」

というルールが必要です。この文では、by having a statue のかわりに by placing a statueを使うとより明確な訳が得られます。また、解析にも成功します。

have や get のような訳がたくさんある動詞は、「持つ」「獲得する」を意味する時か慣用句のときにだけ使うようにすべきです。それら以外では他の動詞を使うようにすると、誤解析を避けられるはずです。無生物主語の使い方と重なる部分があるはずですが、いずれ取り上げたいと思います。

with excerpts of his writings engraved on the walls は、形式は「付帯状況」と同じですが、直前の名詞を修飾する形容詞句です。この場合、解析に成功します。


<第6回>


ジェファーソン・メモリアルの続きです。以下の2文とも翻訳ソフトにとって問題の少ない文です。今回は、ルールを抽出できないので、翻訳ソフトの特徴を少し調べてみました。

Since it overlooks the Tidal Basin, in warmer weather visitors can view the monument from a paddleboat.

それがタイダル・ベイスン川を見おろすので、より暖かい天気の中で、観光客は外輪船からモニュメントを見ることができます。(PC-Transer2000)

1文全体を訳させた時と、文分割をして訳させた時との翻訳結果の違いを試してみました。

トランサーの場合、部分に分けて翻訳しようが、文分割せずに1文全体を翻訳しようがほとんど変化がありません。もちろん解析に失敗すれば、各部分の「順序」と「結合」は変化します。しかし、各部分の訳自体は変わりません。

The翻訳では前置詞の訳が多少変化します。

「文」を「句」に分割したとき、訳の変化が最も大きいソフトがAtlas V7です。細かく分割すると訳質が劣化します。滑らかな訳を売りにしているロゴヴィスタでも同じ傾向がみられるはずです。

したがって、ソフトに部分を訳させて、それらを基に人間が訳文を作る場合、PC-Transer2000が最も適していると言えます。

Atlas V7は、どちらかと言えば、細かい「句」に分割せずに「節」全体を訳させるのに適しているようです。そのかわり、翻訳者の意思を反映させにくいようです。例えは、前置詞の訳を変更できません。

The翻訳は、PC-Transer2000とAtlas V7の中間に位置付けられると思います。

One of the best views of the White House can be seen from the Jefferson Memorial.

ホワイトハウスの最高の眺めのうちの1つは、ジェファーソン記念館から見られることができます。(PC-Transer2000)

ジェファーソンのメモリアルからホワイトハウスの最も良い眺めの1つを見ることができます。(Atlas V7/The翻訳)

この文では、can be seen の訳にソフトの特徴があらわれています。

(1)PC-Transer2000:「眺め・・・は、・・・見られることができます」
(2)Atlas V7:「眺め・・・を見ることができます」
(3)The翻訳:「眺め・・・を見ることができます」

この文を直訳すれば、受動態なのでPC-Transer2000の訳になるはずです。しかし、Atlas V7とThe翻訳では、日本語の特徴を反映するように修正され、能動態で訳されています。確かに、この文では受動態を使うよりも能動態を使う方が自然な訳になります。

しかしながら、Atlas V7とThe翻訳の方が、PC-Transer2000よりも優れているとは言えません。最初の例文中の can view(see) と2番目の例文中の can be seen とが同じ訳になるのですから、不都合な場合もあるはずです。

いずれにしても、以上の2文は、翻訳ソフトの比較に使える文だと思います。



<第7回>


今回は、ワシントン・モニュメントに関する記述部分です。

The Washington Monument, the tallest freestanding masonry structure in the world, is a 555-ft obelisk that dominates the Washington Skyline.

ワシントン記念塔(世界で最も高い支えなしに立っている石造り建造物)は、ワシントン・スカイラインにそびえる555フィートの方尖塔であります。(PC-Transer2000)

これはSVCの文で、「挿入句」と「関係代名詞に導かれた形容詞節」が埋め込まれています。しかし、And や不定詞のような複数の解釈を可能にする要素は含まれていません。訳語の選択と訳語登録の問題だけで、文法上の問題はなく翻訳ソフトが解析できる文です。

構造を複雑にするために、下のように分詞構文を付け加えると、PC-Transer2000は解析に失敗しました。

Located at the center of The National Mall, The Washington Monument, the tallest freestanding masonry structure in the world, is a 555-ft obelisk that dominates the Washington Skyline.

ナショナル・モール(ワシントン記念塔)の中央に位置します最も高い、世界の中の支えなしに立っている石造り建造物は、ワシントン・スカイラインにそびえる555フィートの方尖塔です。(PC-Transer2000)

しかし、下の例文のように挿入句を取り除いてやると正しく解析できるので、分詞構文に対応できないわけではないようです。

Located at the center of The National Mall, The Washington Monument is a 555-ft obelisk that dominates the Washington Skyline.

ナショナル・モールの中央に位置して、ワシントン記念塔はワシントン・スカイラインにそびえる555フィートの方尖塔です。(PC-Transer2000)

以上から

●「1文中のカンマ(,)は2ヶ所までとする」

というルールを抽出できます。要するに情報を詰め込み過ぎないようにする、ということです。しかしこれではルールにならないので、1つの方法として、カンマ数を制限することになります。



<第8回>


ワシントン・モニュメントの続きです。わかりづらい訳ですが、翻訳ソフトの解析結果としては、驚くほど善戦しています。2つの不定詞と2つのAnd が使われている文にしては、よく解析できていると思います。

Tours are available to take the 72-second elevator ride to the top, and then walk down the stairs to see the 193 stones and plaques donated to the monument

ツアーは、最上部への72秒のエレベーター乗り物に乗って、それから193個の石と飾り板がモニュメントに寄贈されるのを見るために階段を歩いて来るために利用できます。(PC-Transer2000)

2つのポイントがあります。

(1)To-不定詞の形容詞用法と副詞用法の区別

不定詞の形容詞用法と副詞用法は外見からは区別がつかないので、翻訳ソフトが誤解析しやすい表現のはずです。今回の例文でも to see が直前の名詞the stairs の修飾語句として訳出されても不思議ではありません。実際、The翻訳は形容詞用法で訳出します。したがって次のルールが必要になります。

●「副詞用法の場合は、『in order to do あるいは so as to do』を使う」

形容詞用法については、編集以外の方法で、翻訳ソフトに確実に訳出させる方法は考えついていません。


(2)「知覚動詞+O+PP」と「名詞+PP」の区別

これらも外見から区別がつきません。今回の例文でも、たまたま知覚動詞 see が含まれているために、PC-Transer2000、Atlas V7、The翻訳の3つとも、過去分詞 donated を後置形容詞ではなく、補語として誤解析しています。これらを区別するために次のルールが必要になります。

●「過去分詞を後置形容詞として使う場合は、『関係代名詞+be動詞+PP』を使う」

以上の2つのルールはとても大切であり、また、わかりにくい(わざわざ不要な語句を付け加えるため)ので、ネイティブ側に繰り返し説明しておく必要があるでしょう。


最後に、今回の例文にルールを当てはめて書き直し、再度翻訳すると次のようになります。("72-second ride" は省きました。)

Tours are available to take the elevator to the top, and then walk down the stairs so as to see the 193 stones and plaques that were donated to the monument.

ツアーは、最上部へのエレベーターに乗って、それからモニュメントに寄贈された193個の石と飾り板を見るために階段を歩いて来るために利用できます。(PC-Transer2000)