機械翻訳にみる類語の問題

 現在は,単なる言葉のおきかえというレベルの翻訳ではなく,文脈を意識したレベルでの翻訳が一部可能になってきているが,問題はあいかわらず多い.アメリカでの実験では,思わぬ結果も生まれている.メーカーにとっては悲劇であり,そして第三者には喜劇ともいわれるような話を紹介する.

 アメリカのあるシステムを使って,英語とロシア語の翻訳をテストしたところ,つぎのような結果が得られたそうである.

  The spirit is willing, but the flesh is weak.
  (精神は強く,肉体は弱し)

という聖書の一部をロシア語に翻訳し,つぎにその訳文をもう一度英語に翻訳させたところ,

  The vodka is good, but the meat is rotten.
  (酒は最高だが,肉は腐っている)

と訳したそうである.単なる用語のおきかえならば,こんな結果にはならなかったはずである.問題の原因はつぎのとおりである.

 ①自然言語の文の意味は単一ではなく,文脈その他の状況により,いくつかの異なった意味に対応すること

 ②機械による翻訳を効率よく進めようとすると,可能な意味のなかから1つに絞るための時間を十分にかけられないこと

 ③同じ意味の内容であっても,個々の言語によって表現のしかたがさまざまであること

 意味を重視した結果が,この喜劇を生んでしまったのだ.

  spirit=精神,霊魂,幽霊,勇気,気概などの他,複数形でアルコール度の強い酒

  flesh = (人間・動物の)肉,肉付き,果肉, the fleshで,肉体,肉欲,情欲

  weak=弱い,劣っている,水っぽい

である. spiritがアルコール度の強い酒=ウォッカ,と解釈され, fleshが肉,と解釈された結果,こんな翻訳が生まれた.さらにくだけだ話になるが,このコンピュータに英日翻訳をやらせてみるとおもしろいかもしれない. fleshを情欲と解釈してしまうと,

  The spirit is willing, but the flesh is weak.
  勇気はあるが,情欲が伴わない

という,まことに聖書らしからぬ文ができあかってしまう.この翻訳は,遊び心として提示したものである.

機械翻訳システムにおけるいろいろな問題をとりあげてみた.最終的には,文章は人間の英知によって,完成させなければならない,という一言に尽きる.それには,多くの文章を読むこと,つねに辞書を引くこと,などが効果的である.

 コンピュータにとっては,クリアすることが困難な課題でも,人間だったら,わけなく消化できる課題も多くある.つぎの例文が,それをしめしている.

  太郎と犬が走っている.
  新幹線が走っている.

という2つの文で,「走る」という言葉は共有できるが,

  太郎と犬が駆けている.

とは使えても,

  新幹線が駆けている.

とはいえない.「走る」と「駆ける」は同義語ではあるが,主語の種類によって,使えるばあいと使えないぱあいが出てくる.人間が認識することは楽だが,コンピュータで,この問題をクリアするには困難をきわめる.