機械翻訳にみる類語の問題
現在は,単なる言葉のおきかえというレベルの翻訳ではなく,文脈を意識したレベルでの翻訳が一部可能になってきているが,問題はあいかわらず多い.アメリカでの実験では,思わぬ結果も生まれている.メーカーにとっては悲劇であり,そして第三者には喜劇ともいわれるような話を紹介する.
アメリカのあるシステムを使って,英語とロシア語の翻訳をテストしたところ,つぎのような結果が得られたそうである.
The spirit is willing, but the flesh is weak.
(精神は強く,肉体は弱し)
という聖書の一部をロシア語に翻訳し,つぎにその訳文をもう一度英語に翻訳させたところ,
The vodka is good, but the meat is rotten.
(酒は最高だが,肉は腐っている)
と訳したそうである.単なる用語のおきかえならば,こんな結果にはならなかったはずである.問題の原因はつぎのとおりである.
①自然言語の文の意味は単一ではなく,文脈その他の状況により,いくつかの異なった意味に対応すること
②機械による翻訳を効率よく進めようとすると,可能な意味のなかから1つに絞るための時間を十分にかけられないこと
③同じ意味の内容であっても,個々の言語によって表現のしかたがさまざまであること
意味を重視した結果が,この喜劇を生んでしまったのだ.
spirit=精神,霊魂,幽霊,勇気,気概などの他,複数形でアルコール度の強い酒
flesh = (人間・動物の)肉,肉付き,果肉, the fleshで,肉体,肉欲,情欲
weak=弱い,劣っている,水っぽい
である. spiritがアルコール度の強い酒=ウォッカ,と解釈され, fleshが肉,と解釈された結果,こんな翻訳が生まれた.さらにくだけだ話になるが,このコンピュータに英日翻訳をやらせてみるとおもしろいかもしれない. fleshを情欲と解釈してしまうと,
The spirit is willing, but the flesh is weak.
勇気はあるが,情欲が伴わない
という,まことに聖書らしからぬ文ができあかってしまう.この翻訳は,遊び心として提示したものである.
機械翻訳システムにおけるいろいろな問題をとりあげてみた.最終的には,文章は人間の英知によって,完成させなければならない,という一言に尽きる.それには,多くの文章を読むこと,つねに辞書を引くこと,などが効果的である.
コンピュータにとっては,クリアすることが困難な課題でも,人間だったら,わけなく消化できる課題も多くある.つぎの例文が,それをしめしている.
太郎と犬が走っている.
新幹線が走っている.
という2つの文で,「走る」という言葉は共有できるが,
太郎と犬が駆けている.
とは使えても,
新幹線が駆けている.
とはいえない.「走る」と「駆ける」は同義語ではあるが,主語の種類によって,使えるばあいと使えないぱあいが出てくる.人間が認識することは楽だが,コンピュータで,この問題をクリアするには困難をきわめる.