すべてのカテゴリ » インターネット・パソコン » 技術・プログラミング

質問

終了

サイトの翻訳させると、わけがわからない文章になりますが、あれっていつちゃんとした文に翻訳できるようになるのでしょうか。

  • 質問者:mk
  • 質問日時:2009-01-31 11:19:26
  • 1

並び替え:

日本語と英語を翻訳させるプログラム製作に関わっています。
現状ではあれが精一杯です。これでも頑張っているんですよ。

他の方も仰っているように、「どれだけシンタックスの例文をデータベース化できるかにかかっている」

英語のほうに問題があるわけではなく、英語と各ヨーロッパ言語との翻訳は高い精度で完成しています。理由の一つは、言語的に近いから。二つ目の理由は文法がしっかり確立しているからです。

日本語は我々日本人でも説明が付かないほど、柔軟です。主語もいらないし、目的語も、修飾語も、文章のどこにおいても構いません。

しかも、語尾の微妙な変化でニュアンスが変わってしまいます。日本語の解析を理論的にコンピュータにさせるのが難しいのです。

一般には、
「通常の日本語ー>理論的な日本語ー>分解して、シンタックスごとに理解するー>外国語に翻訳する」
の手順を取らざる終えないのです。この第一弾が難しいのです。他の部分は難しくありません。

我々が心がけるのは翻訳する日本語を、正しい日本語文法を使って入力することです。
実は我々日本人は、正しい日本語文法を分かっていません。
外国人に、日本語を論理的に説明できないのはそのためです。

結果から言うと、
1.更なるデータベース化の必要
2.論理的な日本語への変換の精度向上

この二点がこれからの課題です。
10年では難しいと思います。一般実用化のためには、20-30年になると考えます。

更に質問があれば、どうぞ。

===補足===
補足します。
「実は我々日本人は、正しい日本語文法を分かっていません。」の部分に批判をあびそうなので。

我々日本人同士は間違いなく、コミュニケーションは取れていますよ。
ただ、正確な日本語文法を意識して喋ったり、書いたりしていないとのことです。
日本語には、主語が無くてもいいですし、主語が二つあっても良いのです。

簡単な例を挙げましょう。
「今日は、私が、カレーを作りましょう」の文書は、我々には分かりますが、コンピューター解析では、「今日」がカレーを作るのか?「私」がカレーを作るのか?分かりにくいのです。

そういうことです。日本語や日本人自体を批判しているわけでは有りません。

  • 回答者:日本語は難しい (質問から7日後)
  • 1
この回答の満足度
  

まだまだ難しいと思います。
主人がよく利用しますが、結局いつも私がチェックして、ほとんど直しています。
全く意味が違うものがというか・・・意味不明、英文とはいえないものが沢山あります。
つい、一ヶ月ほど前、知人のアメリカ人に見せたら「what?」の連続でした。おもしろかったですよ。
早く翻訳機が出て欲しいですが、日本語をただ直せば言い訳ではなし、色々な言い回しがありますから、結局は完璧というものは無理なのではないでしょうか?

この回答の満足度
  

ちゃんとするのは期待しないほうがよいと思いますよ。
後はそういうサービスを行っているところでは改善要望を受け付けていると思いますので、こういう翻訳のほうがよい、と提案していけば反映されていくかもしれません。

この回答の満足度
  

機械翻訳の精度は少しずつでも制度が上がっていきてますが、あと5年10年程度で一般のサイトの言葉を自然な言葉に翻訳するのは無理でしょう。

現実問題として、単純に文単位で単語を訳すだけでは意味が通らない事が多いです。なので書かれてる全体、コンテキストを理解し、さらに文化的背景も把握して翻訳しないと、どこかに無理がでます。宗教的であったり歴史的であったりする文化的背景の知識ベースを用いるのは機械では非常に難しいです。

  • 回答者:Ken (質問から6時間後)
  • 0
この回答の満足度
  

パソコン始めた10年前と、ほとんど変化ないですね。
あと10年はかかると思ってます、いつも。

  • 回答者:匿名希望 (質問から4時間後)
  • 0
この回答の満足度
  

まだまだ掛かると思います。
やはり機械なので型にはまった翻訳しか出来ないですね。
人間と同等の翻訳力にするには技術的に難しいと思います

  • 回答者:Sooda! くん (質問から2時間後)
  • 0
この回答の満足度
  

まだ数年はかかると思いますよ。
遠い未来の話ですね。

  • 回答者:匿名 (質問から58分後)
  • 0
この回答の満足度
  

しばらくは無理でしょう。長期的に考えていかなければならないと
思います。所詮機械は機械です。

  • 回答者:匿名 (質問から33分後)
  • 0
この回答の満足度
  

どれだけシンタックスの例文をデータベース化できるかにかかっていると思います。
より豊富なデータから引っ張ってこれれば、
様々な条件を吟味できて自然な感じに近づきます。
個人的にはあと10年で結構なとこまでいけるだろうと思います。

または一部を人力とのハイブリッドとすることで
よりナチュラルな訳文が得られるようになるかもしれません。

  • 回答者:ほんやくこんにゃく (質問から32分後)
  • 0
この回答の満足度
  

関連する質問・相談

Sooda!からのお知らせ

一覧を見る