BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Microsoftは中国語-英語の機械翻訳で人と同等レベルに達した

Microsoftは中国語-英語の機械翻訳で人と同等レベルに達した

原文(投稿日:2018/03/15)へのリンク

読者の皆様へ:ノイズを減らすための一連の機能を開発しました。関心のあるトピックについて電子メールとWeb通知を受け取ることができます新機能の詳細をご覧ください。

Microsoftでは、人の翻訳者が翻訳するのと同じように、中国語の文を英語に翻訳する翻訳アルゴリズムを開発した。

これまでは、中国語の文章を英語に翻訳することは困難な問題であった。一部の言語は英語とよく似ていて、翻訳は容易である。中国語は翻訳される文章の構造が異なるため、多くの古典的な翻訳アルゴリズムにとって難題である。ここ数年で驚くべき結果を生み出した技術であるニューラル機械翻訳のおかげで、Microsoftは機械による翻訳文を、人による翻訳文と同等のレベルにした。

Microsoftの研究者は、ニューラル機械翻訳に対して、二重学習デリバレーションネットワークという2つの既存手法を使用した。二重学習によって、システムによる中国語から英語への翻訳はすべて、再度、中国語に翻訳され、翻訳が正しいことが検証される。人も手動で翻訳するときには、翻訳が正しいことを確認するために同じことをする。機械も同じテクニックを使用することでメリットがあるようである。デリバレーションネットワークは、生成された文章を訂正する手法である。この技術は人間にインスピレーションを受けている。私たちは、文章を翻訳するときは、すぐに完全な翻訳を書き出すのではなく、翻訳を訂正して、良いものができるようにする。

Microsoftでは、翻訳アルゴリズムを改善する2つの新しい技術も開発した。彼らのジョイントトレーニング技術によって、英語の文章を中国語に翻訳し、次に改めて英語に翻訳することでトレーニングセットを補強する。どちらの翻訳システムもこの手法を使用して改善している。彼らはまた合意の規則を作成した。彼らは2つのアルゴリズムに、右から左へ、そして左から右へ中国語の文章を読み込ませる。両方のアルゴリズムが同じ翻訳を出力した場合、翻訳が正しいと強く示していると考えられる。

重要なのは、バイリンガルの言語コンサルタントに、作成した翻訳を「黄金の翻訳」と比較させることで、この「パリティマイルストーン」に達したということである。言語翻訳の評価では、機械が生成する出力を、人間の翻訳者によって翻訳された一文と比較する。このアプローチの欠点は、翻訳された文の本質的な意味を比較して、それらが同じ意味を持つかどうか確認する完璧なアルゴリズムがないことである。これは、アルゴリズム評価に弱いアルゴリズムを選択したGoogleを含む、すべての翻訳研究者が直面する問題であるが、人による比較評価では強力である。

ここ数年、機械翻訳コミュニティは、ニューラルネットワークの力を利用して翻訳アルゴリズムについて大きな利益を得た。GoogleFacebook、Microsoftはすべて、最高の翻訳アルゴリズムを開発しようとしている。Microsoftでは、このWebサイト上で古典的翻訳アルゴリズムとニューラル翻訳アルゴリズムを比較しているが、ヒューマンパリティ(人間と同等であること)を実行するシステムはまだ公開されていない。

 
 

Rate this Article

Adoption Stage
Style
 
 

この記事に星をつける

おすすめ度
スタイル

BT