BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Facebookが新たなニューラルマシン翻訳アルゴリズムを公表

Facebookが新たなニューラルマシン翻訳アルゴリズムを公表

原文(投稿日:2017/05/24)へのリンク

FacebookのArtificial Intelligence Researchチームは、ニューラルマシントランスレーション(NMT)に新たなアプローチを使用した研究の結果を発表した。同チームのアルゴリズムは、一般的な3つの機械翻訳タスクにおいて、どのシステムよりも高得点を取得するとともに、GoogleのNMTシステムより9倍高速に動作する。

Facebookの技術は、コンピュータビジョンの分野では一般的な技術である畳み込みニューラルネットワークを使用している。この技術では、文章を階層的な順序で処理することで、文章中に発生する複雑な関係を捕捉する。コンピュータをトレーニングすることで、文章の部分(2,3,4,ないしそれ以上の単語で構成される)に意味を与える。これらのネットワークで文章を処理することにより、文章の各部分の意味する概念を把握する。その上で別のニューラルネットワークが、この意味表現をもうひとつの言語に戻すのだ。

畳み込み方法を使用するおもなメリットは、文章の複数の部分に対して同時に適用可能であることだ。従来のNMT方式では文章を単語単位に読み込み、その部分までの文章の意味を記憶していた。このシーケンシャルな読み込みスピードが、コンピュータの演算速度による制限を受けていたのだ。結果的にFacebookの新アルゴリズムは、シーケンシャルな読み込み方式に比較して、最大で9倍高速になっている。

同チームは“マルチホップ”という新しい技術も導入した。このテクニックでは、文章全体を読んだ後ですべての翻訳文を書くのではなく、単語から単語への翻訳中に、ネットワークがオリジナルの文章中から注目すべき単語を選択する。マルチホップは“アテンション”機構に比べて、よりスマートかつ複雑な代替メカニズムを提供するテクニックだ。アテンション機構は、“単語の複数の意味”という問題の鍵になっている。単語は、コンテキストに基づいて異なる意味を持っている。 マルチホップでは、単語の翻訳中にソース文章の関連部分に注目することで、より適切な翻訳を決定し、この問題を解決している。

Facebookでは、他のテキスト処理にもこの新アプローチを利用する予定である。 その一例が、質問に回答するためにニューラルネットワークを使用することだ。新たなアプローチにより、会話の別々の部分に同時に注目することが可能になる。チームは今回のアプローチ全体をブログ記事と、無償公開された論文にまとめている。彼らのアルゴリズムを試したければ、GitHubから無償でコードをダウンロードすればよい。

新しいアルゴリズムは、標準英語-フランス語、英語-ドイツ語、英語-ルーマニア語のタスクにおいて、他のどのアルゴリズムよりもよい結果を出している。Googleの機会翻訳ニューラルネットワークよりも優秀だ。 Googleによるアルゴリズムは、Google Translate SDKを使用することで誰でも利用可能で、現在は20言語のペアをサポートしている。NMTと旧手法の違いを確認したければ、MicrosoftのBing翻訳を使えば、使用する翻訳方法を選択することができる。

(画像をクリックして拡大)

 
 

この記事を評価

Adoption Stage
スタイル
 

この記事に星をつける

おすすめ度
スタイル

BT