BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Googleがクラウド自然言語APIを立ち上げる

Googleがクラウド自然言語APIを立ち上げる

原文(投稿日:2016/08/29)へのリンク

Googleはクラウド自然言語APIのβ版を7月20日にリリースし、最先端研究の小さな世界を抜け出してデータサイエンティストとソフトウェアエンジニアの毎日の業務に使用できるよう、自然言語処理(NLP)を活用する動きに加わった。GoogleのNLP APIは以下の3つの核となるNLP機能をユーザに提供する。

  • 感情分析言語の調子を解釈する。例えば積極的もしくは消極的。
  • 表現抽出人々や組織のような言語内の異なる表現を認識する。
  • 文法解析言語内の言葉の部分の認識。例えば、ある文章xは3つの名詞を有する、など。

これらのツールはGoogleの深層学習・機械学習アルゴリズムを活用することで他の自作でデータサイエンスを行う努力からは一線を画している。

NLPソフトウェアのプログラムは人間の発話やテキストを理解するために構築され、GoogleやIBMのようなテックジャイアントによる開発者フレンドリなAPIを起点として主流として使用される道を辿っている。Googleのブログ投稿で、開発者であるSara Robinson氏はAPIの表現抽出機能を使用して(彼女は手元につづりがなかったため)Harry Potterの中に登場する鍵となる人々や場所を特定した。彼女は自身で関係する全てのソフトウェアを開発・維持することに必要な努力とNLP APIを用いることを対照的に記述している。

私は文書で触れられている人々や場所を発見するためのアルゴリズムを自分で記述することができるでしょうが、おそらく困難を伴うでしょう。そしてそれは発見された表現の各々を統合したり、数千の文章を横断して表現を解析したい場合はより困難になるでしょう。言い回しが異なる同じ表現の言及を考えに入れる必要があるからです。

Robinson氏が述べているように、NLPソフトウェアは一から構築する場合は特に難しくなる。ツールが起動するための大半の実際の開発業務する前でさえも、データの統合、準備、訓練のためにとてつもない量の注意を払う必要があるからである。GoogleのもののようなNLP APIは膨大な量の高度な数学や工学、そしてデータモデリングの複雑さをオーバヘッドとして取り扱うことなしにNLPアルゴリズムの強力な解析能力を活用することを可能にする。

他の最近のNLP APIの追加としてはWatsonの会話APIがある。WatsonのAPIにより異なるユーザコマンドを解釈し、これらのコマンドを例えば照明を制御するアプリのような家庭内の別のスマートソフトウェアへの伝達するためにNLPを使用することができる。Watson APIにはインタラクティブなSwaggerドキュメントがあり、"照明を点灯する"や"今日の天気は?"のようなリクエストを試してみることができる。GoogleのAPIが全ての目的のNLP使用のために構築されているのに対し、Watsonはテキストや発話による人間と機械のやりとりを補助することに焦点を当てている。これはIOT(物のインターネット)への注目度が増していることを背景にしており、NLPをスマートカーやホーム、トイレットペーパーとでさえもやりとりするための完璧な媒体として用いることができる。

Facebookは単語表現の学習と文章分類ライブラリであるfastTextのソースコード全体を7月にGitHubに対して投稿することにより、よりダイレクトなルートでテックコミュニティに対して内部のNLPコードをリリースした。開発者がきれいで簡潔なAPIに対する要望を持っていないため、APIは既存のNLPデータサイエンスコミュニティ向けの高レベルのものを含むFacebookのコードを分岐することができるようになっている。コミュニティの手でこのライブラリからより多くのNLP APIとライブラリを簡単に生成することができる。形はともあれ、NLPが一般にアクセスしやすいように成長しているのは明らかである。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

BT