BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Amazonの音声認識APIへの細粒度制御の追加

Amazonの音声認識APIへの細粒度制御の追加

原文(投稿日:2016/12/04)へのリンク

Echoの核となっているNLP(自然言語処理)APIであるAmazonのAlexa Voice Service API更新が行われ、開発者はAlexaのAPIの音声認識機能を通じ、任意のデバイスを"賢い"デバイスに変えることができるようになった。

Alexa APIは、MicrosoftとGoogleのようなテックジャイアントによる大規模NLPにおける最新のものの1つである。Alexaは特にデバイスとの統合と音声認識に特化しており、IBMのクラウドプラットフォームであるBluemix上のAPIと連携したIBMの最近の成果によく似ている。Alexaは目覚しく成長しているIoTデバイス市場を目指す企業向けの開発者APIとなるように設計されている。今日のスマートデバイスにとって鍵となる課題は、異なるプラットフォームに全て対応すること、幅広いレベルの能力とセキュリティを備えていることである。 家庭にあるHue lightは同じく家庭にあるAugust smart lockと会話する方法を知らず、より先進的で使いやすいIoTの組み合わせ、例えば”これから外出する”という、自動的にコマンドの連鎖を作成してライトを消してドアをロックするようなものに対する障壁を作り出している。それどころか、異なるUIやログインを持つ過剰に多くのアプリをいちいち操作するという状況に置かれている。AppleのHomeKitはこの領域で大きく前進しているが、開発のためにカスタマイズできる音声認識APIという意味ではあまり進んでおらず、HomeKitは直接Siriと統合されている。

このAlexa APIのアップデートの鍵となる機能は、外部のデバイスとの統合の改善に加え、ボリュームや巻き戻しの制御のような、音声で起動するメディアに関する細粒度の制御である。このAPIを使用するためにAmazonのデバイスを持っている必要はなく、ネットワークに接続された任意のRaspberry Piや他のカスタムハードウェアを登録することができる。APIはモバイルデバイスやサーバサイドのメッセージングのサポートも含む。このことは、誰でも自分自身の音声UIを設計でき、ハードウェア上にカスタマイズされた様々なスキルをプログラミングできることを意味する。 多くのNLPプラットフォームは、GoogleのCloud Natural Language APIのように、完全にソフトウェアに焦点を当てているか、AppleのHomeKitのように、大規模なデバイス統合サポートを提供するものの、取り巻くアプリケーションのエコシステム全体に存在する標準セットを脅かす恐れのあるカスタマイズ性を犠牲にしている。AlexaにはこのAPI追加により、音声認識に焦点を当てて機能提供をしながらも、トータルのプラットフォームソリューションを購入するするようにユーザに圧力を加えておらず、コスト柔軟性をもたらすかもしれないという点で独自性がある。

Alexaの流れに飛び乗った企業には、音声により起動するペットの給餌器を手がけるPetnet、車内アプリケーション制御システムを手がけるMojioがある。これらのアプリケーションは、音声で起動するタイマーやアラーム、 Alexaモバイルアプリケーションとの統合、ミュート・ミュート解除のようなシステムレベル制御に関する機能といった長所を活用することができるようになった。AlexaはまたIntelと協業し、フォームファクタのリファレンスデザインと呼ばれる、新しいIntelボードをリリースすることも紹介した。これは開発期間を削減し、APIとペアになるよう設計したハードウェアを通じて、デバイスの製造者がスマートデバイスを一層生み出していくことを支援する意図である。

Rate this Article

Relevance
Style

この記事に星をつける

おすすめ度
スタイル

BT