BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Alexaの新機能 - Alexa Conversations、ディープリンクによるモバイルアプリ制御

Alexaの新機能 - Alexa Conversations、ディープリンクによるモバイルアプリ制御

原文(投稿日:2020/07/24)へのリンク

先日ベータ版がリリースされたAlexa Conversationsは、AIベースの新アプローチを採用することで、より少ないコードでカスタムスキルの作成を可能にすることを目的としている。同時にAmazonは、Alexaを使った携帯電話との対話を可能にするAlexa for Appsも発表した。

Alexa Conversationsは、ダイアログ管理に対するAI駆動の新しいアプローチです。カスタマが自然な、より制約の少ない方法 — 自由なフレーズ、自由な順番 — で対話可能なスキルを作成することが可能になり、あなたはエクスペリエンスのより価値の高い部分に集中することができます。

単純化すれば、Alexa Conversationsが解決しようとしているおもな問題は、自然な会話における会話状態と、考え得るすべてのダイアログパスの管理に必要なコードの組み合わせ的爆発である。会話を自然に感じるためには、スキルがユーザに対して、ひとつの発話に複数の答を提供すること、ユーザのインプットをシームレスに修正ないしオーバーライドすること、コンテキストの前後変化を処理すること、などが必要になる。

Alexa Conversationsは、Amazonによれば、開発者の提供した少数のサンプルから、あらゆる範囲のダイアログパスとフレージングバリエーションを外挿(extrapolate)することができる。これを実現したのは、コンテキストのバリエーションや状態管理をも考慮した、AIベースのテクニックの使用だ。サンプルダイアログを使ってAlexa Conversationsは、ハッピーパスやフレージングのバリエーション、一般的ではない言い換えをも含んだ、数万のダイアログを生成する、とAmazonは述べている。この巨大なデータセットが、ディープトランスフォーマベースのエンコーダ、再帰型(recurrent)ニューラルネットワーク、アテンション(attention)ベースのポインタネットワークなど、さまざまなディープラーニングニューラルネットワークのトレーニングに使用されるのだ。

トレーニングされたモデルは、全会話履歴、現在の状態、開発者APIの機能に基づいて、ダイアログの次のステップを予測できるようになります。それにより、入力の確認、不足情報の入力誘導、APIコールによるスキルを通じた情報取得、カスタマの指示への自然な対応など、会話を進めるアクションを行うことが可能になるのです。

Alexa Conversationsでスキルを定義する場合には、ダイアログを記述し、考えられるユーザの発話を構成してセットにして、最後に応答を定義する。一見したところでは、発話セットが特にConversationsの目新しい部分である。このセットでは発話を肯定、否定、引数通知、API起動の4つのカテゴリに分類することができる。この情報は、現実の会話において考えられるすべてのパスをConversationsが処理できるようにする、その方法のひとつになる。

前述のように、Alexa for Appsは、Alexaエコシステムにおいて、モバイルアプリとの声による対話を可能にする新機能である。この新機能ではディープリンクを使用しているので、ディープリンクをサポートする既存の全モバイルアプリのコントロールに使用することができる。

Amazonによると、検索のローンチや詳細情報へのアクセス、あるいはアプリの管理などが典型的なユースケースである。例えば、AlexaのTwitterスキルにトレンドトピックのリストを提示させた上で、携帯電話上のTwitterをローンチして特定のハッシュタグを検索するように指示することが可能になる。同じように、ユーザが自分のAlexaスキルを使ってUberの乗車を予約し、携帯電話上でその運転手の現在位置を表示させることもできる。

現在はまだベータ版だが、Alexa Conversationsは、開発者コンソール経由ですべてのAlexa開発者が利用できる。既存のアプリに追加することも可能だ。Alexa for Appsはまだプレビュー段階である。興味のある開発者はアーリーアクセスを要求することが可能だ。

この記事に星をつける

おすすめ度
スタイル

BT