BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース "Microsoft Copilot Studio"で、ビジネスアプリケーションのAI主導型会話インターフェースを実現

"Microsoft Copilot Studio"で、ビジネスアプリケーションのAI主導型会話インターフェースを実現

原文リンク(2024-02-13)

Microsoftは先日Ignite 2023でローコードツール"Microsoft Copilot Studio"を発表した。Copilot Studioのユーザーは、スタンドアロンのCopilotの構築も、Microsoft Copilot for Microsoft 365をカスタマイズもできる。

Copilot Studioは、エンドツーエンドの会話型AIプラットフォームであり、IT専門家やメーカーが自然言語またはグラフィカル・インターフェースを使用してCopilotを作成し、カスタマイズできるようにする。Copilot Studioのユーザーは、Copilotを設計、テスト、公開することができ、その後、Microsoft 365のコンテキスト内やカスタムエンタープライズ目的で活用できる。

画像

スタンドアロンのCopilotは、会話型インターフェースを通じてユーザーの自然言語による問い合わせに対応するアプリケーションである。Copilotは、ユーザーとの対話を処理するだけでなく、認可されたデータベースから情報を取得したり、ユーザーに代わって外部システムでアクションを実行したりする必要がある場合もある。Copilot Studioは、Microsoft Power Virtual Agentと同じオーサリングキャンバスを使用する。

画像

メーカーは、会話型ダイアログをノードのツリーとして実装し、各ノードはアクション(例えば、ユーザへの情報表示、ユーザへの質問、APIの呼び出し、Power Automateフローの実行)を表す。ダイアログツリーの一部(またはすべて)をトピックに構成することができる。多くの場合、トピックには*トリガーフレーズ(*トピックが扱うニーズを表現するためにエンドユーザーが使用する可能性のあるフレーズ、キーワード、質問)がある。

画像

Copilot StudioのAIは、エンドユーザーの自然言語入力を分析し、設定された各トピックに信頼度スコアを割り当てる。トピックの信頼度スコアは、ユーザー入力がトピックのトリガーフレーズにどれだけ近いかを反映する。

信頼度スコアが信頼度しきい値(たとえば85%)を超えるトピックが複数ある場合、エンドユーザーに該当するトピックを選択するよう求めることができる(曖昧性解消メカニズム)。信頼度のしきい値をクリアしたトピックが 1 つしかない場合、そのトピックのダイアログが即座に実行される。Microsoft Copilot Studioは、自然言語の理解をAzure AI Language Studioのツール群に委ねることもできる。

メーカーは、トピックダイアログ内で大規模な言語モデルの生成機能を使用できる。Microsoftのプリンシパル・プロダクト・マネージャー、Gary Pretty氏は、ホーランド・アメリカ・ライン(米:シアトルに本拠を置くクルーズ会社)の見込み客が、クルーズに関する情報をスタンドアローンのボットに問い合わせる方法を実演した(「クルーズにパスポートは必要ですか」など)。メーカーは、*www.hollandamerica.com*を重要な情報源として参照するだけで、数回クリックするだけでそのボットを作成できる。ボットはエンドユーザーの入力を生成モデルに渡し、参照されたコンテンツを使用してクエリに答える(例えば、「はい、クルーズにはパスポートが必要です[...]」)。会話は、ボットがコンテキストと会話履歴を追跡しながら続けられるので、ユーザーは暗黙的または明示的に過去の情報を参照できる。

このユースケースは、ChatGPTのような生成モデルで広く見られるものに対応している。しかし、今回は、ボットの回答は参照されたコンテンツに根拠がある。このような根拠は、ボットからの誤った回答を減らすのに役立つかもしれない。

Copilotは、アプリケーション・プログラミング・インターフェースに自然言語インターフェースを提供することもできる。ボットがユーザーに既存の予約の有無を尋ねる「エクスカーションを取得する」トピックは非常に詳細である。その後、ユーザーは予約番号を入力する。その後、ボットは(Power Automateを通して)関連するAPIを呼び出し、その結果を表示する。しかし、ゴール指向のアプリケーションでは、ゴールの複雑さ(ステップ数、条件や分岐、エラーやエッジケースの管理など)に相関する、ドメイン固有のハンドクラフトが必要になる場合がある。

Microsoftのプリンシパル・プロダクト・マネージャーであるDavid Conger氏は、Ignite 2023で、ユーザーの目標を達成するためのAPIの複雑なオーケストレーションの例を示した。Microsoft 365 Copilotは、テキスト文書からパワーポイント・プレゼンテーションを作成し、その文書をコマンドで修正できる。Conger氏は、実行すべきステップを正しく特定し、特定したアクションを安全に実行し、エラーから回復するために、MicrosoftはLLMに適したOffice用のドメイン固有言語(ODSL)に頼ったと説明した。Microsoft 365 Copilotは、LLMが正しいODSLプログラムを作成できるように、関連情報を含むプロンプトをトークン制限内で動的に作成する。その後、ODSLプログラムは解析、検証(自動コード修正)され、ネイティブのOffice APIにトランスパイルされ、実行される。

間違いなく、多くの企業ユースケースははるかにシンプルで、コードなしのアプローチに適している。生成AIとノーコード・オーサリング・ツールの組み合わせは、最も単純なユースケースにとっては魅力的なデモとなる。しかし、テクノロジーの購入者は、テクノロジーに付随するライセンス、コンフィギュレーション、ノーコード開発コストを、特定の企業にとって具体的で価値のあるユースケースと関連付けたいと思うかもしれない。

Copilotは、Microsoft Teams、Webサイト、Skypeなど、さまざまなチャネルを通じて配布できる。Microsoft Copilot for Microsoft 365は、Copilot Studioで作成したコピロットも活用できる。

メーカーは多言語Copilotを使用することもでき、すべてのコンテンツを1つのCopilotに収めながら、異なる言語の顧客とコミュニケーションできる。多くの場合、このようなCopilotは、ユーザーのWebブラウザーの設定に基づいて希望の言語を自動的に検出し、同じ言語で応答できる。

Microsoft Power Virtual Agents(別名Power VA)の機能は、Microsoft Copilot Studioに完全に含まれている。Copilot Studioは、Microsoft Azure OpenAI Studio、Azure Cognitive Services、Azure Bot Service、その他のMicrosoft会話AI技術と統合されている。Copilot StudioとCopilot for Microsoft 365の統合は、現在パブリックプレビューで利用できる。

作者について

この記事に星をつける

おすすめ度
スタイル

BT