Amazon Web Servicesは、Amazon Bedrock向けにマルチエージェントコラボレーション機能をリリースし、複数のAIエージェントが複雑なタスクで協力するためのフレームワークを導入した。このシステムは専門化されたエージェントがスーパーバイザーエージェントの調整の下で協力して作業することを可能にし、分散AIシステムにおけるエージェントオーケストレーションに関する開発者の課題に対処するものである。
この発表は、重要な技術的能力を強調している:「マルチエージェントコラボレーションを利用することで、専門的なスキルを必要とする複雑な多段階タスクに取り組む複数のAIエージェントを構築、展開、管理することができます」。このアプローチはエージェントシステムにおける一般的な開発のハードル、特にオーケストレーションの複雑さやリソース管理まわりに対処するものである。
AWSの実装は、「エージェントは各自専門分野内で働き、スーパーバイザーエージェントにより調整される。スーパーバイザーはリクエストを分解し、タスクを委任し、出力を最終的な応答に統合する」スーパーバイザーを基盤としたアーキテクチャを特徴としている。
このサービスは、以前はエージェント調整システムを手動で実装する必要があった開発者の技術的負担を軽減することを目的としている。AWSの内部テストデータは、単一エージェントアプローチと比較して、多段階タスクにおけるパフォーマンス指標の改善を示している。
出典:Multi-agent asynchronous orchestration
このプラットフォームは、自動化された調整メカニズムを通じてマルチエージェントシステムの課題に対処している。「効果的なマルチエージェントコラボレーションシステムを構築する上での重要な課題は、複数の専門エージェントを大規模に調整することの複雑さとオーバーヘッドを管理することである」とAWSは技術文書で述べている。
このサービスは、エージェント調整のために2つの異なる運用モードを実装している:スーパーバイザーモードとルーティング付きスーパーバイザーモードである。ルーティングモードでは、システムは簡単なクエリを専門エージェントに直接送信することでリクエスト処理を最適化する。複数のエージェントを必要とするより複雑なシナリオでは、システムは自動的にフルスーパーバイザーモードに切り替わり、包括的なタスク分解と調整を行えるようにする。
AWSは、トレースおよびデバッグコンソールを通じてデバッグ機能を統合し、開発者がエージェント間の通信を監視および分析できるようにしている。このプラットフォームは、エージェント間の並列通信パターンをサポートし、タスクの完了効率を最適化しつつ、システムの一貫性を維持する。
このプラットフォームの技術アーキテクチャは、2つのコラボレーション構成に基づいている。スーパーバイザーモードでは、スーパーバイザーエージェントが入力を分析し、複雑な問題を分解するか、リクエストを言い換える。その後、サブエージェントを直列または並列で呼び出し、知識ベースを参照したり、アクショングループを呼び出したりする。このアプローチにより、分散エージェント間の調整を維持しながら、複雑な多段階タスクの体系的な処理が可能になる。
技術文書では、エージェントの基本的な能力を定義している。生成AIの文脈において、「エージェント」とは、環境と相互作用し、データを収集し、複雑なタスクを実行して事前定義された目標を達成するための意思決定を行う自律的機能を指す。これらのシステムは、基盤モデルや大規模言語モデルを基にして、適応性のある目標指向の処理ユニットを構築する。
AWSはエージェントの認知アーキテクチャを強調している:「これらのエージェントは思考連鎖プロンプトなどの技術を使って、複雑なタスクの分解、計画、問題解決、意思決定に優れている。自己反省し、プロセスを改善し、ツールの使用や他のAIモデルとのコラボレーションを通じて能力を拡張できる」。このアプローチにより、独立した運用モードと協力的な運用モードの両方を通じて洗練された問題解決が可能になる。
AWSは「潜在的なバイアス、限られた推論能力、堅牢な監視の必要性などの重要な課題に対処することを目指している 」とグラフベースの表現を通じて述べている。このフレームワークは、「エージェントがグラフのノードとして表現され、各エージェントが独自の能力、目標、意思決定プロセスを持つ」ノードとエッジの構造を使用してエージェントの相互作用をモデル化している。
同社は「動的な変更が可能となり、サードパーティエージェントに対応する柔軟性を提供するプラグアンドプレイ機能」を強調している。このアプローチは、特にロボティクス、物流、ソーシャルネットワーク分析などの複雑な分野において、新しい要件や外部システムとの統合にシームレスに適応することを可能にする。
AWSは、柔軟で反復的な問題解決手法を表すエージェント的推論のコアコンセプトを強調している。反省、自己改善、ツールの活用といったデザインパターンを統合することで、同社はさまざまな分野で強化された能力を持つAIエージェントの開発を目指している。
しかし、AWSはマルチエージェントシステムにおける重大な課題を認識している。同社は、複雑なエージェント管理、予測不可能な創発的行動、システムの一貫性と安定性の維持における課題など、潜在的な制約を認識している。安全性、堅牢性、パフォーマンスの最適化は、広範な採用に向けた重要な考慮事項であり続けている。
AWSチームは、グラフ構造を使用したエージェント間の相互作用のより柔軟な表現を含む、マルチエージェントアプローチの主要な利点を特定している。彼らは、非線形のエージェントコミュニケーションを伴う複雑なワークフローを処理するシステムの能力や、大規模なマルチエージェントシステムに対するスケーラビリティの向上の可能性を強調している。
AWSのAIおよびデータ担当副社長 Swami Sivasubramanian博士は、サービスの急速な成長を強調し、こう述べている。
Amazon Bedrockは、顧客がリーディングモデルの幅広い選択肢、データを使った簡単なカスタマイズツール、組み込みの責任あるAI機能、そして高度なエージェントを開発する機能を求めてこのサービスに殺到する中、急速な成長を続けています。
この技術の実際の影響は、企業の導入においてすでに明らかである。AWSビルダー Raghvender Arni氏は、マルチエージェントオーケストレーションを使用して内部の開発者サポートを変革したNorthwestern Mutualとの説得力あるケーススタディをハイライトした。
マルチエージェントオーケストレーションフレームワークを導入することで、応答時間を数時間から数分に短縮し、サポートエンジニアが複雑な問題に集中できるようになりました、とArni氏は説明しています。
AWS Bedrockのマルチエージェント機能についてより深い洞察を求める開発者向けに、AWS re:Invent 2024のビデオセッションでは、スケーラブルな生成AIアプリケーションのために複数のエージェントを使用する際の詳細な技術概要が提供されている。技術者は、AWS BedrockでスマートAIエージェントを作成するためのAWSビルダーのDev.toガイドを通じて、詳細な実装戦略にアクセスできる。さらに、GitHubのamazon-bedrock-agent-samplesリポジトリは、マルチエージェントアーキテクチャを試してみたい開発者向けに実用的なコード例や実装テンプレートを提供している。