昨年4月にプレビュー版として発表されたBedrockだが、アマゾンはジェネレーティブAIアプリ向けのフルマネージドサービスの一般提供を発表した。
GAリリースと同時に、アマゾンはMetaのLlama 2 13Bと70Bパラメータモデルの近日中の提供開始も発表している。
Llama 2モデルは、オリジナルのLlamaモデルよりも40%多いデータで学習され、より大きなドキュメントを扱うために4,000トークンという長いコンテキスト長を持つなど、大幅に改良されています。
AWS Bedrockには、AI21 Labs、Anthropic、Cohere、Stability AI、アマゾンで開発されたいくつかの基盤モデルが含まれており、AWSインフラ上で実行するジェネレーティブAIアプリケーションを作成するためにAPIを通じて使用できる。
Amazon Titan Embeddingsは、テキストをエンベディングと呼ばれる数値表現に変換する大規模言語モデル(LLM)で、検索、パーソナライゼーション、RAG(検索拡張生成)のユースケースを強化します。
検索拡張生成は、外部の知識ソースに接続することによってモデルの能力を拡張することを可能にする技術である。
ユースケースやプロンプトの例を読み込むことができるAmazon Bedrockコンソールを使用するか、プレイグラウンドを使用して、基礎モデルが提供する機能を調べることができる。Bedrockプレイグラウンドでは、会話型インターフェースを使用して、チャット、テキスト、および画像モデルと連携し、さまざまなプロンプトエンジニアリング技術や推論設定パラメータを試すことが可能だ。
効果的なプロンプトエンジニアリングとは、FMから最大限の情報を引き出し、適切かつ的確な回答を得るために、完璧なクエリを作成することです。一般的に、プロンプトはシンプルでわかりやすく、曖昧さを避けるべきです。また、プロンプトの中で例を示したり、より複雑なタスクを推論するようモデルに促したりできます。
AWS Bedrockは、外部データソースを既存のAPIに接続する特定のタスクを実行するためにエージェントを使用できるため、単なる自然言語処理を超えたアプリの作成が可能になる。エージェントは、Amazon Titanのテキスト生成モデルやStability AIのStable Diffusion XLの画像生成モデルとともに、プレビュー版でのみアクセス可能である。
これに関連して、AWSはCodeWhispererコーディングAIの機能を拡張し、顧客の内部コードベースとリソースを活用して、カスタマイズされたレコメンデーションの提供を可能にしている。