Amazonは生成AIタスク向けに設計された基盤モデルのファミリーAmazon Novaを発表した。AWS re:Inventの中に行われたこの発表は、ドキュメントやビデオの分析、チャートの理解、ビデオコンテンツの生成、AIエージェントの開発といったタスクにおけるモデルの能力をハイライトしている。
Amazon Novaには、理解モデルとコンテンツ生成モデルの2つの主要カテゴリーがある。
現在利用可能な理解モデルは以下の通りだ:
Amazon Nova Micro:速度とコストを最適化、このモデルは低レイテンシーでテキストのみを処理する。
Amazon Nova Lite:画像、ビデオ、テキストを処理できるマルチモーダルモデルで、テキスト出力を低コストで生成する。
Amazon Nova Pro:高容量タスク向けに設計、このモデルは最大300,000入力トークンを処理でき、大規模なコードベースや複雑なデータを扱うことができる。
第4の理解モデルであるAmazon Nova Premierは現在開発中で2025年初頭にローンチされる予定だ。複雑な推論タスクに焦点を当て、カスタムアプリケーションの教師モデルとして機能する予定だ。
コンテンツ生成モデルには以下が含まれる:
Amazon Nova Canvas:画像生成に加えてインペインティング、アウトペインティング、背景除去などの高度な編集機能を備える。
Amazon Nova Reel:テキストや画像のプロンプトに基づいて短いビデオを作成し、視覚的スタイルやペーシングのカスタマイズ・オプションを提供する。
Amazon Novaのローンチは開発者コミュニティから大きな注目を集めており、多くの人がそのパフォーマンスとコストのバランスを賞賛している。
著名なソフトウェアエンジニアでDjangoの共同創設者Simon Willison氏は、Xで感想をシェアし、述べた、
私は昨日、新しいAmazon Nova LLMファミリーの探索に時間を費やし、非常に感銘を受けました。価格と品質はGoogle Geminiと競争力があり、Nova Microは主要ベンダーの中で最も安価なモデルとなっています(Gemini 1.5 Flash-8Bより安価です)。
RedditユーザーFarkCookies氏はこうコメントした:
配置から判断すると、AWSの別の自社開発モデルでしょうか?Titanの隣にありますし。
Amazon Novaのモデルは、安全性とセキュリティにフォーカスして構築されており、誤報や有害なコンテンツなどの悪用に対する安全策が組み込まれている。生成された出力には責任ある利用を促進するための電子透かしが含まれている。
これらのモデルは200以上の言語をサポートし、多様な地域にわたるグローバルなアプリケーションを可能にする。デプロイメントのために、Amazon Bedrockはリアルタイムストリーミング、バッチ処理、Amazon Bedrock Knowledge BasesやGuardrailsのようなツールと統合する機能を提供している。開発者はAmazon Bedrockコンソールを通してこれらのモデルを探索し、ワークフローに統合し、詳細なモニタリングとフィードバックツールを使ってパフォーマンスを最適化できる。