先日のre:Inventで、AWSは第4世代のGravitonプロセッサを搭載したメモリ最適化R8g Instancesのプレビューを発表した。この新しいInstancesは、データベース、インメモリキャッシュ、リアルタイムのビッグデータ分析など、メモリ集約型のワークロード向けに設計されている。
クラウドプロバイダーによると、Graviton4プロセッサは、すべての高速物理ハードウェアインターフェースを完全に暗号化し、Graviton3プロセッサーと比較して、最大30%優れた演算性能、50%多いコア数、75%多いメモリ帯域幅を実現するという。新世代のR8gインスタンスは、最大96個のNeoverse V2コア、コアあたり2MBのL2キャッシュ、12個のDDR5-5600チャンネルを搭載する。AWSの副社長兼チーフエバンジェリストであるJeff Barr氏はこう述べている。
Graviton4プロセッサーはまた、前世代からのすべてのセキュリティ機能をサポートしており、暗号化された高速ハードウェア・インターフェースやBTI(Branch Target Identification)を含むいくつかの重要な新機能も搭載している。
報道発表によると、Graviton4 InstancesはGraviton3 Instancesよりも大規模なJavaアプリケーションで45%高速化できると発表されているが、詳細やベンチマークは示されていない。Honeycomb のフィールド CTO である Liz Fong-Jones 氏は 新しいインスタンスを評価する機会がありました。彼女はこうコメントしている。
私たちのGoベースのOpenTelemetryデータインジェストワークロードは、Graviton3ベースのC7g/M7g/R7gInstancesと比較して、Graviton4ベースのR8gInstancesでは25%少ないレプリカを必要とし、さらに中央値遅延で20%、99%平均値遅延で10%の改善を達成した。
コミュニティーの反応はさまざまで、性能に関する主張に疑問視するユーザーもいれば、価格情報がないことに懸念するユーザーもいる。Graviton3Instancesは通常Graviton2Instancesよりも高価であるため、これは重要である。ユーザーのLunaSea氏はHackerNewsに次のようにコメントしている。
まだGraviton3はほとんどの地域で、特にRDS側で利用できないので、本当に期待していない。
Graviton4は、会議中にAWSによって明らかにされた唯一の特注ハードウェアではなかった。FMとLLMのディープラーニング・トレーニング用の第2世代アクセラレータであるTrainium2は、前世代のチップと比較して、最大4倍のトレーニング性能と3倍のメモリ容量を実現するように設計されている。Trainium2はTrn2 Instancesで利用可能となる。AWSのCEOであるAdam Selipsky CEO氏は、X(旧Twitter)にこう書いている。
AWSのチップは、re:InventでGraviton4とTrainium2を発表した際に、前面に出て注目を集めた。Graviton4は、当社がこれまで開発した中でもっともパワフルでエネルギー効率の高いチップだ。Trainium2は、当社の顧客が生成AIモデルをより迅速に、よりコストパフォーマンスを高く学習できるようになった。Amazonが最初に自社チップの開発を始めたのは10年前だった。私は、AWS上の簡単なサンプルとサービスを使って、AIサービスを扱うソフトウェア開発者の課題を提示するのが好きだ。
Gravitonプロセッサーに関する複数のセッションがカンファレンス中に行われ、その録画がYouTubeで公開されている。c8gInstancesは現在、先行公開されている。