最近、AWSは、Amazon SageMaker Feature Storeと呼ばれるAmazonSageMakerの新機能を発表した。フルマネージドの特定の目的のために構築される専用リポジトリである。この新しいAmazon SageMaker機能を使用すると、顧客は、トレーニングと推論のための機械学習(ML)機能の保存、更新、取得、共有が簡単にできるリポジトリを作成できる。
Amazon Feature Storeは、クラウドベースの機械学習プラットフォームに対する9つの重要なアップデートの1つである。Amazon SageMakerは毎年開催されるre:Inventで発表された。Feature Storeにより、同社は複数のモデルにマッピングされるフィーチャーを保存するという問題を解決することを目指している。Amazon SageMakerの新機能によって、開発者やデータサイエンティストのチーム間でフィーチャーの集合に対する名付け、整理、検索、共有をより簡単にできるフィーチャーに、顧客がアクセスして共有できるようになる。さらに、Feature StoreはMLモデルが実行される場所の近くにあるSageMaker Studioに存在する。したがって、新しいAmazom SageMaker機能に関するAWSプレスリリースによると、推論に対する遅延が1ミリ秒台となる。
Amazonの人工知能と機械学習のエバンジェリストであるJulien Simon氏は、Amazon SageMaker Feature Storeに関するブログ投稿に次のように書いている。
Amazon SageMaker Feature Storeは、リアルタイム推論のための高速で効率的なアクセスのために設計されています。15キロバイトのペイロードに対してP95レイテンシは10ミリ秒未満です。これにより、予測時に設計済みフィーチャーをクエリし、アップストリームアプリケーションによって送信された元々のフィーチャーを、モデルをトレーニングするために使用したフィーチャーとまったく同じものに置き換えることができます。
出典: https://docs.aws.amazon.com/sagemaker/latest/dg/feature-store.html
ユーザは、設計済みフィーチャーをフィーチャーグループ(テーブルの行に似たレコードのコレクション)にグループ化することで、Amazon SageMaker Feature Storeに整理して保存できる。フィーチャーグループの各レコードには一意の識別子がある。そして、元のデータソースのうち、データインスタンスの1つに対して設計済みフィーチャーの値を保持する。さらに、ユーザは、フィーチャーグループごとに一意の独自のAWS Key Management Service(KMS)キーを使用して、保存データを暗号化することを選択できる。
Intuitのデータプラットフォームのエンジニアリング担当副社長であるMammad Zadeh氏は、新しいAmazon SageMaker機能に関するAWSプレスリリースで次のように述べている。
Amazon SageMaker Feature Storeのリリースに向けてAWSと緊密に連携してきました。組織全体で複数のフィーチャーリポジトリを維持する必要がなくなるという、フルマネージドフィーチャーストアのビジョンにワクワクしています。当社のデータサイエンティストは、中央ストアの既存のフィーチャーを使用して、チームやモデルの全体に対してフィーチャーの標準化と再利用の両方を推進できるようになります。
また、Constellation Research Inc.の主席アナリスト兼副社長であるHolger Mueller氏は、InfoQに次のように語っている。
AIモデルの構築は難しいプロセスです。たくさんある課題の1つは、特定の再利用可能なアルゴリズムが、多数のデータを実行している間に、および時間の経過とともに特定できなくなる可能性があるということです。Amazonは、SageMaker Feature Storeでこれに対処しています。AIモデルのライフサイクルで実行されるさまざまなAIモデル間で再利用可能なアルゴリズム(「フィーチャー」)のリポジトリを作成できます。
現在、Amazon SageMaker Feature Storeは、南北アメリカとヨーロッパのすべてのAWSリージョン、およびアジア太平洋地域の一部のリージョンで一般向けに利用可能である。間もなく他のリージョンも追加される。さらに、新機能の詳細とサンプルノートブックはドキュメントページで入手できる。フィーチャーの価格は、フィーチャーの読み取りと書き込み、および保存されているデータの合計量がベースとなる。