Amazonは、SageMaker Ground Truthがシンプルなラベリングワークフロー、追加のラベリングベンダーのサポートを提供し、アジア太平洋(シドニー)AWSリージョンで利用可能になると発表した。それによって、アメリカ、ヨーロッパ、アジアで合計6つのAWSリージョンでサポートされる。
AWS re:Invent 2018で発売されたSageMaker Ground Truthは、AmazonのSageMakerサービスで使用するために設計されたツールのセットを提供する。それによって、顧客がトレーニング機械学習システムに必要なデータセットに効率的かつ正確にラベル付けすることができる。さらに、AWSテクニカルエバンジェリストJulien Simonからの発表に関するブログ投稿によると、SageMaker Ground Truthは自動ラベリングを使用して顧客のラベリングコストを最大70%削減することができる。さらに、SageMaker Ground Truthを使用することで、画像分類、オブジェクト検出、セマンティックセグメンテーションなどのためのデータセットを構築できる。
Source: https://aws.amazon.com/sagemaker/groundtruth/
SageMaker Ground Truthのリリース以来、AmazonはT-Mobile、Pinterest、Change Healthcare、GumGumなどのさまざまな顧客からフィードバックを得ている。これらの顧客からの意見を基に、AmazonはSageMaker Ground Truthを以下のような機能でさらに更新する。
- ジョブチェーン - 開発者が以前のジョブの出力を使用して後続の機械学習ラベリングジョブを実行できるようにすることで、開発者が時間を節約できるようにする。
- ジョブの追跡 - 開発者がラベリングジョブの進捗をリアルタイムで追跡できるようにする。
- 長期ジョブ - 人間の専門家はラベラーとなり、モデルを定期的に更新する。
- 動的カスタムワークフロー - ソースデータに追加のコンテキストを追加できるようにする。つまり、開発者は以前のラベリングジョブからの入力を追加できる。
これらの機能により、T-Mobileではデータサイエンティストが他のタスクにさらに集中できるようになっている。T-Mobileのエグゼクティブバイスプレジデント兼最高情報責任者(COO)のCody Sanfordは、WSJの記事で次のように述べている。
私たちはデータサイエンティストが膨大な時間をかけて何千ものメッセージにラベルを付けていました。Ground Truthはそれを非常に効率的にすることができました。そして今や我々は我々の熟練したデータ科学者が手でデータにラベルをつけることを必要としません。
これらの機能に加えて、Amazonはフランス語、ドイツ語、スペイン語のデータラベリングのサポートを追加するためにViveticやSmartOneを含む新しいサービスプロバイダと協業している。
Amazon SageMaker Ground Truthは、バージニア、オハイオ、アイルランド、東京、シドニーを含む6つのAWS地域で利用可能になった。また、Amazon SageMaker Ground Truthの価格の詳細は、価格ページにある。