先日のブログ記事でAmazonは、AWS Data Exchangeという名称の、データのパブリッシュ/サブスクライブを行う新たなマーケットサービスを公開した。このサービスは既存のAWS Marketplaceのアドオンで、80以上のデータプロバイダが提供する、1,000を越えるライセンスデータプロダクトを格納する。データには無償と有償で提供されるものがあり、内容は金融サービスや医療、生命科学、地理空間、気象、地図など多岐に渡る。
このマーケットプレースサービスは、提供側(パブリッシャ)と利用側(サブスクライバ)の両方を対象としている。Amazonの役割はスケーラブルなプラットフォームの提供である。データプロバイダがバンドルしたデータを、Amazonが一貫した方法でサブスクライバに提供する。
POI(Point of Interest)データセットをUberやFacebook、Appleといった企業に提供するFactualでは、カスタマへのデータ提供にAWS Data Exchangeを使用している。最高売上責任者(CRO)のRob Jonas氏は、同社がデータセットの提供手段としてAWS Data Exchangeサービスを選択した理由について、次のように説明している。
AWSのユーザであれば、52カ国から13,000万以上のPOIを収集したFactualの高品質なPlacesデータセットを、AWS Data Exchangeから直接ライセンスすることができます。 国別にパッケージされたデータセットを簡単に検索し、購入することが可能であるだけでなく、自らのビジネスニーズに合わせてカスタマイズされたPOIデータセットを要求することもできます。当社のチームは、考えられるすべての購入前および購入後サービスを提供することで、ユーザの製品強化、コンテキスト対応とパーソナライゼーションの推進、競争力のあるカスタマエクスペリエンス構築のためのニーズの充足を確実なものにします。
AWSクラウドのスケーラビリティを活用しているため、データセットへのアクセスは簡単だ。AWSチーフエバンジェリストのJeff Barr氏が説明する。
私たちの住む世界はデータに溢れています。データが世界を動かしているのです!あらゆる種類の企業がデータを収集、保存、処理、分析して、意思決定プロセスへの情報提供の改善の手段として用いています。極めて大規模なストレージ、想像できる限りのコンピュータパワー、多種多様な分析ツールを提供するAWS Cloudは、これらの活動すべてにおいて最適です。
画像引用元: (スクリーンショット) https://www.youtube.com/watch?v=Lu9QVJ0Rml4
データセットの導入を検討中の企業は、オンラインのプロダクトカタログから購入することができる。カタログではベンダ(データパブリッシャ)や価格によるフィルタリングや、検索機能の使用が可能である。
画像引用元: https://aws.amazon.com/blogs/aws/aws-data-exchange-find-subscribe-to-and-use-data-products/
購入するデータフィードを選択すると、そのデータの配信を希望するAmazon S3バケットを送信先として選択することができるようになる。データがS3バケットに格納された後は、AWS Lambdaなど、さまざまなAWSサービスを使用してデータの解析や強化を行うことが可能だ。Lambda関数の処理結果はAmazon DynamoDBテーブルに送信して、長期的に保存することができる。さらには、AWS GlueなどのETLプロセスをAmazon Athenaで使用することも可能で、AWS Glue ETLジョブをクエリした結果をAmazon QuickSightダッシュボードにロードすることができる。
データパブリッシャの観点からは、データセットを発行するにはAmazonの承認が必要となる。承認を受けた後は、AWS Data Exchangeデータセット生成ウィザードを実行すればよい。データはS3ロケーションから、または手動でアップロードすることができる。その後は、データセットをマネタイズする方法を選択する必要がある。マネタイズのオプションには、個々の顧客むけにプライベートライセンスプランを提供する方法と、すでに契約を締結している組織向けに、顧客独自のサブスクリプションサービスをAmazonが提供する方法がある。
画像引用元: https://aws.amazon.com/blogs/aws/aws-data-exchange-find-subscribe-to-and-use-data-products/
一部のデータセットについては、AWS Data Exchangeへの参加を禁止している。これについてBarr氏は、次のように説明する。
特定のカテゴリのデータは、AWS Data Exchangeに置くことを認めていません。例えば、ある人物の特定に使用可能な情報は、その情報が法的に公開可能なものでない限り、データプロダクトに含むことはできません。掲載可能なデータのカテゴリに関する詳細なガイドラインは、Publishing Guidelinesを参照してください。
また、データプロバイダは、米国あるいはEU加盟国に居住する有効な法人でなければならない。