BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Precog: ビッグデータ分析サービス

Precog: ビッグデータ分析サービス

原文(投稿日:2012/10/03)へのリンク

 

Precogがビッグデータウェアハウジングおよび分析サービスを発表した。これはデータのキャプチャ、ストア、変換、分析、可視化といった処理とそれを実行するインフラを提供するものだが、RESTful APIを通した様々なアクセスが可能になっており、開発者やデータサイエンティストは全プロセスをコントロールすることができる。

Precogは、SQLデータベース、Amazon S3、Hadoop、MongoDB、クライアントサイドWebアプリケーション、バックエンドサーバなど、様々なソースからやってくるインプットデータをキャプチャする。RESTful APIを使うことで、開発者はTwitterやFacebookなどの外部ソースからのデータや、CSVファイルやモバイルデバイスからのデータをキャプチャできる。キャプチャされたデータはPrecogDBと呼ばれるカスタムデータベースに格納され、人口統計、センチメント、位置など、各種属性を付加できる。

データは、API経由やクライアントライブラリ (JavaScript, PHP)経由で、もしくは宣言型クエリ言語Quirrelを使ったデータ分析用IDEのLabcoatを使って分析できる。開発者はデータキャプチャや修飾、分析のための独自モジュールを作ることができ、それをマーケットプレイスで販売することもできる。

弾力性と可用性を高めるため、Precogはクラウドプロバイダ - Amazon EC2とSoftLayer - の組み合わせで全プロセスを実行する。

PrecogのCEOであり創業者のJohn A. De Goes氏は、InfoQとのインタビューで次のように説明した。「(システムの)アーキテクチャはカラム指向ストレージを含む分析データベースのアーキテクチャに似ていますが、完全に異機種や非正規のデータをサポートしているところ、そしてQuirrelをサポートしているところが違います。 Quirrelとは「ビッグデータのためのR」言語です。これを使えば、分析RDBMSを使ってやれることよりもずっと高度な計算を簡単に実行できます。」

プラットフォームの中心にあるのはPrecogDBだ。これはScalaで書かれ、JVM上で動作する、データキャプチャと分析に最適化されたカラム型データベースだ。De Goes氏はこう語る。「PrecogDBは、クリック、購入、計測、ツイートといった各種アクティビティの測定データを格納します。これが履歴アクティビティのジャーナルとなります」。彼はこう言い添えた。「Precogは、まだバイオインフォマティックスといったアプリケーションに必要とされる巨大な構造化データを格納できませんが、この機能はロードマップに入っています。」

Precogによって実装された統計的クエリ言語Quirrelについて、De Goes氏はこう語る。「多くの点で、QuirrelはRプログラミング言語に似ています。Rと同様、Quirrelは高度な分析・統計ができるよう設計されています。Rと違って、Quirrelはチューリング完全言語ではなく、純粋に宣言的な言語です。これにより効率よくQuirrelクエリを大量のマシンクラスタに分散できます(また、そのおかげで、QuirrelはRよりもずっと学びやすくなっています)。」

またPrecogDBには「よくある分析・統計計算をするための組み込みルーチン」と「PrecogDBをモバイルデバイスやWebアプリケーションから直接REST APIでアクセス可能にする、粒度の細かなケーパビリティベースのセキュリティモデル」も備わっている。

 

関連するコンテンツ

BT