Basho Technologiesは,時系列データの保存と分析を目的としたNoSQL分散データベースのRiak TSをリリースする。Bashoチームは先日のAWS re:inventイベントで,IoTデバイスが生成するデータ,金融および財務データ,科学的測定値など,時系列データの読み取りと書き込みに最適化されたRiak TSの提供を発表していた。
クラスタの全ノードが読み書き要求を処理可能な,マスタレスアーキテクチャを基本としたこの分散型データベースは,コロケーションやレプリケーションを自動的に行い,クラスタ間にデータを分散することで,パフォーマンスと高可用性を実現している。データアクセス要件に最適化されたレンジクエリも利用可能だ。
Riak TSはBashoのストレージインスタンスモデルとしては3番目のもので,他の2つのデータベース,Riak KV(キーバリュー型の非構造データのストアに使用する)とRiak S2 (ビデオや画像,その他ファイルなど,大規模な分散オブジェクトの格納に最適化されている)を補完する。
Riak TSデータベースは次のような機能を備える。
- シャーディングなしでクラスタへのノード追加が可能 - データは自動的に,クラスタ全体に均一に分散される。
- データコロケーションにより,時系列データを時刻,ジオハッシュ,あるいはその両方に基づいて同じノードに配置することにより,クラスタ内のホットスポットの発生を回避する。ディスク上のソート順序の定義に複合キー(時刻,ジオハッシュ,またはデータファミリに基づく)を使用して,読み込みパフォーマンスを向上することが可能。
- テーブルとフィールドを定義するDDL(Data Definition Language)では,構造化データと半構造化データの両方をサポートする。時系列データには型付けが可能であるため,開発者が独自のスキーマを定義することもできる。
- 入力データの検証機能によるデータの正確性保証。
- SQLライクなデータクエリ。
- APIとライブラリを使用したアプリケーション統合。JavaやRuby,Python,Go,Erlang,Node.js,.NETなど,さまざまな言語に対応する。
- ビッグデータ処理フレームワークのApache Sparkとのインテグレーション。時系列データの運用分析用にApache Sparkアドオンを使用する。
Riak TSは,Apache Sparkサポート,アドオン経由でデータキャッシュを行うRedis,分散検索クエリのApache Solrアドオンなどと共に,Basho Data Platfom(BDP)に統合される。
Riak TSあるいは他のRiakテクノロジについてもっと詳しく知りたいのであれば,コミュニティやドキュメントWebサイトを参照するとよいだろう。