BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Cassandra 1.0.0.は企業向けに準備万端

Cassandra 1.0.0.は企業向けに準備万端

原文(投稿日:2011/10/21)へのリンク

ApacheはCassandra 1.0.0を発表した。データ圧縮といくつもの性能改善と最適化が行われたこの分散列指向データストアは初の大きなマイルストーンに達した。

CassandraはApacheのオープンソースプロジェクトであり、AmazonのDynamoやGoogleのBigTableのような列指向ベースデータモデルの基礎にある分散的な性質の上に構築されたスケーラブルなデータベースマネジメントシステムだ。Cassandraは最初、Facebookによって開発されていたが2008年にオープンソースになり、それから開発され続けている。Apacheは最近、最初の大きなマイルストーンであるCassandra 1.0.0を発表した。これは多くの機能追加やバグ修正がされている。

期待されていた機能のひとつは圧縮だ。ColumnFamily単位でのCassandra 1.0はデータ圧縮をサポートする。ColumnFamilyは従来のリレーショナルDBのテーブルと同じような列のコンテナだ。圧縮のプロセスはバックグランドで走り、ノードの応答時間が劣化することはない。圧縮することでデータ量が2分の1から4分の1になる。結果、Pavel Yaskevich氏によれば読み取りで間接的に25-35%の性能改善、書き込みで5-10%の性能改善があった。

Apache CassandraプロジェクトのVPであるJonathan Ellis氏によればCassandra 0.6から1.0からで大きく改善されたのは性能だ。“2010年のリリースと現在のリリースを比べると、書き込みの性能は40%も改善しました。しかし、改善に注力したのは読み込みの性能です。結果、驚くべきことに400%も改善しました。”

他の改善点は、

オフヒープキャッシュやアリーナアロケーション、自動自己チューニングによるメモリ管理の改善。GCでの停止を抑制し、性能が予測可能になった(詳細)。

ディスクスペース管理の改善。コミットログで使われるスペースの制御の改善と使われていないデータファイルの即時削除。

より性能が予測しやすく、固定のSStableサイズの新しいコンパクション方式(詳細)。

Hinted Handoffの改善。読み取りリペアの必要性を抑制して読み取りの性能を改善した。

多くの性能改善(詳細)、CQL、リペア、より簡易な運用など。

Cassandraは現在、Cisco、DiggFacebookRackspaceRedditTwitterなどで使われている。最大のクラスタでは100TBのデータを持ち、150マシンの上で動作している。

この記事に星をつける

おすすめ度
スタイル

BT