SQL Server 2011の列ベースのストレージ

原文(投稿日：2011/03/08)へのリンク

ほとんどの主要なデータベースと同じように、SQL Serverはクラスタインデックスを持っているときは、テーブルをB木で保持する。それ以外の場合はヒープを使う。この2つの方法は行に基づいて行われる。この場合、ページ当たりの行数は行全体のサイズに依存する。しかし、SQL Server 2011からはもう一つの選択肢が利用できる。“カラムストアインデックス”を利用することで、SQL Serverは行の代わりに列を元にデータを保存する。

Microsoftの発表では、14億4千万の行を保持する1TBのテーブルを利用するとき、列指向の問い合わせを実行すると、CPU時間で16倍のスピード改善と455倍もの経過時間の改善が見られたということだ。実質的には501秒かかっていた問い合わせが1.1秒までに改善するということだ。このテストは256GBのメモリと32の論理プロセッサを持ったマシンで実施された。

この劇的な改善は各列をそれぞれのページに分離することで実現されている。問い合わせが実行されると結果セットの列だけがディスクからロードされる。対象以外の列が含まれるページは単に無視される。

あらゆる列の組み合わせのカバリングインデックスを保持することと似ている。しかし、この方法だとハードディスクを大量に利用する必要はない。容量は従来のテーブルよりも少なくて済む。SQL Serverのデータ圧縮はページレベルで発生する。また、行よりも列の方がデータが重複している可能性が高い。したがって、カラムストアインデックスを使ったテーブルは高い圧縮率が期待できる。

しかし、カラムストアインデックスを使うかどうかは簡単に決定できない。何よりもまず更新ができない。一度カラムストアインデックスを作成すると、テーブルに対して追加、更新、削除ができなくなる。Microsoftは、毎日の更新作業や読み取り専用データで利用されることをが想定している。更新作業ではインデックスをドロップし、データを更新して、インデックスを再作成するという使い方になる。これは大変な作業になるので、データの変動を論理テーブルの一部分の中だけに抑えるため垂直のパーティショニングをすることもできる。

また、カラムストアインデックスを使うことで性能が劣化する可能性もある。ほとんどの列を扱うような問い合わせをすると行の再結合に膨大な時間がかかるからだ。つまり、OLTPのような問い合わせはOLTPであるがゆえに利用に適さない。言い換えれば、“SELECT *”やひとつの行のすべての値を一度に取り出すような問い合わせをしているなら利用には適さない。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは Architecture です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

Mezzalira氏のQCon London講演：「マイクロフロントエンド～設計から企業メリットと社内実装まで～」

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

QCon London

QCon AI Boston

QCon San Francisco