もしあなたが Western Digital 製のディスクを使っていて,そのモデル名に "EARS" という文字が含まれていたなら,そのパフォーマンスの低さにすでに悩まされているかも知れない。問題の原因として最も可能性が高いのは,Western Degital がコンシューマ向けディスクに新たに採用した Advanced Format Technology (PDF) である。通常のディスクがユーザデータを 512 バイトの物理セクタサイズ で記録しているのに対して,Western Digital の Advanced Format Technology は 4096 バイト (4Kバイト) 単位のデータセクタを使用する。ディスク上のデータ配置形式(アライメント)は,ハードウェアの性能を最大に引き出すために重要なものだ。不適切なデータアライメント設定は必要な read/write 回数を増やし,結果的にパフォーマンス低下を引き起こす。他のベンダが同様な 非 512 バイトセクタのディスクを出荷するのは時間の問題なので,この問題には遅かれ早かれ気付くことになるだろう。
以下は Linux カーネルプログラマ Teodore Ts'o 氏 のブログからの引用である。
この問題が当初考えていたよりも難しいものであることは明らかです - Linux のストレージスタックは,その大部分がパーティションのアライメントや論理ボリュームを考慮した構造にはなっていないのです。[...] この種のアライメントはハードウェア RAID あるいはソフトウェア RAID を使用する場合,とりわけ RAID 5 において重要です。ストライプ境界に合わせて書き込みが行われれば,read-modify-write というオーバーヘッドの回避が可能だからです。
ハードウェアレイヤ(コントローラなど)だけでなく ソフトウェア (ドライバ,パーティショニングソフトウェア,...)においても,512 バイトのセクタサイズが想定されていることが考えられる。その問題回避と後方互換性実現のために Western Digital のドライブでは,実際の物理セクタサイズを偽る方法が採用されている。つまり物理的な 4K バイトセクタ値を上位レイヤに対して返す代わりに,ファームウェアが 512 バイトセクタを内部的にエミュレートするのだ。しかしこの方法は,上位レイヤのデータアライメントが 4K バイトセクタに適さない場合には,先程説明したパフォーマンスの問題を即座に発生させる。512 バイトの論理セクタと 4K バイトの物理セクタを持ったディスクに対して,そのアライメントに合わない方法で部分的な書き込みが行われるため,結果的に read-modify-write のオーバーヘッドが発生するからだ。
Vista 以降の Windows は,先頭パーティションを 2048 セクタから開始しているので 4K バイトディスクへのアライメントには適している。しかしそれ以前の Windows や 有名な Linux パーティショニングソフトウェアの旧バージョンでは,先頭パーティションを デフォルトで 63 セクタから開始する ものが多い。63 は 8 (4096 を 512 で分割した値) で割り切れないため,ここに問題が発生する。Windows ユーザならば Western Digital のツール を利用して,問題のあるディスクのデータアライメントを調整することが可能だが,それ以外のオペレーティングシステムのユーザはインテグレーションテストの一部としてパーティションテーブルのレイアウトを確認し,必要に応じて修正する必要がある。
いずれにしてもハードウェアの最大性能を引き出すためには,パーティションテーブルからファイルシステム全体,ソフトウェア RAID や 論理ボリューム管理 にいたるまで,関連する各レイヤでデータアライメントの妥当性を確認する必要がある。
この問題に関しては,より詳しい情報が Linux ATA Wiki の ATA 4Kバイトセクタ問題 のページに紹介されている。Red Hat のエンジニア Karel Zak 氏は,パーティショニングとファイルシステムユーティリティの動作に関する要約を Linux カーネルメーリングリストに投稿 している。氏の Red Hat での同僚である Mike Snitzer 氏も I/O Limits: block sizes, alignment, and I/O hits というタイトルでドキュメントを書いている。さらに Oracle の Linux エンジニア Martin K. Petersen 氏による資料 Linux & Advanced Storage Interface も一読の価値がある。