・・・データプロセスパラダイムのようにMapReduceは後ずさりの大きな一歩を表しているのです。データベースコミュニティは1968年にIBMが最初にIMSをリリースして以来、40年間に渡って下記の教訓を学びました。今までの実験評価があるのを踏まえて、私達はMapReduceアプリケーションがいかに良くスケールできるのかという事に深刻な疑問を抱いています。更にMapReduce実装者達は過去25年間の並列DBMSリサーチ文学の研究を順調に行うでしょう。
そしてその記事には下記のような基準も記載されていた。
- MapReduceの実装は乏しいものである(B-treesに比べると)
- MapReduceは新しいものではない
- MapReduceにはいくつか機能が欠如している(ロード、またインデックスのような)
- MapReduceはDBMSツールと互換性がない
ブログスフィアはその比較と根拠においてそれを非難した。Greg Jorgensen氏は詳細に記した反論文章(source)を提供している。彼が記している項目の中には、MapReduceはデータベースではなくて分散プロセス用のアルゴリズム的なテクニックであり、それと比較されるべきではないというものがあった。Jorgensen氏はそのより良い比較となるのはSimpleDBであると提示している。
・・・その著者が本当に不満に思っているのはAmazonのSimpleDBのような分散”クラウド”データマネジメントシステムなのです。実のところもしあなたが"MapReduce"から"SimpleDB"に変更したらそのオリジナルの記事は意味が通るのです。
Rich Skrenta氏は障害(source)の観点においてコメントしている。
・・・あなたに支障をきたすものはいつでもどこかしらより醜く粗悪なのです。機能が少なく、また開発度が低いのです。でもどこかに10倍の額のメリットがあるならば、最終的には安くておんぼろなものでも採用されるのです。Linux vs. AT&T UnixかもしくはMySQLvs.Oracleを考えて見てください・・・
このトピックに関する長ったらしいディベートとコメントがreddit(source)とycombinator(source)にも掲載されている。