昨年、MapReduceのオープン・ソース実装として普及しているHadoopに関する数々のプロジェクトが著しく進行した。そこでClouderaは、企業がより簡単にHadoopの使用を開始できることを目的としたオープン・ソース製品のCloudera Distribution for Hadoopをリリースする。プレス・リリースによると、
…Cloudera Distribution for Hadoopはダウンロードおよび即時使用が自由に可能となっている。この製品は、Red Hat LinuxシステムまたはAmazon EC2イメージ用にパッケージされたRPMバンドルとして配布される。Hadoopのインストールおよび使用を簡便にするため、Clouderaはmy.cloudera.comと呼ばれる新しいポータルを開設し、そこではウェブ・ベースの設定ツールを使用して個別のニーズに対して最適化されたカスタム・パッケージを作成できる。クラスタの設定もポータルに保存でき、自動更新が可能。my.cloudera.comは無料で使用できる。RPMパッケージおよびEC2イメージはApache 2ソフトウェアライセンスのもと無料で配布される…
Clouderaは評価や無料のオンライン・トレーニング(http://www.cloudera.com/hadoop-training)との使用に自由に利用できるよう予め設定されたVMwareイメージも作成している。Cloudera Distribution for Hadoopを試したい、あるいはHadoopおよびClouderaのオンライン・トレーニングについてもっと知りたいという場合は、イメージをダウンロードしてLinux、Mac、もしくはWindowsのデスクトップで実行できる。イメージはサンプル・コードおよびマスタ・サーバやシングル・ノードなどCloudera Distribution for Hadoopの使用に必要な全てのコンポーネントが装備されている。
現在、全ての配布形態で以下が含まれている。
- HDFS - HDFS(Hadoop Distributed File System)はコモディティ・ハードウェア上で実行できるよう設計された分散およびフォールト・トレランスなファイル・システムである。HDFSはハードウェアの障害が当然のことであると想定しており、迅速な発見と自動修復をもたらす。
MapReduce -自動並列化および大規模クラスタ上での実行のため、アプリケーションを多数の小さな作業ブロックに分割する。
Hive - これはHadoop上に設けられたデータ・ウェアハウス基盤で、容易なデータ・サマリー生成、アドホック・クエリ、そして分析用のツールを提供する。HiveにはSQLをベースとしたシンプルなクエリ言語であるHQLがついている。
さらに詳しい情報は www.cloudera.com/hadoopで。