Hadoopの人気上昇に伴い、適当な管理プラットフォームの課題が現在の問題の前面に出てきている。すでにCloudera Enterprise Managerのような市販のHadoop管理プラットフォームがいくつかあるが、Apache Ambariはそのようなシステムの最初のオープンソース実装である。これはwebベースのツールで Apache Hadoopクラスタをプロビジョニング、管理、監視する。現在、Ambari はHadoopコンポーネントのほとんどをサポートする。その中には、 HDFS, MapReduce, Hive, Pig, HBase, Zookeper, Sqoop, HCatalogなどがある。
Conno氏は、今年成し遂げたAmbariの以下の主要点を強調する。
- ステップバイステップのインストール・ウィザードによりクラスタプロビジョニングが簡単になった
- Hadoop コア (Hadoop 分散ファイルシステムと MapReduce)とHBase, Hive、HCatalogのような関連するプロジェクトのヘルスを即座に診断するための、予め設定された主要な運用メトリクス
- ジョブやタスク実行の可視化と分析により、依存性とパフォーマンスをより良く把握である
- 監視情報の公開と既存の運用ツールとの統合ができる完全な RESTful API
- 直感的なユーザーインターフェースにより、情報を見、クラスタをコントロール知るのが容易かつ生産的になる
Ambariは、メトリクスの収集にGangliaをシステムの警告にNagios を利用しており、管理者の注意が必要なときはメールを送信する(例えばノードがダウンしたり、残りのディスクスペースが小さくなった時など)。
更に、Ambariはセキュアな(Kerberosベースの) Hadoopクラスタのインストールをサポートし、ロールベースのユーザー認証と許可そして監査機能を提供し、ユーザー管理のために LDAPと Active Directoryとの統合も提供している
Apache Ambariは、現在6つのトップオープンソースHadoop管理ツールの一つである。Conno氏によれば、 AmbariはHadoopエコシステムの重要な一部である。なぜなら「管理ツールの安定性と容易さはHadoopの企業採用の二大要求である」からだ。