BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Apache AmbariでHadoopを管理

Apache AmbariでHadoopを管理

原文(投稿日:2012/12/19)へのリンク

 

Hadoopの人気上昇に伴い、適当な管理プラットフォームの課題が現在の問題の前面に出てきている。すでにCloudera Enterprise Managerのような市販のHadoop管理プラットフォームがいくつかあるが、Apache Ambariはそのようなシステムの最初のオープンソース実装である。これはwebベースのツールで Apache Hadoopクラスタをプロビジョニング、管理、監視する。現在、Ambari はHadoopコンポーネントのほとんどをサポートする。その中には、 HDFS, MapReduce, Hive, Pig, HBase, Zookeper, Sqoop, HCatalogなどがある。

Conno氏は、今年成し遂げたAmbariの以下の主要点を強調する。

  • ステップバイステップのインストール・ウィザードによりクラスタプロビジョニングが簡単になった
  • Hadoop コア (Hadoop 分散ファイルシステムと MapReduce)とHBase, Hive、HCatalogのような関連するプロジェクトのヘルスを即座に診断するための、予め設定された主要な運用メトリクス
  • ジョブやタスク実行の可視化と分析により、依存性とパフォーマンスをより良く把握である
  • 監視情報の公開と既存の運用ツールとの統合ができる完全な RESTful API
  • 直感的なユーザーインターフェースにより、情報を見、クラスタをコントロール知るのが容易かつ生産的になる

Ambariは、メトリクスの収集にGangliaをシステムの警告にNagios を利用しており、管理者の注意が必要なときはメールを送信する(例えばノードがダウンしたり、残りのディスクスペースが小さくなった時など)。

更に、Ambariはセキュアな(Kerberosベースの) Hadoopクラスタのインストールをサポートし、ロールベースのユーザー認証と許可そして監査機能を提供し、ユーザー管理のために LDAPと Active Directoryとの統合も提供している

Apache Ambariは、現在6つのトップオープンソースHadoop管理ツールの一つである。Conno氏によれば、 AmbariはHadoopエコシステムの重要な一部である。なぜなら「管理ツールの安定性と容易さはHadoopの企業採用の二大要求である」からだ。

 

 

この記事に星をつける

おすすめ度
スタイル

BT