歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux綜合 >> Linux資訊 >> Linux業界

使用Apache Ambari管理Hadoop

 隨著Hadoop越來越普及,對合適的管理平台的需求成為當前亟待解決的問題。已經有幾個商業性的Hadoop管理平台,如Cloudera Enterprise Manager,但Apache Ambari是 第一個開源實現。Apache Ambari是一種基於Web的工具,支持Apache Hadoop集群的供應、管理和監控。Ambari目前已支持大多數Hadoop組件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。

Shaun Connolly是Hortonworks公司負責公司戰略的副總裁,他在一篇新的博客文章“Apache Amabri: Hadoop Operations, Innovtation, and Enterprise Readiness”中強調,在這一年裡,Ambari主要取得了以下成績:

  1. 通過一步一步的安裝向導簡化了集群供應。
  2. 預先配置好關鍵的運維指標(metrics),可以直接查看Hadoop Core(HDFS和MapReduce)及相關項目(如HBase、Hive和HCatalog)是否健康。
  3. 支持作業與任務執行的可視化與分析,能夠更好地查看依賴和性能。
  4. 通過一個完整的RESTful API把監控信息暴露出來,集成了現有的運維工具。
  5. 用戶界面非常直觀,用戶可以輕松有效地查看信息並控制集群。

Ambari使用Ganglia收集度量指標,用Nagios支持系統報警,當需要引起管理員的關注時(比如,節點停機或磁盤剩余空間不足等問題),系統將向其發送郵件。

此外,Ambari能夠安裝安全的(基於Kerberos)Hadoop集群,以此實現了對Hadoop 安全的支持,提供了基於角色的用戶認證、授權和審計功能,並為用戶管理集成了LDAP和Active Directory。

Apache Ambari當前是6個頂級的開源Hadoop管理工具之一。據Connolly介紹,因為“穩定性和易管理性是Hadoop 企業應用的兩個關鍵需求”,因此Ambari是Hadoop生態系統中的一個重要部分。

Copyright © Linux教程網 All Rights Reserved