一、Ganglia的組件
Ganglia包括如下程序,他們之間通過XML格式傳遞監控數據,達到監控效果。
Gmetad 這個程序負責收集各個cluster的數據,並更新到rrd
數據庫中。
Gmond 收集本機的監控數據,發送到其他機器上。收集其他機器的監控數據,供Gmetad讀取。默認監聽端口8649
web front-end 一個基於web的監控界面,需要和Gmetad安裝在同一個節點上,從Gmetad取數據,並且讀取rrd數據庫,生成圖片,顯示出來。
二、Ganglia的工作模式
Ganglia的收集數據工作可以工作在單播(unicast)或多播(multicast)模式下,默認為多播模式。
單播:發送自己收集到的監控數據到特定的一台或幾台機器上,可以跨網段
多播:發送自己收集到的監控數據到同一網段內所有的機器上,同時收集同一網段內的所有機器發送過來的監控數據。因為是以廣播包的形式發送,因此需要同一網段內。但同一網段內,又可以定義不同的發送通道。
三、Ganglia的安裝
Ganglia的安裝非常簡單,分為監控管理端(Gmetad)和客戶端(Gmond)安裝兩部分,已經寫成安裝腳本,這裡不在描述。
推薦安裝版本是ganglia-3.4.0,可以在http://sourceforge.net/projects/ganglia/
files/下載安裝。
四、Ganglia的配置
這裡介紹一個簡單的Ganglia配置構架,即一個監控管理端和多個客戶端,我們假定gmond工作在多播模式,並且有一個Cluster1的集群,裡面有10台服務器(從host1到host10),在同一個網段內。
1、監控管理端配置
監控管理端的配置文件是gmetad.conf,在安裝Ganglia的etc目錄下可以找到,這個文件配置非常簡單,介紹如下:
data_source "Cluster1" host1 host2
xml_port 8651
interactive_port 8652
rrd_rootdir "/var/lib/ganglia/rrds"
data_source參數定義了集群名字,以及集群中的節點。由於采用multicast模式,每台gmond節點都有本Cluster1內節點機器的所有監控數據,因此不需要把所有節點寫入data_source中。建議寫入不低於2個,在host1節點死機的時候,會自動找host2節點取數據。
xml_port定義了一個收集數據匯總的交互端口,如果不指定,默認是8651,可以通過telnet這個端口得到監控管理端收集到的客戶端的所有數據。
interactive_port 定義了Web端獲取數據的端口,這個端口在配置Ganglia的web監控界面時需要指定。
rrd_rootdir參數定義了rrd數據庫的存放路徑,gmetad收集到監控數據後,會更新到該目錄下的對應的rrd數據庫中。
上面通過data_source參數定義了一個監控集群,如果要監控多個應用系統,可以通過如下方式定義:
data_source "my cluster" 10 localhost my.machine.edu:8649 1.2.3.5:8655
data_source "my grid" 50 1.3.4.7:8655 grid.org:8651 grid-backup.org:8651
data_source "another source" 1.3.4.7:8655 1.3.4.8
在定義集群節點的時候,可以采用主機名、IP地址等形式,也可以加端口,如果不加端口的話,默認是8649端口,同時可以設定采集數據的頻率,如上面的“10 localhost、50 1.3.4.7:8655”等,分別表示每隔10秒鐘、50秒鐘采集一次數據。
2、客戶端配置
客戶端監控安裝完成後,配置文件位於安裝Ganglia的etc目錄下,名稱為gmond.conf,這個配置文件稍微復雜,介紹如下:
globals {
daemonize = yes #以後台的方式運行
setuid = yes
user = nobody #運行gmond的用戶
debug_level = 0 #調試級別
max_udp_msg_len = 1472
mute = no #啞巴,本節點將不會再廣播任何自己收集到的數據到網絡上
deaf = no #聾子,本節點將不再接收任何其他節點廣播的數據包
allow_extra_data = yes
host_dmax = 0 /*secs */
cleanup_threshold = 300 /*secs */
gexec = no #是否使用gexec
send_metadata_interval = 0
}
cluster {
name = "Cluster1" #本節點屬於哪個cluster
owner = "junfeng" #誰是該節點的所有者
latlong = "unspecified" #在地球上的坐標,經度、緯度?
url = "unspecified"
}
host {
lo
cation = "unspecified"
}
udp_send_channel { #udp包的發送通道
mcast_join = 239.2.11.71 #多播,工作在239.2.11.71通道下。如果使用單播模式,則要寫host = host1,單播模式下也可以配置多個udp_send_channel
port = 8649 #監聽端口
ttl = 1
}
udp_recv_channel { #接收udp包配置
mcast_join = 239.2.11.71 #同樣工作在239.2.11.71通道下
port = 8649 #監聽端口
bind = 239.2.11.71 #綁定
}
tcp_accept_channel {
port = 8649 #通過tcp協議監聽的端口,遠端可以通過鏈接8649端口得到監控數據
}
3、Ganglia之Web端配置
Ganglia的web監控界面是基於PHP的,因此需要安裝PHP環境,PHP環境的安裝不在介紹,可以在http://sourceforge.net/projects/ganglia/files/下載ganglia-web,然後放到web根目錄即可,推薦下載ganglia-web-3.5.7版本。
配置ganglia的web界面比較簡單,只需要修改幾個php文件即可,首先第一個是conf_default.php,可以將conf_default.php重命名為conf.php,也可以保持不變,ganglia的web默認先找conf.php,找不到會繼續找conf_default.php,需要修改的內容如下:
$conf['gmetad_root'] = "/var/lib/ganglia"; # ganglia web根目錄
$conf['rrds'] = "${conf['gmetad_root']}/rrds"; #ganglia web讀取rrds數據庫的路徑
$conf['dwoo_compiled_dir'] = "${conf['gmetad_root']}/dwoo/compiled"; #需要777權限
$conf['dwoo_cache_dir'] = "${conf['gmetad_root']}/dwoo/cache"; #需要777權限
$conf['rrdtool'] = "/opt/rrdtool/bin/rrdtool"; #指定rrdtool的路徑
$conf['graphdir']= $conf['gweb_root'] . '/graph.d'; #生成圖形模板目錄
$conf['ganglia_ip'] = "127.0.0.1"; #gmetad服務器的地址
$conf['ganglia_port'] = 8652; #gmetad服務器的交互式提供監控數據端口發布
五、管理ganglia
所有配置操作完成後,即可啟動ganglia服務了,首先在監控管理端啟動gmetad服務:
/etc/init.d/gmetad start
接著啟動apache的web服務:
/usr/local/apache2/bin/apachectl start
最後在每個客戶端啟動gmond服務:
/etc/init.d/gmond start
最後附上一張web截圖: