一、寫在前面
HA即(high available)高可用,又被叫做雙機熱備,用於關鍵性業務。簡單理解就是,有2台機器 A 和 B,正常是 A 提供服務,B 待命閒置,當 A 宕機或服務宕掉,會切換至B機器繼續提供服務。常見的實現高可用的開源軟件有 heartbeat 和 keepalived。
這樣,一台 web 服務器一天24小時提供web服務,難免會存在 web 服務掛掉或服務器宕機宕機的情況,那麼用戶就訪問不了服務了,這當然不是我們期望的。如果這樣,有2台服務器,A對外提供 web 服務,B作為備用,如果A掛掉,那麼B立刻替代A的位置去提供 web 服務,這樣對用戶來說是透明的。但是有個問題,服務器A的 ip 是 10.0.0.100,服務器B的 ip 是 10.0.0.101,顯然向用戶提供A或B的ip地址是不可行的,因為用戶總不能去切換ip來訪問的吧。這時heartbeat或keepalived可以提供一個虛擬IP:10.0.0.102,用戶只需要訪問 10.0.0.102,當A提供服務時,VIP 會設置在A服務器上,當B提供服務時,VIP會設置在B服務器上,這樣就可以讓用戶通過訪問 10.0.0.102 來獲取web服務,即使A或B服務器切換也不影響用戶的正常訪問。
下面我們使用 heartbeat 來做 HA 集群,並且把 nginx 服務作為 HA 對應的服務。
二、准備實驗環境
服務器A:
主機名:master
操作系統:CentOS6.8 64位
eth0網卡地址:192.168.0.18
eth1網卡地址:172.16.254.18
服務器B:
主機名:slave
操作系統:CentOS6.8 64位
eth0網卡地址:192.168.0.28
eth1網卡地址:172.16.254.28
虛擬VIP:
VIP:192.168.0.38
三、設置主機名
master節點設置hostname
hostname master vim /etc/sysconfig/network 編輯配置文件: HOSTNAME=master
slave節點設置hostname
# hostname slave # vim /etc/sysconfig/network 編輯配置文件: HOSTNAME=slave
四、關閉防火牆和selinux(2台節點都要操作)
關閉iptables
# iptables -F # service iptables save # service iptables stop
關閉selinux:
# setenforce 0 # sed -i 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config
五、配置hosts文件(2台節點都操作)
# vim /etc/hosts 增加內容如下: 192.168.0.18 master 192.168.0.28 slave
六、安裝epel擴展源 (2台都操作)
# yum install -y epel-release
七、安裝heartbeat (2台都操作)
# yum install -y heartbeat* libnet nginx
八、主master節點配置
1、拷貝配置文件:
# cd /usr/share/doc/heartbeat-3.0.4/ # cp authkeys ha.cf haresources /etc/ha.d/ # cd /etc/ha.d
2、修改authkeys
# vim authkeys 更改或增加如下內容: auth 3 3 md5 Hello! 然後修改其權限 # chmod 600 authkeys
3、編輯haresources文件
# vim haresources 加入下面一行: master 192.168.0.38/24/eth0:0 nginx
說明:master為主節點hostname,192.168.0.38為vip,/24為掩碼為24的網段,eth0:0為vip的設備名,nginx為heartbeat監控的服務,也是兩台機器對外提供的核心服務。
4、編輯ha.cf
# vim ha.cf 修改為如下內容: debugfile /var/log/ha-debug logfile /var/log/ha-log logfacility local0 keepalive 2 deadtime 30 warntime 10 initdead 60 udpport 694 ucast eth1 172.16.254.28 auto_failback on node master node slave ping 172.16.254.1 respawn hacluster /usr/lib64/heartbeat/ipfail
5、配置說明:
debugfile /var/log/ha-debug:該文件保存heartbeat的調試信息。
logfile /var/log/ha-log:heartbeat的日志文件。
keepalive 2:心跳的時間間隔,默認時間單位為秒s。
deadtime 30:超出該時間間隔未收到對方節點的心跳,則認為對方已經死亡。
warntime 10:超出該時間間隔未收到對方節點的心跳,則發出警告並記錄到日志中。
initdead 60:在某系統上,系統啟動或重啟之後需要經過一段時間網絡才能正常工作,該選項用於解決這種情況產生的時間間隔,取值至少為deadtime的2倍。
udpport 694:設置廣播通信使用的端口,694為默認使用的端口號。
ucast eth1 172.16.254.28:設置對方機器心跳檢測的網卡和IP。
auto_failback on:heartbeat的兩台主機分別為主節點和從節點。主節點在正常情況下占用資源並運行所有的服務,遇到故障時把資源交給從節點由從節點運行服務。在該選項設為on的情況下,一旦主節點恢復運行,則自動獲取資源並取代從節點,否則不取代從節點。
respawn heartbeat /usr/lib/heartbeat/ipfail:指定與heartbeat一同啟動和關閉的進程,該進程被自動監視,遇到故障則重新啟動。最常用的進程是ipfail,該進程用於檢測和處理網絡故障,需要配合ping語句指定的ping node來檢測網絡連接。如果你的系統是64bit,請注意該文件的路徑。
九、把主節點上的三個配置文件拷貝到從節點
# cd /etc/ha.d # scp authkeys ha.cf haresources slave:/etc/ha.d
十、從節點slave編輯ha.cf
# vim /etc/ha.d/ha.cf 只需要更改一個地方如下: ucast eth1 172.16.254.28改為ucast eth1 172.16.254.18
十一、啟動heartbeat服務
配置完畢後,先master啟動,後slave啟動。
# service heartbeat start
十二、檢查測試
# ifconfig 看是否有接口 eth0:0 # ps aux | grep nginx 看是否有nginx進程
十三、測試方式1
主節點上故意禁ping
# iptables -I INPUT -p icmp -j DROP
十四、測試方式2
主節點停止heartbeat服務
# service heartbeat stop
十五、測試腦裂
主節點master和從節點slave都down掉eth1網卡
# ifdown eth1