Turbolinux(中國)軟件有限公司 於潇洋
目前,越來越多的網站采用Linux操作系統,提供郵件、Web、文件存儲、數據庫等服務。也有非常多的公司在企業內部網中利用Linux服務器提供這些服務。隨著人們對Linux服務器依賴的加深,對其可靠性、負載能力和計算能力也倍加關注。Linux集群技術應運而生,可以以低廉的成本,很好地滿足人們的這些需要。
Linux競爭力很強的原因之一,是它可以運行於極為普及的PC機上,不需要購買昂貴的專用硬件設備。在幾台運行Linux的PC機上,只要加入相應的集群軟件,就可以組成具有超強可靠性、負載能力和計算能力的Linux集群。集群中的每台服務器稱為一個節點。
按照側重點的不同,可以把Linux集群分為三類。一類是高可用性集群,運行於兩個或多個節點上,目的是在系統出現某些故障的情況下,仍能繼續對外提供服務。高可用性集群的設計思想就是要最大限度地減少服務中斷時間。這類集群中比較著名的有Turbolinux TurboHA、Heartbeat、Kimberlite等。第二類是負載均衡集群,目的是提供和節點個數成正比的負載能力,這種集群很適合提供大訪問量的Web服務。負載均衡集群往往也具有一定的高可用性特點。Turbolinux Cluster Server、Linux Virtual Server都屬於負載均衡集群。另一類是超級計算集群,按照計算關聯程度的不同,又可以分為兩種。一種是任務片方式,要把計算任務分成任務片,再把任務片分配給各節點,在各節點上分別計算後再把結果匯總,生成最終計算結果。另一種是並行計算方式,節點之間在計算過程中大量地交換數據,可以進行具有強耦合關系的計算。這兩種超級計算集群分別適用於不同類型的數據處理工作。有了超級計算集群軟件,企業利用若干台PC機就可以完成通常只有超級計算機才能完成的計算任務。這類軟件有Turbolinux EnFusion、SCore等。
高可用性集群與負載均衡集群的工作原理不同,適用於不同類型的服務。通常,負載均衡集群適用於提供靜態數據的服務,如HTTP服務;而高可用性集群既適用於提供靜態數據的服務,如HTTP服務,又適用於提供動態數據的服務,如數據庫等。高可用性集群之所以能適用於提供動態數據的服務,是由於節點共享同一存儲介質,如RAIDBox。也就是說,在高可用性集群內,每種服務的用戶數據只有一份,存儲在共用存儲設備上,在任一時刻只有一個節點能讀寫這份數據。
以Turbolinux TurboHA為例,集群中有兩個節點A和B,設這個集群只提供Oracle服務,用戶數據存放於共用存儲設備的分區/dev/sdb3上。在正常狀態下,節點A提供Oracle數據庫服務,分區/dev/sdb3被節點A加載在/mnt/oracle上。當系統出現某種故障並被TurboHA軟件檢測到時,TurboHA會將Oracle服務停止,並把分區/dev/sdb3卸載。之後,節點B上的TurboHA軟件將在節點B上加載該分區,並啟動Oracle服務。對於Oracle服務有一個虛擬的IP地址,當Oracle服務從節點A切換到節點B上時,虛擬的IP地址也會隨之綁定到節點B上,因此用戶仍可訪問此服務。
由以上分析可以看出,高可用性集群對一種服務而言不具有負載均衡功能,它可以提高整個系統的可靠性,但不能增加負載的能力。當然,高可用性集群可以運行多種服務,並適當分配在不同節點上,比如節點A提供Oracle服務,同時節點B提供Sybase服務,這也可以看成是某種意義上的負載均衡,不過這是對多種服務的分配而言。
負載均衡集群適用於提供相對靜態的數據的服務,比如HTTP服務。因為通常負載均衡集群的各節點間通常沒有共用的存儲介質,用戶數據被復制成多份,存放於每一個提供該項服務的節點上。
下面以Turbolinux Cluster Server為例簡要介紹一下負載均衡集群的工作機制。在集群中有一個主控節點,稱為高級流量管理器(ATM)。假設這一集群僅被用來提供一項HTTP服務,其余各節點均被設定為HTTP的服務節點。用戶對於頁面的請求全部發送到ATM上,因為ATM上綁定了這項服務對外的IP地址。ATM把接受到的請求再平均發送到各服務節點上,服務節點接收到請求之後,直接把相應的Web頁面發送給用戶。這樣一來,假如在1秒內有1000個HTTP頁面請求,而集群中有10個服務節點,則每個節點將處理100個請求。這樣,在外界看來,好象有一台10倍速度的高速計算機在處理用戶的訪問。這也就是真正意義上的負載均衡。
但是ATM要處理所有1000個頁面請求,它會不會成為集群處理速度的瓶頸呢?由於對於頁面的請求的數據量相對較少,返回頁面內容的數據量相對較大,因此這種方式還是很有效率的。ATM發生故障,也不會導致整個系統無法工作。Turbolinux Cluster Server可以設置一台或多台計算機為後備ATM節點,當主ATM節點故障時,在後備ATM中會產生出一個新的主ATM,接替它的工作。可以看出,這種負載均衡集群也具有一定的高可用性。
HTTP頁面相對是靜態的,但有時也需要改動。Turbolinux Cluster Server提供了數據同步工具,可以很方便的把對頁面的改動同步到所有提供該項服務的節點上。
下面介紹一下對於高可用性集群與負載均衡集群的組合使用。如果用戶有一個由兩個節點組成的最小集群,是否可以同時獲得高可用性集群和負載均衡集群的效益呢?答案是肯定的。由於高可用性集群適用於提供動態數據的服務,而負載均衡集群適用於提供靜態數據的服務,所以我們不妨假設要同時提供Oracle和HTTP服務。用戶要在節點A和B上安裝TurbolinuxTurboHA和TurbolinuxClusterServer軟件。把節點A作為Oracle正常工作的節點,節點B作為Oracle服務的後備節點,這是對TurboHA軟件而言。對於ClusterServer軟件而言,要設置節點B為主ATM節點,節點A為後備ATM節點,而節點A和節點B同時又都是HTTP的服務節點。
這樣一來,節點A和節點B都是身兼兩職,而用戶同時得到了一個具有高可用性的Oracle服務和一個具有負載均衡功能的HTTP服務。即使有一個節點發生故障,Oracle服務和HTTP服務都不會因此而中斷。
但對於同一種服務,是不能同時獲得高可用性與負載均衡能力的。對一種服務,要麼是只有一份數據,放在共用存儲設備上,一次被一個節點訪問,獲得高可用性;要麼是把數據復制為多份,存儲於每個節點的本地硬盤上,用戶的請求同時發送到多個節點上,獲得負載均衡能力。
對於高可用性集群,由於它在設計時的目的就是為了最大可能地減少服務中斷時間,因此服務的切換受到很大的關注。當一個節點上的服務故障時,會被很快地檢測到並被切換到其他節點上。但在切換時,不能忽略對數據完整性的保護。
在什麼情況下數據完整性會被破壞呢?由於高可用性集群中至少有兩個節點,連接在一個共用的存儲設備上,對於非裸分區而言,如果被兩個節點同時讀寫,就會造成文件系統被破壞。因此就需要利用I/O屏障來防止這一事件的發生。
I/O屏障的目的是為了保證故障節點不能再繼續讀寫某一服務的共用分區,實現的方式有多種。Kimberlite使用硬件開關來實現,當一個節點發生故障時,另一節點如果能偵測到,就會通過串行口發出命令,控制連接在故障節點電源上的硬件開關,通過暫時斷電,而後又上電的方式使得故障節點被重啟動。
I/O屏障有多種形式。對於支持SCSI Reserve/Release命令的存儲設備,也可以用SG命令實現I/O屏障。正常節點應使用SCSI Reserve命令“鎖住”共用存儲設備,保證其不被故障節點讀寫。如果故障節點上的集群軟件仍在運行,如發現共用存儲設備已被對方鎖住,就應把自己重啟動,以恢復正常工作狀態。
以上介紹了Linux集群技術的基本原理,也介紹了幾種著名的軟件。總之,Linux集群技術最大的發揮了PC機和網絡的優勢,可以帶來可觀的性能,是一種大有前途的技術。