隨著網絡技術的發展和網絡應用的進一步深入,校園網絡承擔了越來越多的來自教學、科研及管理方面的應用。校園網絡中心作為校內局域網絡的數據存儲發布、流量的管理控制、用戶的管理以及內外網絡轉接控制中心,必須解決因流量增加所帶來的一系列問題。傳統的網絡中心方案中,當流量增加後,一般是升級單一的服務器系統,這往往會造成過高的投入和維護成本,極大地降低了性能價格比。運用基於Linux集群技術設計的校園網絡中心方案可以有效地解決這一問題。
校園網絡中心體系結構
基於Linux集群技術的校園網絡中心的體系結構是以Linux核心層集群技術和安全技術為基石,構成的一個高可擴展、高可用和高安全的操作平台。其結構如圖1所示。
圖1在這種體系結構下,網絡中心的配置可以抽象分為負載均衡器、服務結點池和存儲系統三個層次。
1.負載均衡器這是集群的惟一入口,校園網絡就是通過該設備接入Internet的。從校園內的單個客戶端來看,集群通過這一層的服務體現為一個基於IP地址的單一系統映像(SSI),整個校園網絡共用這個虛擬地址,通過它客戶端可以把整個集群看作一個獨立的具有合法IP地址的主機系統,客戶端的所有訪問都發往這個虛擬IP地址,可以有效地解決學校IP地址的短缺問題。如果僅有一台負載均衡器,容易造成負載均衡器的單點失效,使其成為集群中最脆弱的環節。因此,有必要提供容錯機制,能夠在負載均衡器失效的時候進行自動檢測並平滑替換。在該方案中提供了一個備份負載均衡器,可以實時地監控負載均衡器的運行狀態,並根據檢測到的狀態做出報警、接管、恢復等響應。
2.服務結點池方案中的服務結點池指的是提供實際服務的服務器群。客戶端發出的服務請求經過均衡器處理以後,轉交到服務結點池由具體的服務器響應請求並返回數據。在校園網絡中一般提供 WWW、FTP、郵件和課件點播等服務,使用單一的服務器系統無法應付高峰時的數據訪問,通過多台服務器分擔這些負載是比較經濟可行的。服務器結點也有可能會出現暫時失效的情況,特別是在結點提供多種服務的時候,系統的隨機故障或外部環境的突變都可能造成該節點的某個服務暫時不可用。這需要由負載均衡擴展出的容錯機制識別出這種錯誤並及時進行處理,當錯誤排除後,集群能夠自動識別恢復事件,把好的結點重新納入集群繼續運行。
3.存儲服務系統存儲服務系統主要為整個集群內部運行提供穩定、一致的文件存取服務。該系統可以為集群節點池提供單一的文件系統入口,即在每一台服務結點上都共用同一個根;並且自動完成不同結點訪問文件系統所引發的文件鎖定、負載均衡、容錯、內容一致、讀寫事務等底層功能,對應用層提供一個透明的文件訪問服務。這種基於 Linux集群技術構成的系統屬於松耦合集群系統,不需要在集群中部署特殊的中間件層或者OS擴展,對服務器結點 OS的兼容性比較好。這樣構成的網絡中心,基本上可以兼容多數的IP應用,不需要做復雜的移植和安裝工作,每個具體的應用都可以看成相對獨立的服務器系統。即使在負載均衡器上,核心功能也是透明地提供給用戶的,不影響本機正常的網絡應用。
校園網絡中心的關鍵技術
這種網絡方案所運用的技術,實際上是借助於網絡接入協議層的負載均衡技術,將網絡請求化整為零,由大量集群的服務結點來共同分擔,以實現性能最大化的一項集群技術。因此該方案的關鍵技術是網絡接入協議層的負載均衡技術。這種的負載均衡技術特點是:1.執行效率高。因為基於底層的協議,可以通過硬件體系進行部署,也可以在OS的核心層實現。2.兼容性強。接入協議往往能夠兼容大多數現有的主流網絡應用,比如IPv4體系中的IP層。3.體系實現相對簡單。比起基於內容的高層交換,它不需要復雜的模式匹配機制,主要通過端口映射進行數據交換,規則簡單。從根本上講,該負載均衡技術的實現基礎是IP交換,只是在Linux平台下IP的交換具備了一定的可擴展性,可以實現高性能、高可擴展性、易管理性等諸多特點,成為一個以負載均衡為核心的真正意義的集群系統。該Linux下支持三種負載均衡模型,分別是:地址轉換(NAT)、IP隧道(IPIP)和直接路由(DR)模型。NAT是通過內部IP地址,將服務結點池同互聯網隔離開來。服務結點和客戶端不能直接通信,不論是請求數據還是應答數據,都需要經過負載均衡器進行IP包處理工作。IPIP 采用的是開放的網絡結構,服務結點擁有合法的互聯網IP地址,可以通過路由路徑將應答包直接返回給客戶端。負載均衡器收到客戶端的請求包後,通過IPIP 協議為該IP包重新處理,形成以選定的服務結點為目的IP的新的IP包,原有的IP包數據則封裝在新的IP包裡。服務結點收到均衡器發來的IPIP數據後,將該包解開,根據其內的客戶端地址(源地址)將處理結果直接返回給客戶端,而應答包的源地址則成為集群的虛擬地址VIP。DR模式的工作方式是負載均衡器接收到客戶端請求後,選擇合適的服務結點,然後改寫該請求包的MAC地址部分,使之成為目的服務結點的MAC地址,再將此包廣播到均衡器所在的網段。由於每個服務結點都擁有一個虛擬的網絡設備,這些設備上綁定了和均衡器一樣的VIP,只是該設備並不響應對VIP的RAP解析,不會和均衡器的 Vip地址沖突。負載均衡器收到符合自身MAC的IP包後,經過處理後直接將應答數據返回給客戶,而此時的源地址仍然是VIP。這樣,在客戶端看來,訪問的和接受響應的始終是集群的VIP地址了。在三種負載均衡模型中,NAT是雙工連接處理模型,要對進入和流出集群的網絡包進行改寫包頭地址的工作,在負荷比較重的時候會影響整個集群的性能,負載均衡器容易成為瓶頸;IPIP和DR是一種單工模型,負載均衡器僅僅處理進入集群的IP請求包,而對 IP的應答數據則不處理,對於大量的返回數據,都由服務節點通過路由器、交換機等設備直接返回給客戶端,具有較強可擴展性。但使用NAT模型在網絡的安全性方面具有較強的優勢。在校園網絡中究竟選擇那種選擇那種負載均衡模型要根據網絡的流量和具體的應用進行考慮。如果你只擁有一個合法的IP地址,或者你需要構造一個安全的集群,又不太擔心性能問題的話,完全可以使用NAT模式。一般來講,在校園網絡中,大多數的網絡請求比較小,無非是一些URL頁面請求、GET或者POST表單,或者就是某些指令等等,這些數據基本上在幾百到幾千個字節。而相反,Web中的應答數據通常很大,一個普通的Web頁面也要幾十KB,更何況在校園網絡中返回的很多內容都是視頻、音頻流,加上日益"瘋狂"的網絡下載,大大增加了應答數據的流量。這種情況下使用IPIP或者 DR模式是一個非常好的選擇。
基於Linux集群技術的校園網絡中心的優勢
這種基於Linux集群技術的校園網絡中心方案相對於傳統的單一服務器方案具有以下一些優勢:1.可擴展性好校園網絡的應用是根據計算機網絡技術的發展和教師應用能力的提高而逐步深入的。任何一個網絡中心的方案都不可能、也不需要一次性地把所有的應用考慮進去,因此系統的可擴展性就變得非常重要。使用該方案形成的網絡系統,可以非常方便地擴充系統的功能。當校園網絡中的應用增加後,系統的性格會下降,這時通過增加服務結點可以很方便地提高系統的性能,保證系統性能隨著成本的增加而線性的增長。2.全天候的可用性支持在校園網絡提供WWW、FTP、郵件、課件點播和遠程教學等服務後,全天侯的可用性就變得非常關鍵。該方案可以為網絡的應用提供透明的、自動適應的可用性支持,這種獨特的雙機備份結構在服務結點發生故障後,可以自動切換或修復系統,保證24×7的系統正常運行。3.可管理性好隨著校園網絡應用的深入,網絡系統的規模越來越龐大,系統管理的任務也越來越繁重。使用該方案可以有效地簡化系統的管理,主要體現在:可以用基於HTTPS 的Web管理界面和安全的命令行界面對網絡進行管理;可以對系統中的所有節點都在一個單一控制點上進行配置和監控;可以對每一台服務器的狀況進行實時的遠程監控。4.安全性好這樣構成的網絡方案可以為服務器提供核心層的保護。在此基礎上構建的防火牆集群系統,可以有效提高防火牆的性能和伸縮性,從而保證校園網絡應用的安全性。5.相對的成本/性能優勢構造這樣的校園網絡系統,在投入成本上是經濟的,容易根據具體的需求定制合適價位的目標系統。