1.Lsf
如何管理各種各樣的計算資源(如:CPU時間、內存空間、網絡帶寬、應用程序等)是許多企業當前都很頭疼的問題。尤其是對於那些員工遍布全球的公司而言,如何充分利用有限的計算資源是非常關鍵的問題。由platform公司開發的lsf 多集群系統使多個異構的計算機能夠通過局域網或廣域網共享計算資源,並能夠為用戶提供對資源的透明訪問。Lsf現在主要支持以下三種大規模資源共享:
Lsf將多個集群連接在一起,一個集群往往是企業中的一個部門,每個集群中有一個主控機,此主控機負責收集該集群系統中的各台主機的負載信息,並且根據各主機的負載信息情況對作業進行調度。各個集群系統之間根據一定的策略進行資源共享。在每個主控機上定義了該集群能共享哪些集群系統中的資源。當用戶發送了一個任務請求時,lsf系統能將此任務發送到對應的資源所在地,並根據調度策略選擇負載較輕的機器對此任務進行處理。當多個用戶請求同一個資源時,根據用戶的請求優先級來確保優先級高的用戶的緊急任務能首先得到滿足。Lsf還具有以下特點:
2.TurboCluster
TurboCluster是一個企業級的集群方案,它允許在多個計算機上構建高可用的、可擴展的網絡。它支持Intel和Alpha芯片,支持Linux 、Windows NT 和Solaris操作系統平台。使用TurboCluster系統可以顯著地提高基於TCP/IP協議的多種網絡服務的服務質量,這些服務包括Web、 Mail、News和Ftp等。TurboCluster具有良好的可用性、可擴展性和可管理性,集群內部的實際服務器的數量可以擴充到無限台。 TurboCluster是一種基於軟件的集群系統解決方案,它還能夠支持異構的網絡環境。它的結構如圖2-1所示。
當客戶向集群系統發送一個請求時,該請求首先到達高級流量管理器,高級流量管理器通過一定的調度策略將此請求轉發到集群中的某一台實際服務器上對此請求進行處理,最終的回應請求將直接發送給客戶。由於最終的回應請求沒有通過高級浏覽管理器而是直接發送給客戶,這樣大大減輕了高級浏覽管理器上的負載,從而降低了瓶頸產生的可能。TurboCluster中采用的調度策略有:輪回(Round Robin)、加權輪回(Weighted Round Robin)、最少連接(Least Connection)。為了減少高級流量管理器產生失效的可能,TurboCluster為高級流量管理器准備了一個備份機。該備份機不斷詢問管理器來確認它正在正常工作,一旦發現主管理器已經失效,備份機將接替它繼續工作。
TurboCluster具有如下一些增強的性能。