如今在IT工業中,虛擬技術的發展已經蓄勢待發,但在Linux集群中卻難以成功。Beowulf工程的創始人之一Donald Becker說,這是一件令人遺憾的事情,因為該系統僅提供一個沒有任何意義的虛擬選項。
Becker 說,Linux集群系統應該更加注重虛擬技術以及高可行性的發展,並在他的采訪中說明了理由。同時他對改用Linux集群的對稱多處理用戶提出了一些建議。
除了他在Beowulf中的角色以外,Becker 還是Scyld軟件的創始人以及主要科學家。他還剛剛加入了本站的專家組,並作為一個特邀專家來回答用戶的有關Linux集群以及服務器的問題。
*在Linux集群技術中有什麼最新的進展嗎?
Donald Becker:現在,集群技術中的發展熱點是虛擬技術。兩個著名的傳統虛擬技術系統是VMWare和Xen。VMWare仿效並模擬個人電腦的硬件設備。這使得它可以在自己的OS中運行幾乎所有的操作系統。
然而,虛擬技術發展的一個缺點是它經常暗含、依賴一些大的上層技術。結果,VMWare模仿一些上層技術從而沒有什麼機會來優化系統。Xen是一個同時運行多個操作系統的系統管理程序。它不是全面的模仿,從而減少了對上層技術的依賴。但是,它仍然需要優化它的核心技術。
*Linux集群上的虛擬技術與其他的方法有什麼不同?
Becker:VMWare 和 Xen二者都設想,它們可以運行並全面安裝多個內核。運行集群就提供了不被虛擬技術所限制的機會,創造一個僅僅運行應用程序必需條件的輕松環境。當系統服務器有一個任務需要主要的網絡終端來完成,這時該計算機終端只需要運行該應用程序,這樣就可以提高工作效率,這也正式和傳統的虛擬系統的不同之處。
*一些IT實業派說,他們用對稱多處理(SMP)系統進行高強度的數據計算。這些技術在移植Linux集群時會遇到那些挑戰呢?
Becker:這個問題的答案很大程度的取決於你所運行的應用的應用程序。
最早的進入集群的應用程序的類型是用戶參數的執行系統。在該模型中,多個相互獨立的應用程序是運行在不同的數據處理機上。
如果對稱多處理(SMP)系統被應用是基於它對單進程工作的高效率,Beowulf的集群將是一個不錯的替代品。然而,如果對稱多處理(SMP)系統是基於共用存儲器多進程工作,那麼可能致使應用程序的結構復雜化。
一個傳統的應用SMP的場合是轉換型數據庫。這是一個精細通訊及鎖定在SMP上運行的特殊情況,但在集群上可以取得同樣的結果。所以需要作細致的分析以決定SMP移植進集群是否是可行的。
大部分的程序不能兼容於這兩個極端。
*Linux集群能夠最終取得高可行性(HA),還是只能保持其固有的復雜性?
Becker:可量測性並不排除其高實用性,所以Linux集群能夠取得高的實用性(HA)。高實用性(HA)是基於對商務上的應用程序及數據等的穩定的支持上。計算機程序等的正常運行時間的標准應該在99.999%以上,也就是說一天最多只能有一秒鐘的停工。
經典的高效集群配置包括兩個服務器,能夠分別了解對方的狀態並共用一個存儲子系統。如果任何一個服務器出現故障,則另一個將會承擔所有的工作。高效集群取得穩定的可靠性是通過故障排除、負載平衡、贅余處理以及其他的一些方式來將兩台或多台服務器連接在一起,從而減少必然的或偶然的儲存損耗並且共用存儲設備。
由於它們的絕對容量的限制,大的集群很可能頻繁的出現問題,所以就需要設計如何處理這些問題的程序。然而,這種設計不會自動發生,現在市場上的很多工具都沒有解決這種問題。設計周全的子系統,例如一些具有很好的管理能力的商業評定的系統,能夠處理增加的可量測性。這就意味著測量各種各樣的參數並避免那些多如牛毛的問題,這些問題經常發生在一個終端占據了大量的存儲頁面或系統文件數據而導致其他的終端無法工作時。
*在Linux集群系統中取得高效性有哪些途徑呢?
Becker:在集群系統的配置中,多個服務器在同一系統是通過中央控制點來管理的。這代表高效性狀態的一個明顯優勢,因為有很多服務器可以進入的備份資源,這就允許了24 x 7的可行性,錯誤維護,對於分散應用程序的中央管理,對大型數據資源的處理能力以及動態網站出版和災難修復。
選擇一種適當的方法來保證停機期以及重新啟動期的數據完整性是十分重要的。不幸的是,不是所有的選擇都可以提高可靠性以及保持數據完整性。所以,在工作時合理的選擇你的執行程序是很重要的。
一些非商業性的集群系統創造了一個局部的單一系統設想,通過一下方式完成:請求網絡虛擬內存;或全球同一的文件系統;或進行一個明晰的系統移植。然而,這種設計無法很好的處理錯誤問題,因為任何一台終端出現問題時,系統必須花費一定的時間去修復或者停止所有和這台及其關聯的程序。
一個好的解決方法是保證集群的主要終端持續運行。對於大的安裝系統來說,要保證一個主要終端通過常規的設備備份和災難恢復;或者同時多個主要終端的方法。換一種說法,計算機終端可以加入或離開集群,而不影響基礎系統即使是在它之上的應用程序已經停止的情況下。
來源:techtarget