隨著數據量的增長,重復數據刪除正在成為數據管理、備份和恢復的重要部分。IBM 的 ProtecTIER 重復數據刪除產品經理 Victor Nemechek 說,“ProtecTIER 如此重要的原因之一是,隨著世界向全數字環境發展,數據增長的速度越來越瘋狂了。客戶常常發現他們的數據每年增加一倍甚至更多,他們的備份系統很難及時地捕捉、保護和恢復數據。”
對於備份,許多公司使用磁帶,磁帶可以快速地裝載數據,但是這會給獲取數據造成問題。這些難題(以及可靠性問題)促使客戶改用磁盤,磁盤上的數據的可訪問性更好,但是磁盤更貴。公司往往用磁盤保存少部分最重要的數據,而把舊數據保存在磁帶上。Nemechek 說,“即使用磁盤保存重要的數據,備份仍然是一個問題,因為您用一個主磁盤存儲數據,還必須用同樣大的磁盤備份它,因此磁盤需求基本上會加倍,這種方法非常昂貴。”
解決磁盤的問題
重復數據刪除解決磁盤到磁盤備份的難題。Nemechek 說,“在傳統的備份集裡常常有重復的數據,重復數據刪除檢查數據,尋找縮減數據的方法。” 以一份發送給 20 個人的 PowerPoint 演示文稿為例。備份應用程序會存儲在系統上找到的所有 20 個拷貝。重復數據刪除會發現已經存儲的數據,然後可以只存儲一個拷貝並讓其他實例指向它,而不需要使用額外的磁盤空間。
重復數據刪除技術也在字節級起作用。Nemechek 說,“它可以發現任何多次存儲的數據。例如,假設有一個公司徽標。在 PowerPoints、Word 文檔和網站上都可能有這個徽標,它幾乎無處不在,而且不隨位置變化。重復數據刪除技術會發現它曾經遇到過這些數據,不會再次寫入它。”
這讓客戶可以在少量磁盤上存儲更多的數據,據 Nemechek 所說,一般可以達到 25 比 1 的縮減率。“重復數據刪除可以把 25 TB 的數據縮減並存儲在只有 1 TB 的物理磁盤上,因此客戶可以享有磁盤的速度和可靠性優勢,同時不必負擔一比一的成本。這樣,他們就可以把更多的數據備份到磁盤上,而不是只在磁盤上備份最重要的數據。”
在備份和恢復操作中引入磁盤並不容易。但是,ProtecTIER 的虛擬磁帶庫 (VTL) 可以提供磁盤備份操作的速度、可靠性和可用性。通過使用磁盤,客戶可以實現更好的數據吞吐量性能、可用性、數據保護,減少機械和人為錯誤,提高恢復速度。因為 VTL 精確地模擬磁帶庫,客戶不需要修改現有的備份策略、實踐或過程。
Nemechek 說,“只需在備份應用程序中做一個非常簡單的修改,所以它不會破壞客戶目前的工作方式。他們備份數據的方式與以前完全一樣,但是備份到磁盤比備份到磁帶快得多。現在,數據存儲在磁盤上,客戶可以更快速地恢復數據,更可靠地備份數據,還可以執行一些更強大的操作。”
沒有沖突
大多數 IT 組織花費了大量時間建立備份過程。但是,很難確保備份的工作是可靠的。Nemechek 說,“在使用一個備份應用程序幾年之後,客戶常常會發現需要根據自己的環境調整它。”
Nemechek 補充說,“市場上的其他解決方案也可以提供重復數據刪除技術,但是它們需要重新調整整個基礎設施。重做所有工作太瘋狂了,需要改動客戶已經花費幾年時間調整好的東西。工作量遠遠超過帶來的好處。”
前瞻
2008 年 4 月,IBM 收購了 Diligent Technologies,這家公司開發了 ProtecTIER 和運行它的 HyperFactor 技術。這是一次著眼於未來的行動。Nemechek 說,“IBM 收購它是因為它了解重復數據刪除是一種強大的功能,客戶需要通過這種功能把更多數據備份到磁盤,成本必須是可以負擔的,而且要可靠。”
重復數據刪除技術鞏固了 IBM 在存儲領域的領先地位,其他一些競爭對手剛剛實現這種功能,他們為缺乏遠見付出了重大代價。
Nemechek 說,“各種規模的組織都要應付快速增長的數據,需要縮短備份時間窗和提高數據可用性。ProtecTIER 解決方案確實是目前市場上最好的技術。它的一些可伸縮性和性能特性目前無人能及。”
不使用散列
ProtecTIER 與市場上的類似產品之間的主要差異是,它並不基於散列算法。散列是一種有 10 年歷史的老技術,它會消耗大量空間而且常常不正確地存儲數據,這會造成數據損壞、完整性問題和數據丟失。
對於它存儲的每塊數據,基於散列的方法必須存儲散列信息以便跟蹤數據。盡管這是一種負擔,但是如果客戶只存儲少量數據,這種方法還是可行的。隨著數據量的增加,散列表會降低性能,導致客戶需要更多的處理能力。
IBM ProtecTIER 不使用散列算法。ProtecTIER 技術只用 4 GB 數據(IBM 把存儲這些數據的文件稱為索引文件)跟蹤最多 1 PB 的存儲。
Nemechek 說,“跟蹤極大量的存儲所需的只是一個非常小的索引文件。這避免了基於散列的解決方案的問題。散列表常常達到數十 TB,因此可管理性非常差,還會降低系統性能。但是,無論向 ProtecTIER 解決方案發送多少數據,我們都不使用會不斷增大的散列表,這可以提供高性能,讓這個解決方案可以處理大量數據。”
原生復制
ProtecTIER 現在提供另一個非常有價值的存儲解決方案。原生復制讓客戶可以以電子方式把備份發送到離站位置。這個特性從 9 月起已經可以在 AIX 和 IBM i 上使用了。通常,客戶把所有數據備份到磁帶或磁盤上並制作另一個拷貝,他們必須把這個拷貝運送到離站位置。這種方法花費的時間長,成本高,風險大。
Nemechek 說,“備份磁帶上常常有公司最重要的數據,包括客戶和財務情況的信息。這確實是無價的信息。原生復制不但可以節約成本,還可以限制風險。不再需要人工運送數據,ProtecTIER 可以以電子方式發送它。這意味著過程是自動化的,人工工作量更少,速度更快,而且不會在途中丟失。”
因為 ProtecTIER 讓客戶可以把大量數據縮減並存儲在少量物理磁盤上,所以以電子方式傳輸數據所需的帶寬並不太大。這可以提供更快、更簡便的災難恢復方法。
Nemechek 說,“如果沒有重復數據刪除,這是不可能實現的。典型 IT 環境的備份數據達到 100 TB,以電子方式發送它們所需的基礎設施太大、太昂貴,是不現實的。現在有了 ProtecTIER,我們只需發送新的獨特的少量數據。它可以接收極大量的備份數據,通過不大的帶寬把數據非常高效地發送到離站位置。”
詳細信息
ProtecTIER 解決方案提供兩個配置。ProtecTIER 工具提供預先配置的現成的解決方案。工具提供處理能力從 7 到 36 TB 的四個配置。ProtecTIER 網關是一個定制的解決方案,適用於特殊的性能和處理能力需求。網關提供 ProtecTIER 引擎、軟件和服務器,可以擴展到處理 1 PB 信息。
可以通過單獨的 VTL 在開放系統和 IBM i 主機之間共享 ProtecTIER 存儲庫。除了支持 AIX 5.2、5.3 和 6.1 以及 IBM i 5.4 和 6.1 之外,ProtecTIER 還與任何備份恢復和介質服務平滑地集成,可以使用原生 IBM i SAVE 命令。目前,這個解決方案只經過 Rochester、Minn. 和 IBM i 團隊的測試和認證。Nemechek 說,ProtecTIER 在不遠的將來就可以在 IBM 大型機上使用了。
出色的數據縮減
重復數據刪除讓公司可以縮減數據,從而降低備份成本。他們可以使用 ProtecTIER 解決方案改進備份過程,降低丟失數據的風險,節約時間和資金。