在RedHat AS 4下實現軟件RAID是通過mdadm工具實現的
在Redhat Linux AS 4下實現軟件RAID
通常情況下人們在服務器端采用各種冗余磁盤陣列(RAID)技術來保護數據,中高檔的服務器一般都提供了昂貴的硬件RAID控制器。對於資金實力有限的中小企業來講,在Linux下通過軟件來實現硬件的RAID
功能,這樣既節省了投資,又能達到很好的效果。何樂而不為呢?
作為一個面向服務器的網絡型操作系統,Linux對數據的安全和存取速度給予了高度重視,從2.4版內核開始Linux就實現了對軟件RAID的支持(關於RAID的背景知識請見附文),這讓我們可以不必購買昂貴的硬件RAID設備,就能享受到增強的磁盤I/O性能和可靠性,進一步降低了系統的總體擁有成本。下面就讓我們看一個Redhat Linux AS 4下的軟件RAID配置實例吧。
系統配置情況
假設某單位新上了一套使用Oracle數據庫的能量采集系統,該系統數據量極大並且讀寫非常頻繁,實時性要求高,高峰時有近40名用戶在線,對數據庫服務器的磁盤子系統提出了很高的要求。由於預算比較緊張,經過多方比較,最終選擇了采用Linux系統做軟件RAID5的方案。
其配置情況如下:
● 操作系統為RedHat Linux AS 4;
● 內核版本為2.6.9-5.EL;
● 支持RAID0、RAID1、RAID4、RAID5、RAID6;
● 五塊36GB SCSI接口的磁盤,其中RedHat AS 4安裝在第一塊磁盤,其它四塊組成RAID 5用來存放Oracle數據庫。
在RedHat AS 4下實現軟件RAID是通過mdadm工具實現的,其版本為1.6.0,它是一個單一的程序,創建、管理RAID都非常方便,而且也很穩定。而在早期Linux下使用的raidtools,由於維護起來很困難,而且其性能有限,在RedHat AS 4下已經不支持了。
實現過程
1.創建分區
五塊SCSI磁盤分別對應/dev/sda、/dev/sdb、/dev/sdc、/dev/sdd、/dev/sde。其中第一塊磁盤/dev/sda分兩個區,用於安裝RedHat AS 4和做交換分區,其他四塊磁盤每塊只分一個主分區,分別為/dev/sdb1、/dev/sdc1、/dev/sdd1、/dev/sde1,並且將分區類型指定為“fd”,這將使Linux內核能將它們識別為RAID分區,且在每次引導時自動被檢測並啟動。創建分區使用fdisk命令。
# fdisk /dev/sdb
進入fdisk命令行後,使用命令n創建分區,命令t改變分區類型,命令w保存分區表並退出,命令m為幫助。
2.創建RAID 5
這裡使用了/dev/sdb1、/dev/sdc1、/dev/sdd1、/dev/sde1四個設備創建RAID 5,其中/dev/sde1作為備份設備,其他為活動設備。備份設備主要起備用作用,一旦某一設備損壞可以立即用備份設備替換,當然也可以不使用備份設備。命令格式如下:
# mdadm -Cv /dev/md0 -l5 -n3 -x1 -c128 /dev/sd[b,c,d,e]1
命令中各參數分別表示如下作用:“-C”指創建一個新的陣列;“/dev/md0”表示陣列設備名稱;“-l5”表示設置陣列模式,可以選擇0、1、4、5、6,它們分別對應於RAID0、RAID1、RAID4、RAID5、RAID6,這裡設為RAID5模式;“-n3”指設置陣列中活動設備的數目,該數目加上備用設備的數目應等於陣列中的總設備數; “-x1”設置陣列中備份設備的數目,當前陣列中含有1個備份設備;“-c128”指設置塊的尺寸為128KB,缺省為64KB;“/dev/sd[b,c,d,e]1”指當前陣列中包含的所有設備標識符,也可以分開來寫,中間用空格分開,其中最後一個為備份設備。
3.查看陣列狀態
當創建一個新陣列或者陣列重構時,設備需要進行同步操作,這一過程需要一定時間,可以通過查看/proc/mdstat文件,來顯示陣列的當前狀態以及同步進度、所需時間等。
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdd1[3] sde1[4] sdc1[1] sdb1[0]
75469842 blocks level 5, 128k chunk, algorithm 2 [3/2] [UU_]
[>....................] recovery = 4.3% (1622601/37734912) finish=1.0min speed=15146K/sec
unused devices:
當新建或重構完成後,再次查看/proc/mdstat文件:
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdd1[2] sde1[3] sdc1[1] sdb1[0]
75469842 blocks level 5, 128k chunk, algorithm 2 [3/3] [UUU]
unused devices:
通過以上內容,可以很清楚地看出當前陣列的狀態,各部分所代表的意思如下:“[3/3]”中的第一位數表示陣列所包含的設備數,第二位數表示活動的設備數,如果有一個設備損壞,則第二位數將減1;“[UUU]”標記當前陣列可以正常使用的設備情況,現假設/dev/sdb1出現故障,則該標記將變成[_UU],這時的陣列以降級模式運行,即該陣列仍然可用,但是不再具有任何冗余;“sdd1[2]”指陣列所包含的設備數為n,若方括號內的數值小於n,則表示該設備為活動設備,若數值大於等於n,則該設備為備份設備,當一個設備出現故障的時候,相應設備的方括號後將被標以(F)。
4.生成配置文件
mdadm的缺省配置文件為/etc/mdadm.conf,它主要是為了方便陣列的日常管理而設置的,對於陣列而言不是必須的,但是為了減少日後管理中不必要的麻煩,還是應該堅
持把這一步做完。
在mdadm.conf文件中要包含兩種類型的行:一種是以DEVICE開頭的行,它指明在陣列中的設備列表;另一種是以ARRAY開頭的行,它詳細地說明了陣列的名稱、模式、陣列中活動設備的數目以及設備的UUID號。格式如下:
DEVICE /dev/sdb1 /dev/sdc1 /dev/sdd1 /dev/sde1
ARRAY /dev/md0 level=raid5 num-devices=3 UUID=8f128343:715a42df: baece2a8: a5b878e0
以上的這些信息可以通過掃描系統的陣列來獲取,命令為:
# mdadm -Ds
ARRAY /dev/md0 level=raid5 num-devices=3 UUID=8f128343:715a42df: baece2a8: a5b878e0
devices=/dev/sdb1,/dev/sdc1,/dev/sdd1,/dev/sde1
使用vi命令,按照規定的格式編輯修改/etc/mdadm.conf文件
# vi /etc/mdadm.conf
5.創建文件系統並掛接(mount)使用
RAID5已經啟動並處於運行狀態,現在要做的就是在其上創建一個文件系統,這裡使用mkfs命令,文件系統類型為ext3。命令如下:
# mkfs -t ext3 /dev/md0
當新的文件系統生成之後,就可以將/dev/md0掛接到指定的目錄了。命令如下:
# mount /dev/md0 /mnt/raid
為了讓系統在啟動時自動將/dev/md0掛接到/mnt/raid,還需要修改/etc/fstab文件,添加如下內容:
/dev/md0 /mnt/raid ext3 defaults 0 0
故障模擬
上面的實例,讓我們對Redhat Linux AS 4的軟件RAID功能有了一定的認識,並且通過詳細的步驟說明了如何創建RAID5。有了RAID做保障,電腦裡的數據看起來似乎已經很安全了,然而現有的情況還是不能讓我們高枕無憂,想一想,萬一磁盤出現故障怎麼辦?下面我們模擬一個更換RAID5故障磁盤的完整過程,希望以此豐富大家處理RAID5故障的經驗,提高管理和維護水平。
我們仍然沿用上面的RAID5配置,首先往陣列中拷貝一些數據,接下來開始模擬/dev/sdb1設備故障。不過,對於無備份設備的RAID5的模擬過程也要經過如下三步,只是陣列重構和數據恢復是發生在新設備添加到陣列中之後,而不是設備損壞時。
1.將/dev/sdb1標記為已損壞的設備
# mdadm /dev/md0 -f /dev/sdb1
查看當前陣列狀態
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdd1[2] sde1[3] sdc1[1] sdb1[4](F)
75469842 blocks level 5, 128k chunk, algorithm 2 [3/2] [_UU]
[=>...................] recovery = 8.9% (3358407/37734912) finish=1.6min speed=9382K/sec
unused devices:
因為有備份設備,所以當陣列中出現設備損壞時,陣列能夠在短時間內實現重構和數據的恢復。從當前的狀態可以看出,陣列正在重構,且運行在降級模式,sdb1[4]的後面已經標上了(F),活動設備數也降為2個。
經過幾分鐘後,再次查看當前陣列狀態。
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdd1[2] sde1[0] sdc1[1] sdb1[3](F)
75469842 blocks level 5, 128k chunk, algorithm 2 [3/3] [UUU]
unused devices:
此時陣列重構已經完成,數據恢復完畢,原有的備份設備sde1成為了活動設備。
2.移除損壞的設備
# mdadm /dev/md0 -r /dev/sdb1
查看當前陣列的狀態:
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdd1[2] sde1[0] sdc1[1]
75469842 blocks level 5, 128k chunk, algorithm 2 [3/3] [UUU]
unused devices:
損壞的sdb1已經從陣列中移掉。
3.將新設備添加到陣列中
因為是模擬操作,可以通過下面的命令再次將/dev/sdb1添加到陣列中。如果是實際操作則要注意兩點:一是在添加之前要對新磁盤進行正確的分區;二是添加時要用所添加設備的設備名替換/dev/sdb1。
# mdadm /dev/md0 -a /dev/sdb1
查看當前陣列的狀態:
# more /proc/mdstat
Personalities : [raid5]
md0 : active raid5 sdb1[3] sdd1[2] sde1[0] sdc1[1]
75469842 blocks level 5, 128k chunk, algorithm 2 [3/3] [UUU]
unused devices:
這時sdb1作為備份設備再次出現在陣列中
常用陣列維護命令
1.啟動陣列
# mdadm -As /dev/md0
該命令指啟動/dev/md0陣列,其中“-A”指裝載一個已存在的陣列;“-s”指查找mdadm.conf文件中的配置信息,並以此為依據啟動陣列。
#mdadm -As
該命令指啟動mdadm.conf文件中的所有陣列。
#mdadm -A /dev/md0 /dev/sd[b,c,d,e]1
如果沒有創建mdadm.conf文件則可以采用上面這種啟動方式。
2.停止陣列
# mdadm -S /dev/md0
3.顯示指定陣列的詳細信息
# mdadm -D /dev/md0
鏈接
RAID簡介
RAID是冗余磁盤陣列(Redundant Array of Inexpensive Disk)的簡稱。它是把多個磁盤組成一個陣列,當作單一磁盤使用。它將數據以分段(striping)的方式分散存儲在不同的磁盤中,通過多個磁盤的同時讀寫,來減少數據的存取時間,並且可以利用不同的技術實現數據的冗余,即使有一個磁盤損壞,也可以從其他的磁盤中恢復所有的數據。簡單地說,其好處就是:安全性高、速度快、數據容量大。
磁盤陣列根據其使用的技術不同而劃分了等級,稱為RAID level,目前公認的標准是RAID 0~RAID 5。其中的level並不代表技術的高低,RAID 5並不高於RAID 4 ,RAID 0並不低於RAID 2 ,至於選擇哪一種RAID需視用戶的需求而定。下面分別對常用的RAID 0、RAID 1、RAID 5進行簡單的介紹。
1.RAID 0
特點:它是將多個磁盤並列起來,成為一個大硬盤。在存取數據時,將數據按磁盤的個數來進行分段,然後同時將這些數據寫進這些盤中。在所有的級別中,RAID 0的速度是最快的。但沒有數據冗余,陣列中任何一個磁盤壞掉,意味著所有數據丟失。
磁盤利用數:n(假設有n個磁盤)。
配置條件:最低兩塊磁盤,且分區大小盡量相同。
應用領域:對高磁盤容量及高速磁盤存取有特殊需求,而又不計較其高故障率的工作。當然,如果你正在使用集群,RAID 0 無疑是提高磁盤I/O性能的最好方法,因為在這種情況下,你就不用擔心冗余的問題了。
2.RAID 1
特點:使用磁盤鏡像(disk mirroring)的技術,在一個磁盤上存放數據的同時也在另一個磁盤上寫一樣的數據。因為有了備份磁盤,所以RAID 1的數據安全性在所有的RAID級別上來說是最好的。盡管其寫入數據的速度比較慢,但因其數據是以分段的方式作儲存,因而在讀取時,它幾乎和RAID 0有同樣的性能。
磁盤利用數:n/2。
配置條件:最低兩塊磁盤,且分區大小盡量相同。
應用領域:數據庫、金融系統等一些對數據有著高可靠性要求的領域。再者就是系統中寫數據量比較少,而讀數據量又比較多的情況下可以采用這一模式。
3.RAID 5
特點:以數據的校驗位來保證數據的安全,但它不是以單獨硬盤來存放數據的校驗位,而是將數據段的校驗位交互存放於各個磁盤上。這樣,任何一個磁盤損壞,都可以根據其他磁盤上的校驗位來重建損壞的數據。並行讀寫數據,性能也很高。
磁盤利用數:n-1。
配置條件:最低三塊硬盤,且分區大小盡量相同。
應用領域:適合於事務處理環境,例如民航售票處、銷售系統等。
山東省蓬萊市電業公司信息中心 孫開雲
2005-7-25 17:27:26