歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
您现在的位置: Linux教程網 >> UnixLinux >  >> Linux基礎 >> 關於Linux

Glusterfs集群分布式文件系統掉brick的處理

我們最近在一個已經正常運行半年左右的一個gluster分布式文件系統集群中發現一個Brick掉線了。
Volume Name: web-volume
Type: Replicate
Volume ID: cd9bf5ad-1b5f-404b-8279-6de12b8838ec
Status: Started
Number of Bricks: 1 x 3 = 3
Transport-type: tcp
Bricks:
Brick1: 10.48.83.204:/data/gfs
Brick2: 10.48.83.200:/data/gfs
Brick3: 10.48.83.196:/data/gfs
Status of volume: web-volume
Gluster process Port Online Pid
——————————————————————————
Brick 10.48.83.204:/data/gfs 49152 Y 1791
Brick 10.48.83.200:/data/gfs 49152 Y 17406
Brick 10.48.83.196:/data/gfs N/A N N/A

這個節點是SSD盤,由於SSD極其個別會出現IO故障導致。我們決定將該節點下線,更換新的SSD。更換過程中我們的GFS文件系統內容數據一點也不收影響。這歸功於GlusterFS,這不是我們今天主要想表達的。
我們今天主要是談論如何將新的SSD節點brick重新加入集群。
1.將節點196的/data/掛載
2.我們需要首先得到GFS的文件擴展屬性(在正常節點做),如下:
[[email protected] ~]# getfattr -d -m ‘.*’ /data/gfs
getfattr: Removing leading ‘/’ from absolute path names
# file: data/gfs
trusted.afr.web-volume-client-0=0sAAAAAAAAAAAAAAAA
trusted.afr.web-volume-client-1=0sAAAAAAAAAAAAAAAA
trusted.afr.web-volume-client-2=0sAAAAAAAAAAAAAAAA
trusted.gfid=0sAAAAAAAAAAAAAAAAAAAAAQ== ;得到trusted.gfid的值
trusted.glusterfs.dht=0sAAAAAQAAAAAAAAAA/////w==
trusted.glusterfs.volume-id=0szZv1rRtfQEuCeW3hK4g47A== ;得到 trusted.glusterfs.volume-id的值
3.設置196的gfs文件夾擴展屬性,如下:
setfattr -n trusted.glusterfs.volume-id -v 0szZv1rRtfQEuCeW3hK4g47A== /data/gfs
setfattr -n trusted.gfid -v 0sAAAAAAAAAAAAAAAAAAAAAQ== /data/gfs
4.重啟GFS服務{/etc/init.d/glusterd restart}
5.@196執行getfattr -d -m ‘.*’ /data/gfs;加入完成!
數據會像Raid1一樣同步過來,如果你的集群是條帶的,也是一樣。

Copyright © Linux教程網 All Rights Reserved