理解 Linux 的硬鏈接與軟鏈接
從
inode 了解 Linux 文件系統硬鏈接與軟鏈接是 Linux 文件系統中的一個重要概念,其涉及文件系統中的索引節點 (index node 又稱 inode),而索引節點對象是 Linux 虛擬文件系統 (VFS) 的四個基本概念之一。通過剖析硬鏈接與軟鏈接的聯系與區別,我們可更好的了解 Linux 中 VFS 這一通用文件模型。並讓 Linux 普通用戶和系統管理員正確使用硬鏈接與軟鏈接,幫助文件系統開發者獲取 inode 的相關知識。
3
評論
王
華東, 自由職業者
2012 年 12 月 20 日
內容
在 IBM Bluemix 雲平台上開發並部署您的下一個應用。
開始您的試用
Linux 的文件與目錄
現代操作系統為解決信息能獨立於進程之外被長期存儲引入了文件,文件作為進程創建信息的邏輯單元可被多個進程並發使用。在 UNIX 系統中,操作系統為磁盤上的文本與圖像、鼠標與鍵盤等輸入設備及網絡交互等 I/O 操作設計了一組通用 API,使他們被處理時均可統一使用字節流方式。換言之,UNIX 系統中除進程之外的一切皆是文件,而 Linux 保持了這一特性。為了便於文件的管理,Linux 還引入了目錄(有時亦被稱為文件夾)這一概念。目錄使文件可被分類管理,且目錄的引入使 Linux 的文件系統形成一個層級結構的目錄樹。清單
1.所示的是普通 Linux 系統的頂層目錄結構,其中 /dev 是存放了設備相關文件的目錄。
清單 1. Linux 系統的頂層目錄結構/ 根目錄
├── bin 存放用戶二進制文件
├── boot 存放內核引導配置文件
├── dev 存放設備文件
├── etc 存放系統配置文件
├── home 用戶主目錄
├── lib 動態共享庫
├── lost+found 文件系統恢復時的恢復文件
├── media 可卸載存儲介質掛載點
├── mnt 文件系統臨時掛載點
├── opt 附加的應用程序包
├── proc 系統內存的映射目錄,提供內核與進程信息
├── root root 用戶主目錄
├── sbin 存放系統二進制文件
├── srv 存放服務相關數據
├── sys sys 虛擬文件系統掛載點
├── tmp 存放臨時文件
├── usr 存放用戶應用程序
└── var 存放郵件、系統日志等變化文件
Linux 與其他類 UNIX 系統一樣並不區分文件與目錄:目錄是記錄了其他文件名的文件。使用命令 mkdir 創建目錄時,若期望創建的目錄的名稱與現有的文件名(或目錄名)重復,則會創建失敗。
# ls -F /usr/bin/zi*
/usr/bin/zip* /usr/bin/zipgrep* /usr/bin/zipnote*
/usr/bin/zipcloak* /usr/bin/zipinfo* /usr/bin/zipsplit*
# mkdir -p /usr/bin/zip
mkdir: cannot create directory `/usr/bin/zip': File exists
Linux 將設備當做文件進行處理,清單 2.展示了如何打開設備文件
/dev/input/event5 並讀取文件內容。文件 event5 表示一種輸入設備,其可能是鼠標或鍵盤等。查看文件 /proc/bus/input/devices 可知 event5 對應設備的類型。設備文件 /dev/input/event5 使用 read() 以字符流的方式被讀取。結構體 input_event 被定義在內核頭文件 linux/input.h 中。
清單 2. 打開並讀取設備文件int fd;
struct input_event ie;
fd = open("/dev/input/event5", O_RDONLY);
read(fd, &ie, sizeof(struct input_event));
printf("type = %d code = %d value = %d\n",
ie.type, ie.code, ie.value);
close(fd);
回頁首
硬鏈接與軟鏈接的聯系與區別
我們知道文件都有文件名與數據,這在 Linux 上被分成兩個部分:用戶數據 (user data) 與元數據 (metadata)。用戶數據,即文件數據塊 (data block),數據塊是記錄文件真實內容的地方;而元數據則是文件的附加屬性,如文件大小、創建時間、所有者等信息。在 Linux 中,元數據中的 inode 號(inode 是文件元數據的一部分但其並不包含文件名,inode 號即索引節點號)才是文件的唯一標識而非文件名。文件名僅是為了方便人們的記憶和使用,系統或程序通過 inode 號尋找正確的文件數據塊。圖
1.展示了程序通過文件名獲取文件內容的過程。
圖 1. 通過文件名打開文件
清單 3. 移動或重命名文件# stat /home/harris/source/glibc-2.16.0.tar.xz
File: `/home/harris/source/glibc-2.16.0.tar.xz'
Size: 9990512 Blocks: 19520 IO Block: 4096 regular file
Device: 807h/2055d Inode: 2485677 Links: 1
Access: (0600/-rw-------) Uid: ( 1000/ harris) Gid: ( 1000/ harris)
...
...
# mv /home/harris/source/glibc-2.16.0.tar.xz /home/harris/Desktop/glibc.tar.xz
# ls -i -F /home/harris/Desktop/glibc.tar.xz
2485677 /home/harris/Desktop/glibc.tar.xz
在 Linux 系統中查看 inode 號可使用命令 stat 或 ls -i(若是 AIX 系統,則使用命令 istat)。清單
3.中使用命令 mv 移動並重命名文件 glibc-2.16.0.tar.xz,其結果不影響文件的用戶數據及 inode 號,文件移動前後 inode 號均為:2485677。
為解決文件的共享使用,Linux 系統引入了兩種鏈接:硬鏈接 (hard link) 與軟鏈接(又稱符號鏈接,即 soft link 或 symbolic link)。鏈接為 Linux 系統解決了文件的共享使用,還帶來了隱藏文件路徑、增加權限安全及節省存儲等好處。若一個 inode 號對應多個文件名,則稱這些文件為硬鏈接。換言之,硬鏈接就是同一個文件使用了多個別名(見 圖
2.hard link 就是 file 的一個別名,他們有共同的 inode)。硬鏈接可由命令 link 或 ln 創建。如下是對文件 oldfile 創建硬鏈接。
link oldfile newfile
ln oldfile newfile
由於硬鏈接是有著相同 inode 號僅文件名不同的文件,因此硬鏈接存在以下幾點特性:
文件有相同的 inode 及 data block;
只能對已存在的文件進行創建;
不能交叉文件系統進行硬鏈接的創建;
不能對目錄進行創建,只可對文件創建;
刪除一個硬鏈接文件並不影響其他有相同 inode 號的文件。
清單 4. 硬鏈接特性展示# ls -li
total 0
// 只能對已存在的文件創建硬連接
# link old.file hard.link
link: cannot create link `hard.link' to `old.file': No such file or directory
# echo "This is an original file" > old.file
# cat old.file
This is an original file
# stat old.file
File: `old.file'
Size: 25 Blocks: 8 IO Block: 4096 regular file
Device: 807h/2055d Inode: 660650 Links: 2
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
...
// 文件有相同的 inode 號以及 data block
# link old.file hard.link | ls -li
total 8
660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 hard.link
660650 -rw-r--r-- 2 root root 25 Sep 1 17:44 old.file
// 不能交叉文件系統
# ln /dev/input/event5 /root/bfile.txt
ln: failed to create hard link `/root/bfile.txt' => `/dev/input/event5':
Invalid cross-device link
// 不能對目錄進行創建硬連接
# mkdir -p old.dir/test
# ln old.dir/ hardlink.dir
ln: `old.dir/': hard link not allowed for directory
# ls -iF
660650 hard.link 657948 old.dir/ 660650 old.file
文件 old.file 與 hard.link 有著相同的 inode 號:660650 及文件權限,inode 是隨著文件的存在而存在,因此只有當文件存在時才可創建硬鏈接,即當 inode 存在且鏈接計數器(link count)不為 0 時。inode 號僅在各文件系統下是唯一的,當 Linux 掛載多個文件系統後將出現 inode 號重復的現象(如 清單
5.所示,文件 t3.jpg、sync 及 123.txt 並無關聯,卻有著相同的 inode 號),因此硬鏈接創建時不可跨文件系統。設備文件目錄 /dev 使用的文件系統是 devtmpfs,而 /root(與根目錄 / 一致)使用的是磁盤文件系統 ext4。清單
5.展示了使用命令 df 查看當前系統中掛載的文件系統類型、各文件系統 inode 使用情況及文件系統掛載點。
清單 5. 查找有相同 inode 號的文件# df -i --print-type
Filesystem Type Inodes IUsed IFree IUse% Mounted on
/dev/sda7 ext4 3147760 283483 2864277 10% /
udev devtmpfs 496088 553 495535 1% /dev
tmpfs tmpfs 499006 491 498515 1% /run
none tmpfs 499006 3 499003 1% /run/lock
none tmpfs 499006 15 498991 1% /run/shm
/dev/sda6 fuseblk 74383900 4786 74379114 1% /media/DiskE
/dev/sda8 fuseblk 29524592 19939 29504653 1% /media/DiskF
# find / -inum 1114
/media/DiskE/Pictures/t3.jpg
/media/DiskF/123.txt
/bin/sync
值得一提的是,Linux 系統存在 inode 號被用完但磁盤空間還有剩余的情況。我們創建一個 5M 大小的 ext4 類型的 mo.img 文件,並將其掛載至目錄 /mnt。然後我們使用一個 shell 腳本將掛載在 /mnt 下 ext4 文件系統的 indoe 耗盡(見清單 6.)。
清單 6. 測試文件系統 inode 耗盡但仍有磁盤空間的情景# dd if=/dev/zero of=mo.img bs=5120k count=1
# ls -lh mo.img
-rw-r--r-- 1 root root 5.0M Sep 1 17:54 mo.img
# mkfs -t ext4 -F ./mo.img
...
OS type: Linux
Block size=1024 (log=0)
Fragment size=1024 (log=0)
Stride=0 blocks, Stripe width=0 blocks
1280 inodes, 5120 blocks
256 blocks (5.00%) reserved for the super user
...
...
Writing superblocks and filesystem accounting information: done
# mount -o loop ./mo.img /mnt
# cat /mnt/inode_test.sh
#!/bin/bash
for ((i = 1; ; i++))
do
if [ $? -eq 0 ]; then
echo "This is file_$i" > file_$i
else
exit 0
fi
done
# ./inode_test.sh
./inode_test.sh: line 6: file_1269: No space left on device
# df -iT /mnt/; du -sh /mnt/
Filesystem Type Inodes IUsed IFree IUse% Mounted on
/dev/loop0 ext4 1280 1280 0 100% /mnt
1.3M /mnt/
硬鏈接不能對目錄創建是受限於文件系統的設計(見 清單 4.對目錄創建硬鏈接將失敗)。現
Linux 文件系統中的目錄均隱藏了兩個個特殊的目錄:當前目錄(.)與父目錄(..)。查看這兩個特殊目錄的 inode 號可知其實這兩目錄就是兩個硬鏈接(注意目錄 /mnt/lost+found/ 的 inode 號)。若系統允許對目錄創建硬鏈接,則會產生目錄環。
# ls -aliF /mnt/lost+found
total 44
11 drwx------ 2 root root 12288 Sep 1 17:54 ./
2 drwxr-xr-x 3 root root 31744 Sep 1 17:57 ../
# stat /mnt/lost+found/
File: `/mnt/lost+found/'
Size: 12288 Blocks: 24 IO Block: 1024 directory
Device: 700h/1792d Inode: 11 Links: 2
Access: (0700/drwx------) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2012-09-01 17:57:17.000000000 +0800
Modify: 2012-09-01 17:54:49.000000000 +0800
Change: 2012-09-01 17:54:49.000000000 +0800
Birth: -
軟鏈接與硬鏈接不同,若文件用戶數據塊中存放的內容是另一文件的路徑名的指向,則該文件就是軟連接。軟鏈接就是一個普通文件,只是數據塊內容有點特殊。軟鏈接有著自己的 inode 號以及用戶數據塊(見 圖
2.)。因此軟鏈接的創建與使用沒有類似硬鏈接的諸多限制:
軟鏈接有自己的文件屬性及權限等;
可對不存在的文件或目錄創建軟鏈接;
軟鏈接可交叉文件系統;
軟鏈接可對文件或目錄創建;
創建軟鏈接時,鏈接計數 i_nlink 不會增加;
刪除軟鏈接並不影響被指向的文件,但若被指向的原文件被刪除,則相關軟連接被稱為死鏈接(即 dangling link,若被指向路徑文件被重新創建,死鏈接可恢復為正常的軟鏈接)。
圖 2. 軟鏈接的訪問
清單 7. 軟鏈接特性展示# ls -li
total 0
// 可對不存在的文件創建軟鏈接
# ln -s old.file soft.link
# ls -liF
total 0
789467 lrwxrwxrwx 1 root root 8 Sep 1 18:00 soft.link -> old.file
// 由於被指向的文件不存在,此時的軟鏈接 soft.link 就是死鏈接
# cat soft.link
cat: soft.link: No such file or directory
// 創建被指向的文件 old.file,soft.link 恢復成正常的軟鏈接
# echo "This is an original file_A" >> old.file
# cat soft.link
This is an original file_A
// 對不存在的目錄創建軟鏈接
# ln -s old.dir soft.link.dir
# mkdir -p old.dir/test
# tree . -F --inodes
.
├── [ 789497] old.dir/
│ └── [ 789498] test/
├── [ 789495] old.file
├── [ 789495] soft.link -> old.file
└── [ 789497] soft.link.dir -> old.dir/
當然軟鏈接的用戶數據也可以是另一個軟鏈接的路徑,其解析過程是遞歸的。但需注意:軟鏈接創建時原文件的路徑指向使用絕對路徑較好。使用相對路徑創建的軟鏈接被移動後該軟鏈接文件將成為一個死鏈接(如下所示的軟鏈接 a 使用了相對路徑,因此不宜被移動),因為鏈接數據塊中記錄的亦是相對路徑指向。
$ ls -li
total 2136
656627 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 a -> data.txt
656662 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 b -> a
656228 -rw------- 1 harris harris 2186738 Sep 1 14:37 data.txt 6
回頁首
鏈接相關命令
在 Linux 中查看當前系統已掛著的文件系統類型,除上述使用的命令 df,還可使用命令 mount 或查看文件 /proc/mounts。
# mount
/dev/sda7 on / type ext4 (rw,errors=remount-ro)
proc on /proc type proc (rw,noexec,nosuid,nodev)
sysfs on /sys type sysfs (rw,noexec,nosuid,nodev)
...
...
none on /run/shm type tmpfs (rw,nosuid,nodev)
命令 ls 或 stat 可幫助我們區分軟鏈接與其他文件並查看文件 inode 號,但較好的方式還是使用 find 命令,其不僅可查找某文件的軟鏈接,還可以用於查找相同 inode 的所有硬鏈接。(見清單 8.)
清單 8. 使用命令 find 查找軟鏈接與硬鏈接// 查找在路徑 /home 下的文件 data.txt 的軟鏈接
# find /home -lname data.txt
/home/harris/debug/test2/a
// 查看路徑 /home 有相同 inode 的所有硬鏈接
# find /home -samefile /home/harris/debug/test3/old.file
/home/harris/debug/test3/hard.link
/home/harris/debug/test3/old.file
# find /home -inum 660650
/home/harris/debug/test3/hard.link
/home/harris/debug/test3/old.file
// 列出路徑 /home/harris/debug/ 下的所有軟鏈接文件
# find /home/harris/debug/ -type l -ls
656662 0 lrwxrwxrwx 1 harris harris 1 Sep 1 14:37 /home/harris/debug/test2/b -> a
656627 0 lrwxrwxrwx 1 harris harris 8 Sep 1 14:37 /home/harris/debug/test2/a ->
data.txt
789467 0 lrwxrwxrwx 1 root root 8 Sep 1 18:00 /home/harris/debug/test/soft.link ->
old.file
789496 0 lrwxrwxrwx 1 root root 7 Sep 1 18:01
/home/harris/debug/test/soft.link.dir -> old.dir
系統根據磁盤的大小默認設定了 inode 的值(見清單 9.),如若必要,可在格式文件系統前對該值進行修改。如鍵入命令
mkfs
-t ext4 -I 512
/
dev/sda4,
將使磁盤設備
/dev/sda4 格式成 inode 大小是 512 字節的 ext4 文件系統。
清單 9. 查看系統的 inode 值
[code] // 查看磁盤分區 /dev/sda7 上的 inode 值
# dumpe2fs -h /dev/sda7 | grep "Inode size"
dumpe2fs 1.42 (29-Nov-2011)
Inode size: 256
# tune2fs -l /dev/sda7 | grep "Inode size"
Inode size: 256
回頁首
Linux VFS
Linux 有著極其豐富的文件系統,大體上可分如下幾類:
網絡文件系統,如 nfs、cifs
等;
磁盤文件系統,如 ext4、ext3
等;
特殊文件系統,如 proc、sysfs、ramfs、tmpfs
等。
實現以上這些文件系統並在 Linux
下共存的基礎就是 Linux VFS(Virtual File System 又稱 Virtual Filesystem Switch),即虛擬文件系統。VFS 作為一個通用的文件系統,抽象了文件系統的四個基本概念:文件、目錄項 (dentry)、索引節點 (inode) 及掛載點,其在內核中為用戶空間層的文件系統提供了相關的接口(見 圖
3.所示 VFS 在 Linux 系統的架構)。VFS 實現了 open()、read() 等系統調並使得 cp 等用戶空間程序可跨文件系統。VFS 真正實現了上述內容中:在 Linux 中除進程之外一切皆是文件。
圖 3. VFS 在系統中的架構
Linux VFS 存在四個基本對象:超級塊對象 (superblock object)、索引節點對象 (inode object)、目錄項對象 (dentry object) 及文件對象 (file object)。超級塊對象代表一個已安裝的文件系統;索引節點對象代表一個文件;目錄項對象代表一個目錄項,如設備文件 event5 在路徑 /dev/input/event5 中,其存在四個目錄項對象:/ 、dev/ 、input/ 及 event5。文件對象代表由進程打開的文件。這四個對象與進程及磁盤文件間的關系如圖
4. 所示,其中 d_inode 即為硬鏈接。為文件路徑的快速解析,Linux VFS 設計了目錄項緩存(Directory Entry Cache,即 dcache)。
圖 4. VFS 的對象之間的處理回頁首
Linux 文件系統中的 inode
在 Linux 中,索引節點結構存在於系統內存及磁盤,其可區分成 VFS inode 與實際文件系統的 inode。VFS inode 作為實際文件系統中 inode 的抽象,定義了結構體 inode 與其相關的操作 inode_operations(見內核源碼 include/linux/fs.h)。
清單 10. VFS 中的 inode 與 inode_operations 結構體struct inode {
...
const struct inode_operations *i_op; // 索引節點操作
unsigned long i_ino; // 索引節點號
atomic_t i_count; // 引用計數器
unsigned int i_nlink; // 硬鏈接數目
...
}
struct inode_operations {
...
int (*create) (struct inode *,struct dentry *,int, struct nameidata *);
int (*link) (struct dentry *,struct inode *,struct dentry *);
int (*unlink) (struct inode *,struct dentry *);
int (*symlink) (struct inode *,struct dentry *,const char *);
int (*mkdir) (struct inode *,struct dentry *,int);
int (*rmdir) (struct inode *,struct dentry *);
...
}
如清單 10. 所見,每個文件存在兩個計數器:i_count 與 i_nlink,即引用計數與硬鏈接計數。結構體 inode 中的 i_count 用於跟蹤文件被訪問的數量,而 i_nlink 則是上述使用 ls -l 等命令查看到的文件硬鏈接數。或者說 i_count 跟蹤文件在內存中的情況,而 i_nlink 則是磁盤計數器。當文件被刪除時,則 i_nlink 先被設置成 0。文件的這兩個計數器使得 Linux 系統升級或程序更新變的容易。系統或程序可在不關閉的情況下(即文件 i_count 不為 0),將新文件以同樣的文件名進行替換,新文件有自己的
inode 及 data block,舊文件會在相關進程關閉後被完整的刪除。
清單 11. 文件系統 ext4 中的 inodestruct ext4_inode {
...
__le32 i_atime; // 文件內容最後一次訪問時間
__le32 i_ctime; // inode 修改時間
__le32 i_mtime; // 文件內容最後一次修改時間
__le16 i_links_count; // 硬鏈接計數
__le32 i_blocks_lo; // Block 計數
__le32 i_block[EXT4_N_BLOCKS]; // 指向具體的 block
...
};
清單 11. 展示的是文件系統 ext4 中對 inode 的定義(見內核源碼 fs/ext4/ext4.h)。其中三個時間的定義可對應與命令 stat 中查看到三個時間。i_links_count 不僅用於文件的硬鏈接計數,也用於目錄的子目錄數跟蹤(目錄並不顯示硬鏈接數,命令 ls -ld 查看到的是子目錄數)。由於文件系統 ext3 對 i_links_count 有限制,其最大數為:32000(該限制在 ext4 中被取消)。嘗試在 ext3 文件系統上驗證目錄子目錄及普通文件硬鏈接最大數可見清單
12. 的錯誤信息。因此實際文件系統的 inode 之間及與 VFS inode 相較是有差異的。
清單 12. 文件系統 ext3 中 i_links_count 的限制# ./dirtest.sh
mkdir: cannot create directory `dir_31999': Too many links
# ./linkcount.sh
ln: failed to create hard link to `old.file': Too many links
回頁首
結束語
本文最初描述了 Linux 系統中文件與目錄被引入的原因及 Linux 處理文件的方式,然後我們通過區分硬鏈接與軟鏈接的不同,了解 Linux 中的索引節點的相關知識,並以此引出了 inode 的結構體。索引節點結構體存在在於 Linux VFS 以及實際文件系統中,VFS 作為通用文件模型是 Linux 中“一切皆是文件”實現的基礎。文章並未深入 Linux VFS,也沒涉及實際文件系統的實現,文章只是從 inode 了解 Linux 的文件系統的相關內容。若想深入文件系統的內容,查看內核文檔 Documentation/filesystems/
是一個不錯的方式。
參考資料
學習
查看文章“學習 Linux,101:
文件和目錄管理”,熟悉 Linux 的文件和目錄。
查看文章“學習 Linux,101: 創建和更改硬鏈接和符號鏈接”,掌握與硬鏈接和軟鏈接相關的命令。
查看 wiki 上“Hard link”、“Symbolic
link”及“inode”等內容。
查閱 symlink(7)的 man
手冊,了解 Linux 中的軟鏈接。
查看文章“Q & A: The difference between hard and soft
links”,了解硬鏈接與軟鏈接的區別。
查看文章“In UNIX Everything is a File”,了解
UNIX 中除進程外一切皆是文件。
查看文章“Linux 虛擬系統文件交換器剖析”與“Linux
文件系統剖析”,獲取 Linux 虛擬文件系統 (Linux VFS) 相關知識。
查看文章“解析 Linux 中的 VFS 文件系統機制”,深入理解實例一個文件系統系統的過程。
查看文章“對話 UNIX: 關於 inode”,了解
inode 相關內容。
查看文章“Linux 文件系統中元數據使用計數的機制”,了解
Linux 對 dentry 和 inode 的計數操作。
查看內核源碼文件 Documentation/filesystems/ext4.txt,了解文件系統 ext4 的相關內容。
在 developerWorks Linux 專區 尋找為 Linux 開發人員(包括 Linux
新手入門)准備的更多參考資料,查閱我們 最受歡迎的文章和教程。
在 developerWorks 上查閱所有 Linux
技巧 和 Linux
教程。
隨時關注 developerWorks 技術活動和網絡廣播。
討論
加入 developerWorks 中文社區,developerWorks
社區是一個面向全球 IT 專業人員,可以提供博客、書簽、wiki、群組、聯系、共享和協作等社區功能的專業社交網絡社區。
加入 IBM
軟件下載與技術交流群組,參與在線交流。
https://www.ibm.com/developerworks/cn/linux/l-cn-hardandsymb-links/#icomments