Linux的文件系統是一個比較復雜的體系,因為Linux系統中文件就是一切,所以Linux系統有多復雜,Linux文件系統就有多復雜。本文就來詳解一下Linux文件系統的幾個要點。
一、 物理磁盤到文件系統
我們知道文件最終是保存在硬盤上的。硬盤最基本的組成部分是由堅硬金屬材料制成的塗以磁性介質的盤片,不同容量硬盤的盤片數不等。每個盤片有兩面,都可記錄信息。盤片被分成許多扇形的區域,每個區域叫一個扇區,每個扇區可存儲128×2的N次方(N=0.1.2.3)字節信息。在DOS中每扇區是128×2的2次方=512字節,盤片表面上以盤片中心為圓心,不同半徑的同心圓稱為磁道。硬盤中,不同盤片相同半徑的磁道所組成的圓柱稱為柱面。磁道與柱面都是表示不同半徑的圓,在許多場合,磁道和柱面可以互換使用,我們知道,每個磁盤有兩個面,每個面都有一個磁頭,習慣用磁頭號來區分。扇區,磁道(或柱面)和磁頭數構成了硬盤結構的基本參數,幫這些參數可以得到硬盤的容量,基計算公式為:
存儲容量=磁頭數×磁道(柱面)數×每道扇區數×每扇區字節數
要點:
(1)硬盤有數個盤片,每盤片兩個面,每個面一個磁頭
(2)盤片被劃分為多個扇形區域即扇區
(3)同一盤片不同半徑的同心圓為磁道
(4)不同盤片相同半徑構成的圓柱面即柱面
(5)公式: 存儲容量=磁頭數×磁道(柱面)數×每道扇區數×每扇區字節數
(6)信息記錄可表示為:××磁道(柱面),××磁頭,××扇區
那麼這些空間又是怎麼管理起來的呢?unix/linux使用了一個簡單的方法。如圖所示。
它將磁盤塊分為以下三個部分:
1) 超級塊,文件系統中第一個塊被稱為超級塊。這個塊存放文件系統本身的結構信息。比如,超級塊記錄了每個區域的大小,超級塊也存放未被使用的磁盤塊的信息。
2) I-切點表。超級塊的下一個部分就是i-節點表。每個i-節點就是一個對應一個文件/目錄的結構,這個結構它包含了一個文件的長度、創建及修改時間、權限、所屬關系、磁盤中的位置等信息。一個文件系統維護了一個索引節點的數組,每個文件或目錄都與索引節點數組中的唯一一個元素對應。系統給每個索引節點分配了一個號碼,也就是該節點在數組中的索引號,稱為索引節點號
3) 數據區。文件系統的第3個部分是數據區。文件的內容保存在這個區域。磁盤上所有塊的大小都一樣。如果文件包含了超過一個塊的內容,則文件內容會存放在多個磁盤塊中。一個較大的文件很容易分布上千個獨產的磁盤塊中。
二、 創建一個文件的過程
我們從前面可以知道文件的內容和屬性是分開存放的,那麼又是如何管理它們的呢?現在我們以創建一個文件為例來講解。
在命令行輸入命令:
$ who 》 userlist
我們可以通過系統命令ls來查看新建文件userlist的信息:(ls 命令後的i就表示打印i節點信息)
當完成這個命令時。文件系統中增加了一個存放命令who輸出內容的新文件userlist,那麼這整個過程到底是怎麼回事呢?
文件主要有屬性、內容以及文件名三項。內核將文件內容存放在數據區,文件屬性存放在i-節點,文件名存放在目錄中。圖2顯示了創建一個文件的例子,假如這個新文件要3 個存儲塊來存放內容。那麼整個個程大概如下:
創建成功一個文件主要有以下四個步驟:
1) 存儲屬性 也就是文件屬性的存儲,內核先找到一塊空的i-節點。圖3中。內核找到i-節點號921130。內核把文件的信息記錄其中。如文件的大小、文件所有者、和創建時間等
2) 存儲數據 即文件內容的存儲,由於該文件需要3個數據塊。因此內核從自由塊的列表中找到3個自由塊。圖3中分別為600、200、992,內核緩沖區的第一塊數據復制到塊600,第二和第三分別復制到922和600.
3) 記錄分配情況,數據保存到了三個數據塊中。所以必須要記錄起來,以後再找到正確的數據。分配情況記錄在文件的i-節點中的磁盤序號列表裡。這3個編號分別放在最開始的3個位置。
4) 添加文件名到目錄,新文件的名字是userlist 內核將文件的入口(47,userlist)添加到目錄文件裡。文件名和i-節點號之間的對應關系將文件名和文件和文件的內容屬性連接起來,找到文件名就找到文件的i-節點號,通過i-節點號就能找到文件的屬性和內容。
三、 創建一個目錄的過程
前面說了創建一個文件的大概過程,也了解文件內容、屬性以及入口的保存方式,那麼創建一個目錄時又是怎麼回事呢?
我現在test目錄使用命令mkdir 新增一個子目錄child:
從用戶的角度看,目錄child是目錄test的一個子目錄,那麼在系統中這層關系是怎麼實現的呢?實際上test目錄包含一個指向子目錄child的i-節點的鏈接,原理跟普通文件一樣,因為目錄也是文件。目錄在系統中的保存方式和結構大概如下:
目錄其實也是文件,只是它的內容比較特殊。所以它的創建過程和文件創建過程一樣,只是第二步寫的內容不同。
1) 系統找到空閒的i-節點號887220,寫入目錄的屬性
2) 找到空閒的數據塊1002來存儲目錄的內容,只是目錄的內容比較特殊,包含文件名字列表,列表一般包含兩個部分:i-節點號和文件名,這個列表其實也就是文件的入口,新建的目錄至少包含三個目錄”。”和”。。”其中”。”指向自己,”。。”指向上級目錄,我們可以通過比較對應的i-節點號來驗證,887270 對應著上級目錄中的child對應的i-節點號
3) 記錄分配情況。這個和創建文件完全不樣
4) 添加目錄的入口到父目錄,即在父目錄中的child入口。
一般都說文件存放在某個目錄中,其實目錄中存入的只是文件在i-節點表的入口,而文件的內容則存儲在數據區。圖3中,我們一般會說“文件userlist在目錄test中”,其實這意味著目錄test中有一個指向i-節點921130的鏈接,這個鏈接所附加的文件名為userlist,這也可以這樣理解:目錄包含的是文件的引用,每個引用被稱為鏈接。文件的內容存儲在數據塊。文件的屬性被記錄在一個被稱為i-節點的結構中。I-節點的編號和文件名關聯起來存在目錄中。
注意:其中“。”表示是當前目錄。而“。。”是當前目錄的父目錄。但也有特殊情況:如我們查看根目錄/的情況:
發現“。”和“。。”都指向i-節點2。實際上當我們用mkfs創建一個文件系統時,mkfs都會將根目錄的父目錄指向自己。所以根目錄下。和。。指向同一個i-節點也不奇怪了。
四、 理解鏈接
鏈接分為兩種,1是硬鏈接,2是符號鏈接(也稱為軟鏈接)
1、 硬鏈接
硬鏈接(had link),是將目錄鏈接到文件樹的指針,硬鏈接同時也是將文件名和文件本身鏈接起來的指針
我們現在進入目錄child:並輸入法以下命令
我們發現通過ln建立的鏈接文件mylink對應的i-節點也是921130.和上一級目錄下的userlist指向的i-節點號是一樣的。由此我們可以知道mylink和。。/userlist其實是指向同一個i-節點號,也可以理解為這兩者其實是同一個文件。
創建一個鏈接的步驟大概如下:
1) 通過原文件的文件名找到文件的i-節點號
2) 添加文件名關聯到目錄,新文件的名字是mylink 內核將文件的入口(921130,mylink)添加到目錄文件裡。
和創建文件的過程比較發現,鏈接少了寫文件內容的步驟,完全相同的是把文件名關聯到目錄這一步
現在.i- 節點號921130對應了兩個文件名。鏈接數也會變成2個,文件的內容並不會發生任何變化。前面我們已經講了:目錄包含的是文件的引用,每個引用被稱為鏈接。所以鏈接文件和原始文件本質上是一樣的,因為它們都是指向同一個i-節點。由於此原因也就可以理解鏈接的下列特性:你改變其中任何一個文件的內容,別的鏈接文件也一樣是變化;另外如果你刪除某一個文件,系統只會在所指向的i-節點上把鏈接數減1,只有當鏈接數減為零時才會真正釋放i-節點。
硬鏈接有兩個特點:
1)不能跨文件系統
2)不能對目錄
2、符號鏈接
另外還有一種符號鏈接,也稱“軟鏈接”,符號鏈接是通過文件名引用文件,而不是i-節點號,這和硬鏈接的原理完全是不同的,我們先看屬性:
發現通過ln –s 創建的軟鏈接mylink2的i-節點是1574059,和。。/userlist的不相同。軟鏈接的好處就是可以跨不同的文件系統,而且可以鏈接目錄。
以上就是Linux文件系統的要點的介紹了,因為Linux一切設備都是文件的特性,所以Linux文件系統太重要的,最好把這些要點都記熟了。