小生想從源碼的角度解釋一下Unix的文件系統。(前天因為不能發在首頁所以重發,為什麼有3天的限制呢,真是的哦)
首先一個文件在沒有被打開的情況下,需要什麼貯存在磁盤呢?
一般而言,需要的是:
1,一個目錄項
2,一個磁盤Inode項
3,磁盤上的n塊(n可為0)
目錄項是一個結構,最重要的元素一個為名字,一個為指向inode結構的指針。另外目錄的執行權是為了把文件名轉換為Inode而存在的,具體的操作函數為namei。(大家可參閱具體的源碼)
Inode項也是一個結構,v7實現如下
復制代碼代碼如下:
struct dinode
{
unsigned short di_mode; /* mode and type of file */
short di_nlink; /* number of links to file */
short di_uid; /* owner's user id */
short di_gid; /* owner's group id */
off_t di_size; /* number of bytes in file */
char di_addr[40]; /* disk block addresses */
time_t di_atime; /* time last accessed */
time_t di_mtime; /* time last modified */
time_t di_ctime; /* time created */
};
元素所表示的內容相關的注釋都已經說明了,不過小生還是介紹一下具體的內容
di_mode說明文件的權限和類型
di_nlink說明文件的鏈接數
di_uid文件的用戶,di_gid文件的組
di_size邏輯上文件的大小(以字節計數)
di_addr文件所占用的磁盤塊的地址
3個時間表示訪問,修改和創建時間
磁盤塊沒什麼好說的,具體實現可能512字節一塊
當引用一個文件時(並非打開一個文件)可能需要的如下:
1,一個內存Inode項
內存inode項的v7實現可能如下:
復制代碼代碼如下:
struct inode
{
Char i_flag;
char i_count; /* reference count */
dev_t i_dev; /* device where inode resides */
ino_t i_number; /* i number, 1-to-1 with device address */
unsigned short i_mode;
short i_nlink; /* directory entries */
short i_uid; /* owner */
short i_gid; /* group of owner */
off_t i_size; /* size of file */
union {
struct {
daddr_t i_addr[NADDR]; /* if normal file/directory */
daddr_t i_lastr; /* last logical block read (for read-ahead) */
};
struct {
daddr_t i_rdev; /* i_addr[0] */
struct group i_group; /* multiplexor group file */
};
} i_un;
};
基本的內容和磁盤的一樣,多出了一些內容,最重要的是多出了i_count用以記錄引用次數
當一個文件被打開時需要的內容如下:
1, 用戶u區中的u_ofile數組中的一項
2, 文件表中的一項
u_ofile存放的是指向具體的file結構中的一項的指針,所謂的文件描述符就是u_ofile數組的下標
文件表v7的實現如下:
復制代碼代碼如下:
struct file
{
char f_flag;
char f_count; /* reference count */
struct inode *f_inode; /* pointer to inode structure */
union {
off_t f_offset; /* read/write character pointer */
struct chan *f_chan; /* mpx channel pointer */
} f_un;
};
文件表最初似乎是為了共享偏移量(f_offset)而設計的,因為有注釋就不多贅敘了,正如大家所知道的,用dup復制一個文件描述符和再次打開一個文件是不一樣,具體的差別就是f_count的值。實際上大家可以自己思考一下所有的文件打開關閉,link和unlink等等文件操作(我想這是非常有益,不過大家不必真的去參閱源碼,只要自己想想是怎麼回事就行,unix源碼水平極高,如果真的全部看懂需要很多時間)。
另外鑒於要不發布要不爛掉的原則,我將本人昨天晚上寫的源碼發布。
源碼是find命令的簡單實現,直接的參數是-name, -user, -group,具體用法如下
Find 目錄(文件)列表 可選的參數
源碼的水平並不高,而且實現也不是很好,不過我想初學c的讀者還是能得到一定的幫助的,
如果有高手覺得哪裡需要修改的,請注明
小生想從源碼的角度解釋一下Unix的文件系統。(前天因為不能發在首頁所以重發,為什麼有3天的限制呢,真是的哦)
首先一個文件在沒有被打開的情況下,需要什麼貯存在磁盤呢?
一般而言,需要的是:
1,一個目錄項
2,一個磁盤Inode項
3,磁盤上的n塊(n可為0)
目錄項是一個結構,最重要的元素一個為名字,一個為指向inode結構的指針。另外目錄的執行權是為了把文件名轉換為Inode而存在的,具體的操作函數為namei。(大家可參閱具體的源碼)
Inode項也是一個結構,v7實現如下
復制代碼代碼如下:
struct dinode
{
unsigned short di_mode; /* mode and type of file */
short di_nlink; /* number of links to file */
short di_uid; /* owner's user id */
short di_gid; /* owner's group id */
off_t di_size; /* number of bytes in file */
char di_addr[40]; /* disk block addresses */
time_t di_atime; /* time last accessed */
time_t di_mtime; /* time last modified */
time_t di_ctime; /* time created */
};
元素所表示的內容相關的注釋都已經說明了,不過小生還是介紹一下具體的內容
di_mode說明文件的權限和類型
di_nlink說明文件的鏈接數
di_uid文件的用戶,di_gid文件的組
di_size邏輯上文件的大小(以字節計數)
di_addr文件所占用的磁盤塊的地址
3個時間表示訪問,修改和創建時間
磁盤塊沒什麼好說的,具體實現可能512字節一塊
當引用一個文件時(並非打開一個文件)可能需要的如下:
1, 一個內存Inode項
內存inode項的v7實現可能如下:
復制代碼代碼如下:
struct inode
{
Char i_flag;
char i_count; /* reference count */
dev_t i_dev; /* device where inode resides */
ino_t i_number; /* i number, 1-to-1 with device address */
unsigned short i_mode;
short i_nlink; /* directory entries */
short i_uid; /* owner */
short i_gid; /* group of owner */
off_t i_size; /* size of file */
union {
struct {
daddr_t i_addr[NADDR]; /* if normal file/directory */
daddr_t i_lastr; /* last logical block read (for read-ahead) */
};
struct {
daddr_t i_rdev; /* i_addr[0] */
struct group i_group; /* multiplexor group file */
};
} i_un;
};
基本的內容和磁盤的一樣,多出了一些內容,最重要的是多出了i_count用以記錄引用次數
當一個文件被打開時需要的內容如下:
1,用戶u區中的u_ofile數組中的一項
2,文件表中的一項
u_ofile存放的是指向具體的file結構中的一項的指針,所謂的文件描述符就是u_ofile數組的下標
文件表v7的實現如下:
復制代碼代碼如下:
struct file
{
char f_flag;
char f_count; /* reference count */
struct inode *f_inode; /* pointer to inode structure */
union {
off_t f_offset; /* read/write character pointer */
struct chan *f_chan; /* mpx channel pointer */
} f_un;
};
文件表最初似乎是為了共享偏移量(f_offset)而設計的,因為有注釋就不多贅敘了,正如大家所知道的,用dup復制一個文件描述符和再次打開一個文件是不一樣,具體的差別就是f_count的值。實際上大家可以自己思考一下所有的文件打開關閉,link和unlink等等文件操作(我想這是非常有益,不過大家不必真的去參閱源碼,只要自己想想是怎麼回事就行,unix源碼水平極高,如果真的全部看懂需要很多時間)。
另外鑒於要不發布要不爛掉的原則,我將本人昨天晚上寫的源碼發布。
源碼是find命令的簡單實現,直接的參數是-name, -user, -group,具體用法如下
Find 目錄(文件)列表 可選的參數
源碼的水平並不高,而且實現也不是很好,不過我想初學c的讀者還是能得到一定的幫助的,
如果有高手覺得哪裡需要修改的,請注明
[/code]