作者:e4gle by e4gle from http://e4gle.org 2001年6月5日 啟動早就讀完,現在為了寫筆記再從啟動之後粗略的大體讀一遍,基本就是幾個大模塊:啟動和初始化, 中斷信號,進程及調度,內存管理,文件系統,網絡,驅動和模塊等,我主要也從這幾塊入手。由於啟動 部分在start_kernel之前牽涉到大量的x86體系相關的匯編知識,需要大量的時間,於是我跳過,先把握 整個系統的大體脈絡,然後做二次,三次分析。網絡部分的分析,我會從4.4BSD-Lite的代碼中分析。 系統調用: 先說一下系統調用,奇怪的很,所有的讀核資料都沒有把系統調用單獨提出來說,我覺得還是比較重要的 。用戶和系統內核通信的關鍵的樞紐,不過分吧,呵呵。仔細研究一下它的機制,准備花三天時間,手頭 有些書和資料,幫助我理解。 概念:(明晰一下基本概念) 系統調用發生在用戶進程,通過一些特殊的函數(如open)來請求內核提供服務,這時,用戶進程掛起, 內核驗證用戶請求,嘗試之行,並把結果反饋給用戶進程,接著用戶進程重新啟動。這些機制在一般的編 程書裡都有,我就是來通過源代碼的實現來討論這種機制。 具體實現代碼:arch/i386/kernel/entry.S(內核版本2.2.14) 從entry.S的第171行,就是system_call開始,171-248行代碼貼出來,分析以注釋形式: ENTRY(system_call) \\所有系統調用的入口點,參數system_call是所希望激活的系統調用的數 pushl %eax# 保存orig_eax,這個值就是希望系統調用數 SAVE_ALL /*SAVE_ALL宏定義如下: #define SAVE_ALL cld; pushl %es; pushl %ds; pushl %eax; pushl %ebp; pushl %edi; pushl %esi; pushl %edx; pushl %ecx; pushl %ebx; movl $(__KERNEL_DS),%edx; movl %dx,%ds; movl %dx,%es; 他的作用是先把所有寄存器的值壓棧,然後在system_call返回之前使用RESTORE_ALL把棧從棧中彈出 ,在這其中system_call可以根據需要子去使用寄存器的值。任何它調用的c函數都可以從棧中查找到所希 望的參數,因為SAVE_ALL已經把所有寄存器的值都壓入棧中了 */ -------------------------------------------------------------------------------------------- GET_CURRENT(%ebx) /*利用GET_CURRENT宏從ebx中取得當前任務指針,GET_CURRENT宏定義 如下: #define GET_CURRENT(reg) movl %esp, reg; andl $-8192, reg;這段代碼應該很好理解,把esp指移到reg變量,減去8129得到當前任務地址 */ -------------------------------------------------------------------------------------------- cmpl $(NR_syscalls),%eax /*察看保存在eax中的系統調用數是否超過最大數(常數NR_syscalls代表系統調用的最大數)如果確實超過了,請看下面一句:jae badsys,程序則跳轉到badsys 。*/ jae badsys testb $0x20,flags(%ebx)# PF_TRACESYS/*檢查系統調用是否正在被跟蹤*/ jne tracesys /*如果系統調用被跟蹤,則程序跳轉到tracesys*/ call *SYMBOL_NAME(sys_call_table)(,%eax,4)/*調用系統函數*/ /*SYMBOL_NAME宏不處理任何工作,只是簡單的被文本參數(也就是系統調用名)所替換,所以可以忽略 sys_call_table也定義在entry.S(373行)中,是一張由指向實現各種系統調用的內核函數的函數指針組 成的表: ENTRY(sys_call_table) .long SYMBOL_NAME(sys_ni_syscall)/* 0 - old "setup()" system call*/ .long SYMBOL_NAME(sys_exit) .long SYMBOL_NAME(sys_fork) .long SYMBOL_NAME(sys_read) .long SYMBOL_NAME(sys_write) .long SYMBOL_NAME(sys_open)/* 5 */ .long SYMBOL_NAME(sys_close) .long SYMBOL_NAME(sys_waitpid) .long SYMBOL_NAME(sys_creat) .long SYMBOL_NAME(sys_link) .long SYMBOL_NAME(sys_unlink)/* 10 */ .long SYMBOL_NAME(sys_execve) .long SYMBOL_NAME(sys_chdir) .long SYMBOL_NAME(sys_time) .long SYMBOL_NAME(sys_mknod) .long SYMBOL_NAME(sys_chmod)/* 15 */ .long SYMBOL_NAME(sys_lchown) .long SYMBOL_NAME(sys_ni_syscall)/* old break syscall holder */ .long SYMBOL_NAME(sys_stat) .long SYMBOL_NAME(sys_lseek) .long SYMBOL_NAME(sys_getpid)/* 20 */ .long SYMBOL_NAME(sys_mount) .long SYMBOL_NAME(sys_oldumount) .long SYMBOL_NAME(sys_setuid) .long SYMBOL_NAME(sys_getuid) .long SYMBOL_NAME(sys_stime)/* 25 */ .long SYMBOL_NAME(sys_ptrace) .long SYMBOL_NAME(sys_alarm) .long SYMBOL_NAME(sys_fstat) .long SYMBOL_NAME(sys_pause) .long SYMBOL_NAME(sys_utime)/* 30 */ .long SYMBOL_NAME(sys_ni_syscall)/* old stty syscall holder */ .long SYMBOL_NAME(sys_ni_syscall)/* old gtty syscall holder */ .long SYMBOL_NAME(sys_Access) .long SYMBOL_NAME(sys_nice) .long SYMBOL_NAME(sys_ni_syscall)/* 35 */ /* old ftime syscall holder */ .long SYMBOL_NAME(sys_sync) .long SYMBOL_NAME(sys_kill) .long SYMBOL_NAME(sys_rename) .long SYMBOL_NAME(sys_mkdir) .long SYMBOL_NAME(sys_rmdir)/* 40 */ .long SYMBOL_NAME(sys_dup) .long SYMBOL_NAME(sys_pipe) .long SYMBOL_NAME(sys_times) .long SYMBOL_NAME(sys_ni_syscall)/* old prof syscall holder */ .long SYMBOL_NAME(sys_brk)/* 45 */ .long SYMBOL_NAME(sys_setgid) .long SYMBOL_NAME(sys_getgid) .long SYMBOL_NAME(sys_signal) .long SYMBOL_NAME(sys_geteuid) .long SYMBOL_NAME(sys_getegid)/* 50 */ .long SYMBOL_NAME(sys_acct) .long SYMBOL_NAME(sys_umount)/* recycled never used phys() */ .long SYMBOL_NAME(sys_ni_syscall)/* old lock syscall holder */ .long SYMBOL_NAME(sys_ioctl) .long SYMBOL_NAME(sys_fcntl)/* 55 */ .long SYMBOL_NAME(sys_ni_syscall)/* old mpx syscall holder */ .long SYMBOL_NAME(sys_setpgid) .long SYMBOL_NAME(sys_ni_syscall)/* old ulimit syscall holder */ .long SYMBOL_NAME(sys_olduname) .long SYMBOL_NAME(sys_umask)/* 60 */ .long SYMBOL_NAME(sys_chroot) .long SYMBOL_NAME(sys_ustat) .long SYMBOL_NAME(sys_dup2) .long SYMBOL_NAME(sys_getppid) .long SYMBOL_NAME(sys_getpgrp)/* 65 */ .long SYMBOL_NAME(sys_setsid) .long SYMBOL_NAME(sys_sigaction) .long SYMBOL_NAME(sys_sgetmask) .long SYMBOL_NAME(sys_ssetmask) .long SYMBOL_NAME(sys_setreuid)/* 70 */ .long SYMBOL_NAME(sys_setregid) .long SYMBOL_NAME(sys_sigsuspend) .long SYMBOL_NAME(sys_sigpending) .long SYMBOL_NAME(sys_sethostname) .long SYMBOL_NAME(sys_setrlimit)/* 75 */ .long SYMBOL_NAME(sys_getrlimit) .long SYMBOL_NAME(sys_getrusage) .long SYMBOL_NAME(sys_gettimeofday) .long SYMBOL_NAME(sys_settimeofday) .long SYMBOL_NAME(sys_getgroups)/* 80 */ .long SYMBOL_NAME(sys_setgroups) .long SYMBOL_NAME(old_select) .long SYMBOL_NAME(sys_symlink) .long SYMBOL_NAME(sys_lstat) .long SYMBOL_NAME(sys_readlink)/* 85 */ .long SYMBOL_NAME(sys_uselib) .long SYMBOL_NAME(sys_swapon) .long SYMBOL_NAME(sys_reboot) .long SYMBOL_NAME(old_readdir) .long SYMBOL_NAME(old_mmap)/* 90 */ .long SYMBOL_NAME(sys_munmap) .long SYMBOL_NAME(sys_truncate) .long SYMBOL_NAME(sys_ftruncate) .long SYMBOL_NAME(sys_fchmod) .long SYMBOL_NAME(sys_fchown)/* 95 */ .long SYMBOL_NAME(sys_getpriority) .long SYMBOL_NAME(sys_setpriority) .long SYMBOL_NAME(sys_ni_syscall)/* old profil syscall holder */ .long SYMBOL_NAME(sys_statfs) .long SYMBOL_NAME(sys_fstatfs)/* 100 */ .long SYMBOL_NAME(sys_ioperm) .long SYMBOL_NAME(sys_socketcall) .long SYMBOL_NAME(sys_syslog) .long SYMBOL_NAME(sys_setitimer) .long SYMBOL_NAME(sys_getitimer)/* 105 */ .long SYMBOL_NAME(sys_newstat) .long SYMBOL_NAME(sys_newlstat) .long SYMBOL_NAME(sys_newfstat) .long SYMBOL_NAME(sys_uname) .long SYMBOL_NAME(sys_iopl)/* 110 */ .long SYMBOL_NAME(sys_vhangup) .long SYMBOL_NAME(sys_idle) .long SYMBOL_NAME(sys_vm86old) .long SYMBOL_NAME(sys_wait4) .long SYMBOL_NAME(sys_swapoff)/* 115 */ .long SYMBOL_NAME(sys_sysinfo) .long SYMBOL_NAME(sys_ipc) .long SY