您现在的位置： Linux教程網 >> UnixLinux > >> Linux綜合 >> Linux資訊 >> 更多Linux

深入理解Linux的系統調用

一、什麼是系統調用

　　在Linux的世界裡，我們經常會遇到系統調用這一術語，所謂系統調用，就是內核提供的、功能十分強大的一系列的函數。這些系統調用是在內核中實現的，再通過一定的方式把系統調用給用戶，一般都通過門(gate)陷入(trap)實現。系統調用是用戶程序和內核交互的接口。

　　二、系統調用的作用

　　系統調用在Linux系統中發揮著巨大的作用.如果沒有系統調用，那麼應用程序就失去了內核的支持。

　　我們在編程時用到的很多函數，如fork、open等這些函數最終都是在系統調用裡實現的，比如說我們有這樣一個程序：

　　　　　　這裡我們用到了兩個函數，即fork和exit,這兩函數都是glibc中的函數，但是如果我們跟蹤函數的執行過程，看看glibc對fork和exit函數的實現就可以發現在glibc的實現代碼裡都是采用軟中斷的方式陷入到內核中再通過系統調用實現函數的功能的。具體過程我們在系統調用的實現過程會詳細的講到。

　　由此可見，系統調用是用戶接口在內核中的實現，如果沒有系統調用，用戶就不能利用內核。

　　三、系統調用的現實及調用過程

　　詳細講述系統調用的之前也講一下Linux系統的一些保護機制。

　　Linux系統在CPU的保護模式下提供了四個特權級別，目前內核都只用到了其中的兩個特權級別，分別為“特權級0”和“特權級3”,級別0也就是我們通常所講的內核模式，級別3也就是我們通常所講的用戶模式。劃分這兩個級別主要是對系統提供保護。內核模式可以執行一些特權指令和進入用戶模式，而用戶模式則不能。

　　這裡特別提出的是，內核模式與用戶模式分別使用自己的堆棧，當發生模式切換的時候同時要進行堆棧的切換。

　　每個進程都有自己的地址空間（也稱為進程空間），進程的地址空間也分為兩部分：用戶空間和系統空間，在用戶模式下只能訪問進程的用戶空間，在內核模式下則可以訪問進程的全部地址空間，這個地址空間裡的地址是一個邏輯地址，通過系統段面式的管理機制，訪問的實際內存要做二級地址轉換，即：邏輯地址?線性地址?物理地址。

　　系統調用對於內核來說就相當於函數，我們是關鍵問題是從用戶模式到內核模式的轉換、堆棧的切換以及參數的傳遞。

　　下面將結合內核源代碼對這些過程進行分析，以下分析環境為FC2,kernel 2.6.5

　　下面是內核源代碼裡arch/i386/kernel/entry.S的一段代碼。

　　　　以上這段代碼裡定義了兩個非常重要的宏,即SAVE_ALL和RESTORE_ALL

　　SAVE_ALL先保存用戶模式的寄存器和堆棧信息,然後切換到內核模式,宏__SWITCH_KERNELSPACE實現地址空間的轉換RESTORE_ALL的過程過SAVE_ALL的過程正好相反。

　　在內核原代碼裡有一個系統調用表：（entry.S的文件裡）

　　　　在2.6.5的內核裡，有280多個系統調用，這些系統調用的名稱全部在這個系統調用表裡。

　　在這個原文件裡，還有非常重要的一段。

　　　　這一段完成系統調用的執行。

　　system_call函數根據用戶傳來的系統調用號，在系統調用表裡找到對應的系統調用再執行。

　　從glibc的函數到系統調用還有一個很重要的環節就是系統調用號。

　　系統調用號的定義在include/asm-i386/unistd.h裡

　　　　　　每一個系統調用號都對應有一個系統調用

　　接下來就是系統調用宏的展開

　　沒有參數的系統調用的宏展開

　　！！！代碼6::

　　帶一個參數的系統調用的宏展開

　　！！！代碼7::

　　兩個參數

　　代碼8::

　　#define _syscall2(type,name,type1,arg1,type2,arg2) \

　　三個參數的

　　代碼9::

　　#define _syscall3(type,name,type1,arg1,type2,arg2,type3,arg3) \

　　四個參數的

　　代碼10::

　　#define _syscall4(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4) \

　　五個參數的

　　代碼11::

　　#define _syscall5(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4, \

　　type5,arg5) \

　　六個參數的

　　代碼12::

　　#define _syscall6(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4, \

　　type5,arg5,type6,arg6) \

　　_res); \

　　從這段代碼我們可以看出int $0x80通過軟中斷開觸發系統調用，當發生調用時，函數中的name會被系統系統調用名所代替。然後調用前面所講的system_call。這個過程裡包含了系統調用的初始化，系統調用的初始化原代碼在：

　　arch/i386/kernel/traps.c中每當用戶執行int 0x80時，系統進行中斷處理，把控制權交給內核的system_call。

　　整個系統調用的過程可以總結如下：

　　1．執行用戶程序(如:fork)

　　2．根據glibc中的函數實現，取得系統調用號並執行int $0x80產生中斷。

　　3．進行地址空間的轉換和堆棧的切換，執行SAVE_ALL。（進行內核模式）

　　4．進行中斷處理，根據系統調用表調用內核函數。

　　5．執行內核函數。

　　6．執行RESTORE_ALL並返回用戶模式

　　解了系統調用的實現及調用過程，我們可以根據自己的需要來對內核的系統調用作修改或添加。