一、 Unix/Linux的體系架構
如上圖所示,從宏觀上來看,Linux操作系統的體系架構分為用戶態和內核態(或者用戶空間和內核)。內核從本質上看是一種軟件——控制計算機的硬件資源,並提供上層應用程序運行的環境。用戶態即上層應用程序的活動空間,應用程序的執行必須依托於內核提供的資源,包括CPU資源、存儲資源、I/O資源等。為了使上層應用能夠訪問到這些資源,內核必須為上層應用提供訪問的接口:即系統調用。
系統調用是操作系統的最小功能單位,這些系統調用根據不同的應用場景可以進行擴展和裁剪,現在各種版本的Unix實現都提供了不同數量的系統調用,如Linux的不同版本提供了240-260個系統調用,FreeBSD大約提供了320個(reference:UNIX環境高級編程)。我們可以把系統調用看成是一種不能再化簡的操作(類似於原子操作,但是不同概念),有人把它比作一個漢字的一個“筆畫”,而一個“漢字”就代表一個上層應用,我覺得這個比喻非常貼切。因此,有時候如果要實現一個完整的漢字(給某個變量分配內存空間),就必須調用很多的系統調用。如果從實現者(程序員)的角度來看,這勢必會加重程序員的負擔,良好的程序設計方法是:重視上層的業務邏輯操作,而盡可能避免底層復雜的實現細節。庫函數正是為了將程序員從復雜的細節中解脫出來而提出的一種有效方法。它實現對系統調用的封裝,將簡單的業務邏輯接口呈現給用戶,方便用戶調用,從這個角度上看,庫函數就像是組成漢字的“偏旁”。這樣的一種組成方式極大增強了程序設計的靈活性,對於簡單的操作,我們可以直接調用系統調用來訪問資源,如“人”,對於復雜操作,我們借助於庫函數來實現,如“仁”。顯然,這樣的庫函數依據不同的標准也可以有不同的實現版本,如ISO C 標准庫,POSIX標准庫等。
Shell是一個特殊的應用程序,俗稱命令行,本質上是一個命令解釋器,它下通系統調用,上通各種應用,通常充當著一種“膠水”的角色,來連接各個小功能程序,讓不同程序能夠以一個清晰的接口協同工作,從而增強各個程序的功能。同時,Shell是可編程的,它可以執行符合Shell語法的文本,這樣的文本稱為Shell腳本,通常短短的幾行Shell腳本就可以實現一個非常大的功能,原因就是這些Shell語句通常都對系統調用做了一層封裝。為了方便用戶和系統交互,一般,一個Shell對應一個終端,終端是一個硬件設備,呈現給用戶的是一個圖形化窗口。我們可以通過這個窗口輸入或者輸出文本。這個文本直接傳遞給shell進行分析解釋,然後執行。
總結一下,用戶態的應用程序可以通過三種方式來訪問內核態的資源:
1)系統調用
2)庫函數
3)Shell腳本
下圖是對上圖的一個細分結構,從這個圖上可以更進一步對內核所做的事有一個“全景式”的印象。主要表現為:向下控制硬件資源,向內管理操作系統資源:包括進程的調度和管理、內存的管理、文件系統的管理、設備驅動程序的管理以及網絡資源的管理,向上則向應用程序提供系統調用的接口。從整體上來看,整個操作系統分為兩層:用戶態和內核態,這種分層的架構極大地提高了資源管理的可擴展性和靈活性,而且方便用戶對資源的調用和集中式的管理,帶來一定的安全性。
二、用戶態和內核態的切換
因為操作系統的資源是有限的,如果訪問資源的操作過多,必然會消耗過多的資源,而且如果不對這些操作加以區分,很可能造成資源訪問的沖突。所以,為了減少有限資源的訪問和使用沖突,Unix/Linux的設計哲學之一就是:對不同的操作賦予不同的執行等級,就是所謂特權的概念。簡單說就是有多大能力做多大的事,與系統相關的一些特別關鍵的操作必須由最高特權的程序來完成。Intel的X86架構的CPU提供了0到3四個特權級,數字越小,特權越高,Linux操作系統中主要采用了0和3兩個特權級,分別對應的就是內核態和用戶態。運行於用戶態的進程可以執行的操作和訪問的資源都會受到極大的限制,而運行在內核態的進程則可以執行任何操作並且在資源的使用上沒有限制。很多程序開始時運行於用戶態,但在執行的過程中,一些操作需要在內核權限下才能執行,這就涉及到一個從用戶態切換到內核態的過程。比如C函數庫中的內存分配函數malloc(),它具體是使用sbrk()系統調用來分配內存,當malloc調用sbrk()的時候就涉及一次從用戶態到內核態的切換,類似的函數還有printf(),調用的是wirte()系統調用來輸出字符串,等等。
到底在什麼情況下會發生從用戶態到內核態的切換,一般存在以下三種情況:
1)當然就是系統調用:原因如上的分析。
2)異常事件: 當CPU正在執行運行在用戶態的程序時,突然發生某些預先不可知的異常事件,這個時候就會觸發從當前用戶態執行的進程轉向內核態執行相關的異常事件,典型的如缺頁異常。
3)外圍設備的中斷:當外圍設備完成用戶的請求操作後,會像CPU發出中斷信號,此時,CPU就會暫停執行下一條即將要執行的指令,轉而去執行中斷信號對應的處理程序,如果先前執行的指令是在用戶態下,則自然就發生從用戶態到內核態的轉換。
注意:系統調用的本質其實也是中斷,相對於外圍設備的硬中斷,這種中斷稱為軟中斷,這是操作系統為用戶特別開放的一種中斷,如Linux int 80h中斷。所以,從觸發方式和效果上來看,這三種切換方式是完全一樣的,都相當於是執行了一個中斷響應的過程。但是從觸發的對象來看,系統調用是進程主動請求切換的,而異常和硬中斷則是被動的。
三、總結本文僅是從宏觀的角度去理解Linux用戶態和內核態的設計,並沒有去深究它們的具體實現方式。從實現上來看,必須要考慮到的一點我想就是性能問題,因為用戶態和內核態之間的切換也會消耗大量資源。關於實現的細節,目前學藝不精不敢亂說,等日後補上。但知道了這一點,我相信對很多問題也就很容易理解了,比如說基於緩沖區的IO和無緩沖的IO,用戶進程和內核進程之間的切換,IO復用中的讀寫內核事件表,等等,這些知識之後會一一補上。