前言
在 Linux 2.4 內核中,用戶態 Ring3 代碼請求內核態 Ring0 代碼完成某些功能是通過系統調用完成的,而系統調用的是通過軟中斷指令(int 0x80)實現的。在 x86 保護模式中,處理 INT 中斷指令時,CPU 首先從中斷描述表 IDT 取出對應的門描述符,判斷門描述符的種類,然後檢查門描述符的級別 DPL 和 INT 指令調用者的級別 CPL,當 CPL<=DPL 也就是說 INT 調用者級別高於描述符指定級別時,才能成功調用,最後再根據描述符的內容,進行壓棧、跳轉、權限級別提升。內核代碼執行完畢之後,調用 IRET 指令返回,IRET 指令恢復用戶棧,並跳轉會低級別的代碼。
其實,在發生系統調用,由 Ring3 進入 Ring0 的這個過程浪費了不少的 CPU 周期,例如,系統調用必然需要由 Ring3 進入 Ring0(由內核調用 INT 指令的方式除外,這多半屬於 Hacker 的內核模塊所為),權限提升之前和之後的級別是固定的,CPL 肯定是 3,而 INT 80 的 DPL 肯定也是 3,這樣 CPU 檢查門描述符的 DPL 和調用者的 CPL 就是完全沒必要。正是由於如此,Intel x86 CPU 從 PII 300(Family 6,Model 3,Stepping 3)之後,開始支持新的系統調用指令 sysenter/sysexit。sysenter 指令用於由 Ring3 進入 Ring0,SYSEXIT 指令用於由 Ring0 返回 Ring3。由於沒有特權級別檢查的處理,也沒有壓棧的操作,所以執行速度比 INT n/IRET 快了不少。
不同系統調用方式的性能比較:
下面是一些來自互聯網的有關 sysenter/sysexit 指令和 INT n/IRET 指令在 Intel Pentium CPU 上的性能對比:
1:系統調用性能測試測試硬件:
Intel? Pentium? III CPU, 450 MHz Processor Family: 6 Model: 7 Stepping: 2
用戶模式花費的時間 核心模式花費的時間
基於 sysenter/sysexit 指令的系統調用 9.833 microseconds 6.833 microseconds
基於中斷 INT n 指令的系統調用 17.500 microseconds 7.000 microseconds
2:各種 CPU 上 INT 0x80 和 SYSENTER 執行速度的比較
CPU Int0x80 sysenter
Athlon XP 1600+ 277 169
800MHz mode 1 athlon 279 170
2.8GHz p4 northwood ht 1152 442
上述數據為對 100000 次 getppid() 系統調用所花費的 CPU 時鐘周期取的平均值
自這種技術推出之後,人們一直在考慮在 Linux 中加入對這種指令的支持,在 Kernel.org 的郵件列表中,主題為 "Intel P6 vs P7 system call performance" 的大量郵件討論了采用這種指令的必要性,郵件中列舉的理由主要是 Intel 在 Pentium 4 的設計上存在問題,造成 Pentium 4 使用中斷方式執行的系統調用比 Pentium 3 以及 AMD Athlon 所耗費的 CPU 時鐘周期多上 5~10 倍。因此,在 Pentium 4 平台上,通過 sysenter/sysexit 指令來執行系統調用已經是刻不容緩的需求。