您现在的位置： Linux教程網 >> UnixLinux > >> Linux管理 >> Linux維護

Linux 內核調試器內幕

　　KDB 入門指南

　　調試內核問題時，能夠跟蹤內核執行情況並查看其內存和數據結構是非常有用的。Linux 中的內置內核調試器 KDB 提供了這種功能。在本文中您將了解如何使用 KDB 所提供的功能，以及如何在 Linux 機器上安裝和設置 KDB。您還將熟悉 KDB 中可以使用的命令以及設置和顯示選項。

　　Linux 內核調試器（KDB）允許您調試 Linux 內核。這個恰如其名的工具實質上是內核代碼的補丁，它允許高手訪問內核內存和數據結構。KDB 的主要優點之一就是它不需要用另一台機器進行調試：您可以調試正在運行的內核。

　　設置一台用於 KDB 的機器需要花費一些工作，因為需要給內核打補丁並進行重新編譯。KDB 的用戶應當熟悉 Linux 內核的編譯（在一定程度上還要熟悉內核內部機理），但是如果您需要編譯內核方面的幫助，請參閱本文結尾處的參考資料一節。

　　在本文中，我們將從有關下載 KDB 補丁、打補丁、（重新）編譯內核以及啟動 KDB 方面的信息著手。然後我們將了解 KDB 命令並研究一些較常用的命令。最後，我們將研究一下有關設置和顯示選項方面的一些詳細信息。

　　入門

　　KDB 項目是由 Silicon Graphics 維護的（請參閱參考資料以獲取鏈接），您需要從它的 FTP 站點下載與內核版本有關的補丁。（在編寫本文時）可用的最新 KDB 版本是 4.2。您將需要下載並應用兩個補丁。一個是“公共的”補丁，包含了對通用內核代碼的更改，另一個是特定於體系結構的補丁。補丁可作為 bz2 文件獲取。例如，在運行 2.4.20 內核的 x86 機器上，您會需要 kdb-v4.2-2.4.20-common-1.bz2 和 kdb-v4.2-2.4.20-i386-1.bz2。

　　這裡所提供的所有示例都是針對 i386 體系結構和 2.4.20 內核的。您將需要根據您的機器和內核版本進行適當的更改。您還需要擁有 root 許可權以執行這些操作。

　　將文件復制到 /usr/src/linux 目錄中並從用 bzip2 壓縮的文件解壓縮補丁文件：

　　#bzip2 -d kdb-v4.2-2.4.20-common-1.bz2

　　#bzip2 -d kdb-v4.2-2.4.20-i386-1.bz2

　　您將獲得 kdb-v4.2-2.4.20-common-1 和 kdb-v4.2-2.4-i386-1 文件。

　　現在，應用這些補丁：

　　#patch -p1 <kdb-v4.2-2.4.20-common-1

　　#patch -p1 <kdb-v4.2-2.4.20-i386-1

　　這些補丁應該干淨利落地加以應用。查找任何以 .rej 結尾的文件。這個擴展名表明這些是失敗的補丁。如果內核樹沒問題，那麼補丁的應用就不會有任何問題。

　　接下來，需要構建內核以支持 KDB。第一步是設置 CONFIG_KDB 選項。使用您喜歡的配置機制（xconfig 和 menuconfig 等）來完成這一步。轉到結尾處的“Kernel hacking”部分並選擇“Built-in Kernel Debugger support”選項。

　　您還可以根據自己的偏好選擇其它兩個選項。選擇“Compile the kernel with frame pointers”選項（如果有的話）則設置 CONFIG_FRAME_POINTER 標志。這將產生更好的堆棧回溯，因為幀指針寄存器被用作幀指針而不是通用寄存器。您還可以選擇“KDB off by default”選項。這將設置 CONFIG_KDB_OFF 標志，並且在缺省情況下將關閉 KDB。我們將在後面一節中對此進行詳細介紹。

　　保存配置，然後退出。重新編譯內核。建議在構建內核之前執行“make clean”。用常用方式安裝內核並引導它。

　　初始化並設置環境變量

　　您可以定義將在 KDB 初始化期間執行的 KDB 命令。需要在純文本文件 kdb_cmds 中定義這些命令，該文件位於 Linux 源代碼樹（當然是在打了補丁之後）的 KDB 目錄中。該文件還可以用來定義設置顯示和打印選項的環境變量。文件開頭的注釋提供了編輯文件方面的幫助。使用這個文件的缺點是，在您更改了文件之後需要重新構建並重新安裝內核。

　　激活 KDB

　　如果編譯期間沒有選中 CONFIG_KDB_OFF，那麼在缺省情況下 KDB 是活動的。否則，您需要顯式地激活它－通過在引導期間將 kdb=on 標志傳遞給內核或者通過在掛裝了 /proc 之後執行該工作：

　　#echo "1" ＞/proc/sys/kernel/kdb

　　倒過來執行上述步驟則會取消激活 KDB。也就是說，如果缺省情況下 KDB 是打開的，那麼將 kdb=off 標志傳遞給內核或者執行下面這個操作將會取消激活 KDB：

　　#echo "0" ＞/proc/sys/kernel/kdb

　　在引導期間還可以將另一個標志傳遞給內核。kdb=early 標志將導致在引導過程的初始階段就把控制權傳遞給 KDB。如果您需要在引導過程初始階段進行調試，那麼這將有所幫助。

　　調用 KDB 的方式有很多。如果 KDB 處於打開狀態，那麼只要內核中有緊急情況就自動調用它。按下鍵盤上的 PAUSE 鍵將手工調用 KDB。調用 KDB 的另一種方式是通過串行控制台。當然，要做到這一點，需要設置串行控制台（請參閱參考資料以獲取這方面的幫助）並且需要一個從串行控制台進行讀取的程序。按鍵序列 Ctrl-A 將從串行控制台調用 KDB。

　　KDB 命令

　　KDB 是一個功能非常強大的工具，它允許進行幾個操作，比如內存和寄存器修改、應用斷點和堆棧跟蹤。根據這些，可以將 KDB 命令分成幾個類別。下面是有關每一類中最常用命令的詳細信息。

　　內存顯示和修改

　　這一類別中最常用的命令是 md、mdr、mm 和 mmW。

　　md 命令以一個地址／符號和行計數為參數，顯示從該地址開始的 line-count 行的內存。如果沒有指定 line-count，那麼就使用環境變量所指定的缺省值。如果沒有指定地址，那麼 md 就從上一次打印的地址繼續。地址打印在開頭，字符轉換打印在結尾。

　　mdr 命令帶有地址／符號以及字節計數，顯示從指定的地址開始的 byte-count 字節數的初始內存內容。它本質上和 md 一樣，但是它不顯示起始地址並且不在結尾顯示字符轉換。mdr 命令較少使用。

　　mm 命令修改內存內容。它以地址／符號和新內容作為參數，用 new-contents 替換地址處的內容。

　　mmW 命令更改從地址開始的 W 個字節。請注意，mm 更改一個機器字。

　　示例

　　顯示從 0xc000000 開始的 15 行內存：

　　[0]kdb＞ md 0xc000000 15

　　將內存位置為 0xc000000 上的內容更改為 0x10：

　　[0]kdb＞ mm 0xc000000 0x10

　　寄存器顯示和修改

　　這一類別中的命令有 rd、rm 和 ef。

　　rd 命令（不帶任何參數）顯示處理器寄存器的內容。它可以有選擇地帶三個參數。如果傳遞了 c 參數，則 rd 顯示處理器的控制寄存器；如果帶有 d 參數，那麼它就顯示調試寄存器；如果帶有 u 參數，則顯示上一次進入內核的當前任務的寄存器組。

　　rm 命令修改寄存器的內容。它以寄存器名稱和 new-contents 作為參數，用 new-contents 修改寄存器。寄存器名稱與特定的體系結構有關。目前，不能修改控制寄存器。

　　ef 命令以一個地址作為參數，它顯示指定地址處的異常幀。

　　示例

　　顯示通用寄存器組：

　　[0]kdb＞ rd

　　將寄存器 ebx 的內容設置成 0x25：

　　[0]kdb＞ rm %ebx 0x25

　　斷點

　　常用的斷點命令有 bp、bc、bd、be 和 bl。

　　bp 命令以一個地址／符號作為參數，它在地址處應用斷點。當遇到該斷點時則停止執行並將控制權交予 KDB。該命令有幾個有用的變體。bpa 命令對 SMP 系統中的所有處理器應用斷點。bph 命令強制在支持硬件寄存器的系統上使用它。bpha 命令類似於 bpa 命令，差別在於它強制使用硬件寄存器。

　　bd 命令禁用特殊斷點。它接收斷點號作為參數。該命令不是從斷點表中除去斷點，而只是禁用它。斷點號從 0 開始，根據可用性順序分配給斷點。

　　be 命令啟用斷點。該命令的參數也是斷點號。

　　bl 命令列出當前的斷點集。它包含了啟用的和禁用的斷點。

　　bc 命令從斷點表中除去斷點。它以具體的斷點號或 * 作為參數，在後一種情況下它將除去所有斷點。

　　示例

　　對函數 sys_write() 設置斷點：

　　[0]kdb＞ bp sys_write

　　列出斷點表中的所有斷點：

　　[0]kdb＞ bl

　　清除斷點號 1：

　　[0]kdb＞ bc 1

　　堆棧跟蹤

　　主要的堆棧跟蹤命令有 bt、btp、btc 和 bta。

　　bt 命令設法提供有關當前線程的堆棧的信息。它可以有選擇地將堆棧幀地址作為參數。如果沒有提供地址，那麼它采用當前寄存器來回溯堆棧。否則，它假定所提供的地址是有效的堆棧幀起始地址並設法進行回溯。如果內核編譯期間設置了 CONFIG_FRAME_POINTER 選項，那麼就用幀指針寄存器來維護堆棧，從而就可以正確地執行堆棧回溯。如果沒有設置 CONFIG_FRAME_POINTER，那麼 bt 命令可能會產生錯誤的結果。

上一篇文章：配置Red Flag Linux4.0分區
下一篇文章：內核編譯菜單中相關選項的意義

Linux維護

Linux 內核調試4－Qemu調試Linux內核