Linux是Unix操作系統的一種變種,在Linux下編寫驅動程序的原理和思想完全類似於其他的Unix系統,但它dos或window環境下的驅動程序有很大的區別。在Linux環境下設計驅動程序,思想簡潔,操作方便,功能也很強大,但是支持函數少,只能依賴kernel中的函數,有些常用的操作要自己來編寫,而且調試也不方便。本人這幾周來為實驗室自行研制的一塊多媒體卡編制了驅動程序,獲得了一些經驗,願與Linux fans共享,有不當之處,請予指正。
以下的一些文字主要來源於khg,johnsonm的Write linux device driver,Brennan's Guide to Inline Assembly,The Linux A-Z,還有清華BBS上的有關device driver的一些資料. 這些資料有的已經過時,有的還有一些錯誤,我依據自己的試驗結果進行了修正.
一、Linux device driver 的概念
系統調用是操作系統內核和應用程序之間的接口,設備驅動程序是操作系統內核和機器硬件之間的接口.設備驅動程序為應用程序屏蔽了硬件的細節,這樣在應用程序看來,硬件設備只是一個設備文件, 應用程序可以象操作普通文件一樣對硬件設備進行操作.設備驅動程序是內核的一部分,它完成以下的功能:
1.對設備初始化和釋放.
2.把數據從內核傳送到硬件和從硬件讀取數據.
3.讀取應用程序傳送給設備文件的數據和回送應用程序請求的數據.
4.檢測和處理設備出現的錯誤.
在Linux操作系統下有兩類主要的設備文件類型,一種是字符設備,另一種是塊設備.字符設備和塊設備的主要區別是:在對字符設備發出讀/寫請求時,實際的硬件I/O一般就緊接著發生了,塊設備則不然,它利用一塊系統內存作緩沖區,當用戶進程對設備請求能滿足用戶的要求,就返回請求的數據,如果不能,就調用請求函數來進行實際的I/O操作.塊設備是主要針對磁盤等慢速設備設計的,以免耗費過多的CPU時間來等待.
已經提到,用戶進程是通過設備文件來與實際的硬件打交道.每個設備文件都都有其文件屬性(c/b),表示是字符設備還蔤強樯璞?另外每個文件都有兩個設備號,第一個是主設備號,標識驅動程序,第二個是從設備號,標識使用同一個設備驅動程序的不同的硬件設備,比如有兩個軟盤,就可以用從設備號來區分他們.設備文件的的主設備號必須與設備驅動程序在登記時申請的主設備號一致,否則用戶進程將無法訪問到驅動程序.
最後必須提到的是,在用戶進程調用驅動程序時,系統進入核心態,這時不再是搶先式調度.也就是說,系統必須在你的驅動程序的子函數返回後才能進行其他的工作.如果你的驅動程序陷入死循環,不幸的是你只有重新啟動機器了,然後就是漫長的fsck.//hehe
讀/寫時,它首先察看緩沖區的內容,如果緩沖區的數據
如何編寫Linux操作系統下的設備驅動程序
二、實例剖析
我們來寫一個最簡單的字符設備驅動程序。雖然它什麼也不做,但是通過它可以了解Linux的設備驅動程序的工作原理.把下面的C代碼輸入機器,你就會獲得一個真正的設備驅動程序.不過我的kernel是2.0.34,在低版本的kernel上可能會出現問題,我還沒測試過.//xixi
#define __NO_VERSION__
#include <linux/modules.h>
#include <linux/version.h>
char kernel_version [] = UTS_RELEASE;
這一段定義了一些版本信息,雖然用處不是很大,但也必不可少.Johnsonm說所有的驅動程序的開頭都要包含<linux/config.h>,但我看倒是未必.
由於用戶進程是通過設備文件同硬件打交道,對設備文件的操作方式不外乎就是一些系統調用,如 open,read,write,close...., 注意,不是fopen, fread,但是如何把系統調用和驅動程序關聯起來呢?這需要了解一個非常關鍵的數據結構:
struct file_operations {
int (*seek) (struct inode * ,struct file *, off_t ,int);
int (*read) (struct inode * ,struct file *, char ,int);
int (*write) (struct inode * ,struct file *, off_t ,int);
int (*readdir) (struct inode * ,struct file *, struct dirent * ,int);
int (*select) (struct inode * ,struct file *, int ,select_table *);
int (*ioctl) (struct inode * ,struct file *, unsined int ,unsigned long);
int (*mmap) (struct inode * ,struct file *, struct vm_area_struct *);
int (*open) (struct inode * ,struct file *);
int (*release) (struct inode * ,struct file *);
int (*fsync) (struct inode * ,struct file *);
int (*fasync) (struct inode * ,struct file *,int);
int (*check_media_change) (struct inode * ,struct file *);
int (*revalidate) (dev_t dev);
}
這個結構的每一個成員的名字都對應著一個系統調用.用戶進程利用系統調用在對設備文件進行諸如read/write操作時,系統調用通過設備文件的主設備號找到相應的設備驅動程序,然後讀取這個數據結構相應的函數指針,接著把控制權交給該函數.這是linux的設備驅動程序工作的基本原理.既然是這樣,則編寫設備驅動程序的主要工作就是編寫子函數,並填充file_operations的各個域.
相當簡單,不是嗎?
下面就開始寫子程序.
#include <linux/types.h>
#include <linux/fs.h>
#include <linux/mm.h>
#include <linux/errno.h>
#include <asm/segment.h>
unsigned int test_major = 0;
static int read_test(struct inode *node,struct file *file,
char *buf,int count)
{
int left;
if (verify_area(VERIFY_WRITE,buf,count) == -EFAULT )
return -EFAULT;
for(left = count ; left > 0 ; left--)
{
__put_user(1,buf,1);
buf++;
}
return count;
}
這個函數是為read調用准備的.當調用read時,read_test()被調用,它把用戶的緩沖區全部寫1.buf 是read調用的一個參數.它是用戶進程空間的一個地址.但是在read_test被調用時,系統進入核心態.所以不能使用buf這個地址,必須用__put_user(),這是kernel提供的一個函數,用於向用戶傳送數據.另外還有很多類似功能的函數.請參考.在向用戶空間拷貝數據之前,必須驗證buf是否可用。
這就用到函數verify_area.
static int write_tibet(struct inode *inode,struct file *file,
const char *buf,int count)
{
return count;
}
static int open_tibet(struct inode *inode,struct file *file )
{
MOD_INC_USE_COUNT;
return 0;
}
static void release_tibet(struct inode *inode,struct file *file )
{
MOD_DEC_USE_COUNT;
}
這幾個函數都是空操作.實際調用發生時什麼也不做,他們僅僅為下面的結構提供函數指針。
struct file_operations test_fops = {
NULL,
read_test,
write_test,
NULL, /* test_readdir */
NULL,
NULL, /* test_ioctl */
NULL, /* test_mmap */
open_test,
release_test, NULL, /* test_fsync */
NULL, /* test_fasync */
/* nothing more, fill with NULLs */
};
設備驅動程序的主體可以說是寫好了。現在要把驅動程序嵌入內核。驅動程序可以按照兩種方式編譯。一種是編譯進kernel,另一種是編譯成模塊(modules),如果編譯進內核的話,會增加內核的大小,還要改動內核的源文件,而且不能動態的卸載,不利於調試,所以推薦使用模塊方式。
int init_module(void)
{
int result;
result = register_chrdev(0, "test", &test_fops);
if (result < 0) {
printk(KERN_INFO "test: can't get major number\n");
return result;
}
if (test_major == 0) test_major = result; /* dynamic */
return 0;
}
在用insmod命令將編譯好的模塊調入內存時,init_module 函數被調用。在這裡,init_module只做了一件事,就是向系統的字符設備表登記了一個字符設備。register_chrdev需要三個參數,參數一是希望獲得的設備號,如果是零的話,系統將選擇一個沒有被占用的設備號返回。參數二是設備文件名,參數三用來登記驅動程序實際執行操作的函數的指針。
如果登記成功,返回設備的主設備號,不成功,返回一個負值。
void cleanup_module(void)
{
unregister_chrdev(test_major, "test");
}
在用rmmod卸載模塊時,cleanup_module函數被調用,它釋放字符設備test在系統字符設備表中占有的表項。
一個極其簡單的字符設備可以說寫好了,文件名就叫test.c吧。
下面編譯
$ gcc -O2 -DMODULE -D__KERNEL__ -c test.c
得到文件test.o就是一個設備驅動程序。
如果設備驅動程序有多個文件,把每個文件按上面的命令行編譯,然後
ld -r file1.o file2.o -o modulename.
驅動程序已經編譯好了,現在把它安裝到系統中去。
$ insmod -f test.o
如果安裝成功,在/proc/devices文件中就可以看到設備test,並可以看到它的主設備號。
要卸載的話,運行
$ rmmod test
下一步要創建設備文件。
mknod /dev/test c major minor
c 是指字符設備,major是主設備號,就是在/proc/devices裡看到的。
用shell命令
$ cat /proc/devices | awk "}"
就可以獲得主設備號,可以把上面的命令行加入你的shell script中去。
minor是從設備號,設置成0就可以了。
我們現在可以通過設備文件來訪問我們的驅動程序。寫一個小小的測試程序。
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
main()
{
int testdev;
int i;
char buf[10];
testdev = open("/dev/test",O_RDWR);
if ( testdev == -1 )
{
printf("Cann't open file \n");
exit(0);
}
read(testdev,buf,10);
for (i = 0; i < 10;i++)
printf("%d\n",buf[i]);
close(testdev);
}
編譯運行,看看是不是打印出全1 ?
以上只是一個簡單的演示。真正實用的驅動程序要復雜的多,要處理如中斷,DMA,I/O port等問題。這些才是真正的難點。請看下節,實際情況的處理。
如何編寫Linux操作系統下的設備驅動程序
三、設備驅動程序中的一些具體問題
1. I/O Port.
和硬件打交道離不開I/O Port,老的ISA設備經常是占用實際的I/O端口,在linux下,操作系統沒有對I/O口屏蔽,也就是說,任何驅動程序都可對任意的I/O口操作,這樣就很容易引起混亂。每個驅動程序應該自己避免誤用端口。
有兩個重要的kernel函數可以保證驅動程序做到這一點。
1)check_region(int io_port, int off_set)
這個函數察看系統的I/O表,看是否有別的驅動程序占用某一段I/O口。
參數1:io端口的基地址,
參數2:io端口占用的范圍。
返回值:0 沒有占用, 非0,已經被占用。
2)request_region(int io_port, int off_set,char *devname)
如果這段I/O端口沒有被占用,在我們的驅動程序中就可以使用它。在使用之前,必須向系統登記,以防止被其他程序占用。登記後,在/proc/ioports文件中可以看到你登記的io口。
參數1:io端口的基地址。
參數2:io端口占用的范圍。
參數3:使用這段io地址的設備名。
在對I/O口登記後,就可以放心地用inb(), outb()之類的函來訪問了。
在一些pci設備中,I/O端口被映射到一段內存中去,要訪問這些端口就相當於訪問一段內存。經常性的,我們要獲得一塊內存的物理地址。在dos環境下,(之所以不說是dos操作系統是因為我認為DOS根本就不是一個操作系統,它實在是太簡單,太不安全了)只要用段:偏移就可以了。在window95中,95ddk提供了一個vmm 調用 _MapLinearToPhys,用以把線性地址轉化為物理地址。但在Linux中是怎樣做的呢?
2.內存操作
在設備驅動程序中動態開辟內存,不是用malloc,而是kmalloc,或者用get_free_pages直接申請頁。釋放內存用的是kfree,或free_pages. 請注意,kmalloc等函數返回的是物理地址!而malloc等返回的是線性地址!關於kmalloc返回的是物理地址這一點本人有點不太明白:既然從線性地址到物理地址的轉換是由386cpu硬件完成的,那樣匯編指令的操作數應該是線性地址,驅動程序同樣也不能直接使用物理地址而是線性地址。但是事實上kmalloc返回的確實是物理地址,而且也可以直接通過它訪問實際的RAM,我想這樣可以由兩種解釋,一種是在核心態禁止分頁,但是這好像不太現實;另一種是linux的頁目錄和頁表項設計得正好使得物理地址等同於線性地址。我的想法不知對不對,還請高手指教。
言歸正傳,要注意kmalloc最大只能開辟128k-16,16個字節是被頁描述符結構占用了。kmalloc用法參見khg.
內存映射的I/O口,寄存器或者是硬件設備的RAM(如顯存)一般占用F0000000以上的地址空間。在驅動程序中不能直接訪問,要通過kernel函數vremap獲得重新映射以後的地址。
另外,很多硬件需要一塊比較大的連續內存用作DMA傳送。這塊內存需要一直駐留在內存,不能被交換到文件中去。但是kmalloc最多只能開辟128k的內存。
這可以通過犧牲一些系統內存的方法來解決。
具體做法是:比如說你的機器由32M的內存,在lilo.conf的啟動參數中加上mem=30M,這樣linux就認為你的機器只有30M的內存,剩下的2M內存在vremap之後就可以為DMA所用了。
請記住,用vremap映射後的內存,不用時應用unremap釋放,否則會浪費頁表。
3.中斷處理
同處理I/O端口一樣,要使用一個中斷,必須先向系統登記。
int request_irq(unsigned int irq ,
void(*handle)(int,void *,struct pt_regs *),
unsigned int long flags,
const char *device);
irq: 是要申請的中斷。
handle:中斷處理函數指針。
flags:SA_INTERRUPT 請求一個快速中斷,0 正常中斷。
device:設備名。
如果登記成功,返回0,這時在/proc/interrupts文件中可以看你請求的中斷。
4.一些常見的問題。
對硬件操作,有時時序很重要。但是如果用C語言寫一些低級的硬件操作的話,gcc往往會對你的程序進行優化,這樣時序就錯掉了。如果用匯編寫呢,gcc同樣會對匯編代碼進行優化,除非你用volatile關鍵字修飾。最保險的辦法是禁止優化。這當然只能對一部分你自己編寫的代碼。如果對所有的代碼都不優化,你會發現驅動程序根本無法裝載。這是因為在編譯驅動程序時要用到gcc的一些擴展特性,而這些擴展特性必須在加了優化選項之後才能體現出來。