PCI總線推出以來,以其獨有的特性受到眾多廠商的青睐,已經成為計算機擴展總線的主流。目前,國內的許多技術人員已經具備開發PCI總線接口設備的能 力。但是PCI總線的編程技術,也就是對PCI總線設備的操作技術,一直是一件讓技術人員感到頭疼的事情。PCI總線編程的核心技術是對相應板卡配置空間 的理解和訪問。一般軟件編程人員基於對硬件設備原理的生疏,很難理解並操作配置空間,希望硬件開發人員直接告訴他們怎樣操作;而PCI總線硬件開發人員雖 深刻地理解了其意義,在沒有太多編程經驗地前提下,也難於輕易地操作PCI板卡。結果大多是硬件技術人員花費大量時間和精力去學習DDK、 WINDRVER等驅動程序開發軟件。
作者在開發PCI總線接口設備時,經過對PCI總線協議的深入研究,從協議本身的角度出發,找到一種方面而快捷的PCI配置空間操作方法,只使用簡單的 I/O命令即可找到特定的PCI總線設備並對其所有的配置空間進行讀寫操作。一旦讀得其配置空間的內容,即可中得到擔任系統對該PCI總線設備的資源分 配。
1 PCI總線配置空間及配置機制
為避免各PCI設備在資源的占用上發生沖突,PCI總線采用即插即用協議。即在系統建立時由操作系統按照各設備的要求統一分配資源,資源分配的信息由系統 寫入各PCI設備的配置空間寄存器,並在操作系統內部備份。各PCI設備有其獨自的配置空間,設計者通過對積壓設備(或插槽)的ISDEL引腳的驅動區分 不同設備的配置空間。配置空間的前64個字節稱為配置空間的預定自區,它對每個設備都具有相同的定義且必須被支持;共後的空間稱為設備關聯區,由設備制造 商根據需要定義。與編程有關的配置空間信息主要有:
(1)設備號(Device ID)及銷售商號(Vendor ID),配置空間偏移量為00h,用於對各PCI設備的區分和查找。為了保證其唯一性,Vendor ID應當向PCI特別興趣小組(PCI SIG)申請而得到。
(2)PCI基地址(PCI Base Address),配置空間偏移量為10~24h,設備通過設定可讀寫的高位數值來向操作系統指示所需資源空間的大小。比如,某設備需要64K字節的內存 空間,可以將配置空間的某基地址寄存器的高16位設成可讀寫的,而將低16位置為0(只可讀)。操作系統在建立時,先向所有位寫1,實際上只有高16位被 接收而被置成了1,低16位仍為0.這樣操作系統讀取該寄存器時,返回值為FFFF0000h,據此操作系統可以斷定其需要的空間大小是64K字節,然後 分配一段空閒的內存空間並向該寄存器的高16位填寫其地址。
其它可能與編程有關的配置空間的定義及地址請參閱參考文獻[1]。
由於PC-AT兼容系統CPU只有內存和I/O兩種空間,沒有專用的配置空間,PCI協議規定利用特定的I/O空間操作驅動PCI橋路轉換成配置空間的操 作。目前存在兩種轉換機制,即配置機制1#和配置機制2#。配置機制2#在新的設計中將不再被采用,新的設計應使用配置機制1#來產生配置空間的物理操 作。這種機制使用了兩個特定的32位I/O空間,即CF8h和CFCh。這兩個空間對應於PCI橋路的兩個寄存器,當橋路看到CPU在局部總線對這兩個 I/O空間進行雙字操作時,就將該I/O操作轉變為PCI總線的配置操作。寄存器CF8h用於產生配置空間的地址(CONFIG-ADDRESS),寄存 器CFCh用於保存配置空間的讀寫數據(CONFIG-DATA)。
配置空間地址寄存器的格式如圖1。
CF8H(局部總線):
當CPU發出對I/O空間CFCh的操作時,PCI橋路將檢查配置空間地址寄存器CF8h的31位。如果為1,就在PCI總線上產生一個相應的配置空間讀或寫操作,其地址由PCI橋路根據配置空間地址寄存器的內容作如圖2所示的轉換。
CFCh (局部總線):
設備號被PCI橋路譯碼產生PCI總線地址的高位地址,它們被設計者用作IDSEL信號來區分相應的PCI設備。6位寄存器號用於尋址該PCI設備配置空 間62個雙字的配置寄存器(256字節)。功能號用於區分多功能設備的某特定功能的配置空間,對常用的單功能設備為000。某中PCI插槽的總線號隨系統 (主板)的不同稍有區別,大多數PC機為1,工控機可能為2或3。為了找到某設備,應在系統的各個總線號上查找,直到定位。如果在0~5號總線上不能發現 該設備,即可認為該設備不存在。
理解了上述PCI協議裡的配置機制後,就可以直接對CF8h和CFCh兩個雙字的I/O空間進行操作,查找某個PCI設備並訪問其配置空間,從而得到操作系統對該PCI設備的資源分配。
2 用I/O命令訪問PCI總線配置空間
要訪問PCI總線設備的配置空間,必須先查找該設備。查找的基本根據是各PCI設備的配置空間裡都存有特定的設備號(Device ID)及銷售商號(Vendor ID),它們占用配置空間的00h地址。而查找的目的是獲得該設備的總線號和設備號。查找的基本過程如下:用I/O命令寫配置空間的地址寄存器CF8h, 使其最高位為1,總線號及設備為0,功能號及寄存器號為0,即往I/O端口CF8h80000000h;然後用I/O命令讀取配置空間的數據寄存器 CFCh。如果該寄存器值與該PCI設備的Device ID及Vendor ID不相符,則依次遞增設備號/總線號,重復上述操作直到找到該設備為止。如果查完所有的設備號/總線號(1~5)仍不能找到該設備,則應當考慮硬件上的 問題。對於多功能設備,只要設備配置寄存器相應的功能號值,其余步驟與單功能設備一樣。
如查找設備號為9054h,銷售商號為10b5的單功能PCI設備,編寫的程序如下:
調用子程序scan( ),如果返回值為-1,則沒有找到該PCI設備。如果返回值為0,則找到了該PCI設備。該設備的總線號和設備號分別在全局變量bus和device中, 利用這兩個變量即可輕易對該設備的配置空間進行訪問,從而得到分配的資源信息。假設該PCI設備占用了4個資源空間,分別對應於配置空間10h~1ch, 其中前兩個為I/O空間,後兩個為內存空間,若定義其基地址分別為ioaddr1,ioaddr2,memaddr1,memaddr2,相應的程序如 下:
對於I/O基地址,最低兩位D0、D1固定為01,對地址本身無效,應當被屏蔽。對PC-AT兼容機,I/O有效地址為16位,因此高位也應被屏蔽。對於 內存地址,最低位D0固定為0,而D1~D3用於指示該地址的一些物理特性[1],因此其低4位地址應當被屏蔽。需要指出的是該內存地址是系統的物理地 址,在WINDOWS運行於保護模式時,需要經過轉換得到相應的線性地址才能對該內存空間進行直接讀寫。介紹該轉換方法的相關文章較為常見,此處不再贅 述。
上述程序給出了讀取配置空間裡的基地址的方法。另有相當多PCI設備通過配置空間的設備關聯區來設置該設備的工作狀態,可輕易地用I/O命令進行相應的設置,無須編寫繁雜的驅動程序。在開發PCI視頻圖像采集卡的過程中,該方法得到了實際應用。
#define PCI_CFG_DATA 0xcfc #define PCI_CFG_CTRL 0xcf8 void pci_read_config_byte(unsigned char bus, unsigned char dev, unsigned char offset, unsigned char *val) { unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL); *val = inl(PCI_CFG_DATA) >> ((offset & 3) * 8); } void pci_read_config_word(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short *val) { unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL); *val = inl(PCI_CFG_DATA) >> ((offset & 3) * 8); } void pci_read_config_dword(unsigned char bus, unsigned char dev, unsigned char offset, unsigned int *val) { unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset)), PCI_CFG_CTRL); *val = inl(PCI_CFG_DATA); } 很明顯就是先向控制寄存器寫入綜合地址,格式前面已經提到,對比一下是完全一樣的。然後從數據寄存器讀數據即可,由於數據寄存器是32位的,如果不是讀取雙字,需要做移位操作。 另外一定需要注意大小端問題,如需要就要進行大小端轉換,下面寫程序也一樣。 5. 寫程序 void pci_write_config_dword(unsigned char bus, unsigned char dev, unsigned char offset, unsigned int val) { unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset)), PCI_CFG_CTRL); outl(val, PCI_CFG_DATA); } void pci_write_config_word(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short val) { unsigned long tmp; unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) | ((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL); tmp = inl(PCI_CFG_DATA); tmp &= ~(0xffff << ((offset & 0x3) * 8)); tmp |= (val << ((offset & 0x3) * 8)); outl(tmp, PCI_CFG_DATA); } void pci_write_config_byte(unsigned char bus, unsigned char dev, unsigned char offset, unsigned short val) { unsigned long tmp; unsigned char fun = 0; outl((0x80000000 | ((bus)<<16) |((dev)<<11) |((fun)<<8) | (offset & ~0x3)), PCI_CFG_CTRL); tmp = inl(PCI_CFG_DATA); tmp &= ~(0xff << ((offset & 0x3) * 8)); tmp |= (val << ((offset & 0x3) * 8)); outl(tmp, PCI_CFG_DATA); } 寫程序同讀程序一樣,先向控制寄存器寫入綜合地址,然後向數據寄存器寫入數據。 6. 問題 上面的程序都是參考linux內核對pci空間的讀寫程序寫的。但是在應用程序中讀寫pci空間和在內核中讀寫pci空間是完全不同的。在linux源代碼中可以看到,在進行pci空間的讀寫操作都是在關閉中斷的情況下進行的,而在用戶程序空間就沒有這個手段了。所以,讀寫可能會出錯。 經過本人試驗,讀基本上沒有出錯過,而寫有一定出錯的概率,慎用! 有興趣的,可以隨便寫個應用程序試試看。 7. 源代碼 附上一份源代碼,可以直接編譯運行。 #include#include #include static unsigned int read_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset) { unsigned int v; outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); v = inl(0xcfc); return v; } unsigned char read_pci_config_8(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset) { unsigned char v; outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); v = inb(0xcfc + (offset&3)); return v; } unsigned short read_pci_config_16(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset) { unsigned short v; outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); v = inw(0xcfc + (offset&2)); return v; } void write_pci_config_32(unsigned char bus, unsigned char slot, unsigned char func, unsigned char offset, unsigned int val) { outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); outl(val, 0xcfc); } void write_pci_config_8(unsigned char bus,unsigned char slot, unsigned char func, unsigned char offset, unsigned char val) { outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); outb(val, 0xcfc + (offset&3)); } void write_pci_config_16(unsigned char bus,unsigned char slot, unsigned char func, unsigned char offset, unsigned char val) { outl(0x80000000 | (bus<<16) | (slot<<11) | (func<<8) | offset, 0xcf8); outw(val, 0xcfc + (offset&2)); } int main(void) { iopl(3); printf("0 0 0 0 = %x\n", read_pci_config_16(0, 0 , 0, 0)); printf("0 0 0 2 = %x\n", read_pci_config_16(0, 0 , 0, 2)); printf("0 1 0 0 = %x\n", read_pci_config_16(0, 1 , 0, 0)); printf("0 1 0 2 = %x\n", read_pci_config_16(0, 1 , 0, 2)); printf("0 7 1 0 = %x\n", read_pci_config_16(0, 7 , 1, 0)); printf("0 7 1 2 = %x\n", read_pci_config_16(0, 7 , 1, 2)); return 0; }