作者:詹榮開 摘要 本文主要從內核實現的角度分析了Linux 2.4.0內核對ISA總線接口的外設進行DMA傳輸的實現。本文是為那些想要了解Linux I/O子系統的讀者和Linux驅動程序開發人員而寫的。 申明:這份文檔是按照自由軟件開放源代碼的精神發布的,任何人可以免費獲得、使用和重新發布,但是你沒有限制別人重新發布你發布內容的權利。發布本文的目的是希望它能對讀者有用,但沒有任何擔保,甚至沒有適合特定目的的隱含的擔保。更詳細的情況請參閱GNU通用公共許可證(GPL),以及GNU自由文檔協議(GFDL)。 你應該已經和文檔一起收到一份GNU通用公共許可證(GPL)的副本。如果還沒有,寫信給:The Free Software Foundation, Inc., 675 Mass Ave, Cambridge,MA02139, USA 歡迎各位指出文檔中的錯誤與疑問。 ---------------------------------------------------- DMA是一種無需CPU的參與就可以讓外設與系統RAM之間進行雙向(to device 或 from device)數據傳輸的硬件機制。使用DMA可以使系統CPU從實際的I/O數據傳輸過程中擺脫出來,從而大大提高系統的吞吐率(throughput)。 由於DMA是一種硬件機制,因此它通常與硬件體系結構是相關的,尤其是依賴於外設的總線技術。比如:ISA卡的DMA機制就與PCI卡的DMA機制有區別。本站主要討論ISA總線的DMA技術。 1.DMA概述 DMA是外設與主存之間的一種數據傳輸機制。一般來說,外設與主存之間存在兩種數據傳輸方法:(1)Pragrammed I/O(PIO)方法,也即由CPU通過內存讀寫指令或I/O指令來持續地讀寫外設的內存單元(8位、16位或32位),直到整個數據傳輸過程完成。(2)DMA,即由DMA控制器(DMA Controller,簡稱DMAC)來完成整個數據傳輸過程。在此期間,CPU可以並發地執行其他任務,當DMA結束後,DMAC通過中斷通知CPU數據傳輸已經結束,然後由CPU執行相應的ISR進行後處理。 DMA技術產生時正是ISA總線在PC中流行的時侯。因此,ISA卡的DMA數據傳輸是通過ISA總線控制芯片組中的兩個級聯8237 DMAC來實現的。這種DMA機制也稱為“標准DMA”(standard DMA)。標准DMA有時也稱為“第三方DMA”(third-party DMA),這是因為:系統DMAC完成實際的傳輸過程,所以它相對於傳輸過程的“前兩方”(傳輸的發送者和接收者)來說是“第三方”。 標准DMA技術主要有兩個缺點:(1)8237 DMAC的數據傳輸速度太慢,不能與更高速的總線(如PCI)配合使用。(2)兩個8237 DMAC一起只提供了8個DMA通道,這也成為了限制系統I/O吞吐率提升的瓶頸。 鑒於上述兩個原因,PCI總線體系結構設計一種成為“第一方DMA”(first-party DMA)的DMA機制,也稱為“Bus Mastering”(總線主控)。在這種情況下,進行傳輸的PCI卡必須取得系統總線的主控權後才能進行數據傳輸。實際的傳輸也不借助慢速的ISA DMAC來進行,而是由內嵌在PCI卡中的DMA電路(比傳統的ISA DMAC要快)來完成。Bus Mastering方式的DMA可以讓PCI外設得到它們想要的傳輸帶寬,因此它比標准DMA功能滿足現代高性能外設的要求。 隨著計算機外設技術的不斷發展,現代能提供更快傳輸速率的Ultra DMA(UDMA)也已經被廣泛使用了。本為隨後的篇幅只討論ISA總線的標准DMA技術在Linux中的實現。記住:ISA卡幾乎不使用Bus Mastering模式的DMA;而PCI卡只使用Bus Mastering模式的DMA,它從不使用標准DMA。 2.Intel 8237 DMAC 最初的IBM PC/XT中只有一個8237 DMAC,它提供了4個8位的DMA通道(DMA channel 0-3)。從IBM AT開始,又增加了一個8237 DMAC(提供4個16位的DMA通道,DMA channel 4-7)。兩個8237 DMAC一起為系統提供8個DMA通道。與中斷控制器8259的級聯方式相反,第一個DMAC被級聯到第二個DMAC上,通道4被用於DMAC級聯,因此它對外設來說是不可用的。第一個DMAC也稱為“slave DAMC”,第二個DMAC也稱為“Master DMAC”。 下面我們來詳細敘述一下Intel 8237這個DMAC的結構。 每個8237 DMAC都提供4個DMA通道,每個DMA通道都有各自的寄存器,而8237本身也有一組控制寄存器,用以控制它所提供的所有DMA通道。 2.1 DMA通道的寄存器 8237 DMAC中的每個DMA通道都有5個寄存器,分別是:當前地址寄存器、當前計數寄存器、地址寄存器(也稱為偏移寄存器)、計數寄存器和頁寄存器。其中,前兩個是8237的內部寄存器,對外部是不可見的。 (1)當前地址寄存器(Current Address Register):每個DMA通道都有一個16位的當前地址寄存器,表示一個DMA傳輸事務(Transfer Transaction)期間當前DMA傳輸操作的DMA物理內存地址。在每個DMA傳輸開始前,8237都會自動地用該通道的Address Register中的值來初始化這個寄存器;在傳輸事務期間的每次DMA傳輸操作之後該寄存器的值都會被自動地增加或減小。 (2)當前計數寄存器(Current Count Register):每個每個DMA通道都有一個16位的當前計數寄存器,表示當前DMA傳輸事務還剩下多少未傳輸的數據。在每個DMA傳輸事務開始之前,8237都會自動地用該通道的Count Register中的值來初始化這個寄存器。在傳輸事務期間的每次DMA傳輸操作之後該寄存器的值都會被自動地增加或減小(步長為1)。 (3)地址寄存器(Address Register)或偏移寄存器(Offset Register):每個DMA通道都有一個16位的地址寄存器,表示系統RAM中的DMA緩沖區的起始位置在頁內的偏移。 (4)計數寄存器(Count Register):每個DMA通道都有一個16位的計數寄存器,表示DMA緩沖區的大小。 (5)頁寄存器(Page Register):該寄存器定義了DMA緩沖區的起始位置所在物理頁的基地址,即頁號。頁寄存器有點類似於PC中的段基址寄存器。 2.2 8237 DAMC的控制寄存器 (1)命令寄存器(Command Register) 這個8位的寄存器用來控制8237芯片的操作。其各位的定義如下圖所示: (2)模式寄存器(Mode Register) 用於控制各DMA通道的傳輸模式,如下所示: (3)請求寄存器(Request Register) 用於向各DMA通道發出DMA請求。各位的定義如下: (4)屏蔽寄存器(Mask Register) 用來屏蔽某個DMA通道。當一個DMA通道被屏蔽後,它就不能在服務於DMA請求,直到通道的屏蔽碼被清除。各位的定義如下: 上述屏蔽寄存器也稱為“單通道屏蔽寄存器”(Single Channel Mask Register),因為它一次只能屏蔽一個通道。此外含有一個屏蔽寄存器,可以實現一次屏蔽所有4個DMA通道,如下: (5)狀態寄存器(Status Register) 一個只讀的8位寄存器,表示各DMA通道的當前狀態。比如:DMA通道是否正服務於一個DMA請求,或者某個DMA通道上的DMA傳輸事務已經完成。各位的定義如下: 2.3 8237 DMAC的I/O端口地址 主、從8237 DMAC的各個寄存器都是編址在I/O端口空間的。而且其中有些I/O端口地址對於I/O讀、寫操作有不同的表示含義。如下表示所示: Slave DMAC’s I/O port Master DMAC’sI/O port read write 0x000 0x0c0 Channel 0/4 的Address Register 0x001 0x0c1 Channel 0/4的Count Register 0x002 0x0c2 Channel 1/5 的Address Register 0x003 0x0c3 Channel 1/5的Count Register 0x004 0x0c4 Channel 2/6的Address Register 0x005 0x0c5 Channel 2/6的Count Register 0x006 0x0c6 Channel 3/7的Address Register 0x007 0x0c7 Channel 3/7的Count Register 0x008 0x0d0 Status Register Command Register 0x009 0x0d2 Request Register 0x00a 0x0d4 Single Channel Mask Register 0x00b 0x0d6 Mode Register 0x00c 0x0d8 Clear Flip-Flop Register 0x00d 0x0da Temporary Register Reset DMA controller 0x00e 0x0dc Reset all channel masks 0x00f 0x0de all-channels Mask Register 各DMA通道的Page Register在I/O端口空間中的地址如下: DMA channel Page Register’sI/O port address 0 0x087 1 0x083 2 0x081 3 0x082 4 0x08f 5 0x08b 6 0x089 7 0x08a 注意兩點: 1. 各DMA通道的Address Register是一個16位的寄存器,但其對應的I/O端口是8位寬,因此對這個寄存器的讀寫就需要兩次連續的I/O端口讀寫操作,低8位首先被發送,然後緊接著發送高8位。 2. 各DMA通道的Count Register:這也是一個16位寬的寄存器(無論對於8位DMA還是16位DMA),但相對應的I/O端口也是8位寬,因此讀寫這個寄存器同樣需要兩次連續的I/O端口讀寫操作,而且同樣是先發送低8位,再發送高8位。往這個寄存器中寫入的值應該是實際要傳輸的數據長度減1後的值。在DMA傳輸事務期間,這個寄存器中的值在每次DMA傳輸操作後都會被減1,因此讀取這個寄存器所得到的值將是當前DMA事務所剩余的未傳輸數據長度減1後的值。當DMA傳輸事務結束時,該寄存器中的值應該被置為0。 2.4 DMA通道的典型使用 在一個典型的PC機中,某些DMA通道通常被固定地用於一些PC機中的標准外設,如下所示: Channel Size Usage 0 8-bit Memory Refresh 1 8-bit Free 2 8-bit Floppy Disk Controller 3 8-bit Free 4 16-bit Cascading 5 16-bit Free 6 16-bit Free 7 16-bit Free 2.5 啟動一個DMA傳輸事務的步驟 要啟動一個DMA傳輸事務必須對8237進行編程,其典型步驟如下: 1.通過CLI指令關閉中斷。 2.Disable那個將被用於此次DMA傳輸事務的DMA通道。 3.向Flip-Flop寄存器中寫入0值,以重置它。 4.設置Mode Register。 5.設置Page Register。 6.設置Address Register。 7.設置Count Register。 8.Enable那個將被用於此次DMA傳輸事務的DMA通道。 9.用STI指令開中斷。 3 Linux對讀寫操作8237 DMAC的實現 由於DMAC的各寄存器是在I/O端口空間中編址的,因此讀寫8237 DMAC是平台相關的。對於x86平台來說,Linux在include/asm-i386/Dma.h頭文件中實現了對兩個8237 DMAC的讀寫操作。 3.1 端口地址和寄存器值的宏定義 Linux用宏MAX_DMA_CHANNELS來表示系統當前的DMA通道個數,如下: #define MAX_DMA_CHANNELS 8 然後,用宏IO_DMA1_BASE和IO_DMA2_BASE來分別表示兩個DMAC在I/O端口空間的端口基地址: #define IO_DMA1_BASE 0x00 /* 8 bit slave DMA, channels 0..3 */ #define IO_DMA2_BASE 0xC0 /* 16 bit master DMA, ch 4(=slave input)..7 */ 接下來,Linux定義了DMAC各控制寄存器的端口地址。其中,slave SMAC的各控制寄存器的端口地址定義如下: #define DMA1_CMD_REG 0x08 /* command register (w) */ #define DMA1_STAT_REG 0x08 /* status register (r) */ #define DMA1_REQ_REG 0x09 /* request register (w) */ #define DMA1_MASK_REG 0x0A /* single-channel mask (w) */ #define DMA1_MODE_REG 0x0B /* mode register (w) */ #define DMA1_CLEAR_FF_REG 0x0C /* clear pointer flip-flop (w) */ #define DMA1_TEMP_REG 0x0D /* Temporary Register (r) */ #define DMA1_RESET_REG 0x0D /* Master Clear (w) */ #define DMA1_CLR_MASK_REG 0x0E /* Clear Mask */ #define DMA1_MASK_ALL_REG 0x0F /* all-channels mask (w) */ Master DMAC的各控制寄存器的端口地址定義如下: #define DMA2_CMD_REG 0xD0 /* command register (w) */ #define DMA2_STAT_REG 0xD0 /* status register (r) */ #define DMA2_REQ_REG 0xD2 /* request register (w) */ #define DMA2_MASK_REG 0xD4 /* single-channel mask (w) */ #define DMA2_MODE_REG 0xD6 /* mode register (w) */ #define DMA2_CLEAR_FF_REG 0xD8 /* clear pointer flip-flop (w) */ #define DMA2_TEMP_REG 0xDA /* Temporary Register (r) */ #define DMA2_RESET_REG 0xDA /* Master Clear (w) */ #define DMA2_CLR_MASK_REG 0xDC /* Clear Mask */ #define DMA2_MASK_ALL_REG 0xDE /* all-channels mask (w) */ 8個DMA通道的Address Register的端口地址定義如下: #define DMA_ADDR_0 0x00 /* DMA address registers */ #define DMA_ADDR_1 0x02 #define DMA_ADDR_2 0x04 #define DMA_ADDR_3 0x06 #define DMA_ADDR_4 0xC0 #define DMA_ADDR_5 0xC4 #define DMA_ADDR_6 0xC8 #define DMA_ADDR_7 0xCC 8個DMA通道的Count Register的端口地址定義如下: #define DMA_CNT_0 0x01 /* DMA count registers */ #define DMA_CNT_1 0x03 #define DMA_CNT_2 0x05 #define DMA_CNT_3 0x07 #define DMA_CNT_4 0xC2 #define DMA_CNT_5 0xC6 #define DMA_CNT_6 0xCA #define DMA_CNT_7 0xCE 8個DMA通道的Page Register的端口地址定義如下: #define DMA_PAGE_0 0x87 /* DMA page registers */ #define DMA_PAGE_1 0x83 #define DMA_PAGE_2 0x81 #define DMA_PAGE_3 0x82 #define DMA_PAGE_5 0x8B #define DMA_PAGE_6 0x89 #define DMA_PAGE_7 0x8A Mode Register的幾個常用值的定義如下: #define DMA_MODE_READ 0x44 /* I/O to memory, no autoinit, increment, single mode */ #define DMA_MODE_WRITE 0x48 /* memory to I/O, no autoinit, increment, single mode */ #define DMA_MODE_CASCADE 0xC0 /* pass thru DREQ->HRQ, DACK<-HLDA only */ #define DMA_AUTOINIT 0x10 3.2 讀寫DMAC的高層接口函數 (1)使能/禁止一個特定的DMA通道 Single Channel Mask Register中的bit[2]為0表示使能一個DMA通道,為1表示禁止一個DMA通道;而該寄存器中的bit[1:0]則用於表示使能或禁止哪一個DMA通道。 函數enable_dma()實現使能某個特定的DMA通道,傳輸dmanr指定DMA通道號,其取值范圍是0~DMA_MAX_CHANNELS-1。如下: static __inline__ void enable_dma(unsigned int dmanr) { if (dmanr<=3) dma_outb(dmanr, DMA1_MASK_REG); else dma_outb(dmanr & 3, DMA2_MASK_REG); } 宏dma_outb和dma_inb實際上就是outb(或outb_p)和inb函數。注意,當dmanr取值大於3時,對應的是Master DMAC上的DMA通道0~3,因此在寫DMA2_MASK_REG之前,要將dmanr與值3進行與操作,以得到它在master DMAC上的局部通道編號。 函數disable_dma()禁止一個特定的DMA通道,其源碼如下: static __inline__ void disable_dma(unsigned int dmanr) { if (dmanr<=3) dma_outb(dmanr 4, DMA1_MASK_REG); else dma_outb((dmanr & 3) 4, DMA2_MASK_REG); } 為禁止某個DMA通道,Single Channel Mask Register中的bit[2]應被置為1。 (2)清除Flip-Flop寄存器 函數Clear_dma_ff()實現對slave/Master DMAC的Flip-Flop寄存器進行清零操作。如下: static __inline__ void clear_dma_ff(unsigned int dmanr) { if (dmanr<=3) dma_outb(0, DMA1_CLEAR_FF_REG); else dma_outb(0, DMA2_CLEAR_FF_REG); } (3)設置某個特定DMA通道的工作模式 函數set_dma_mode()實現設置一個特定DMA通道的工作模式。如下: static __inline__ void set_dma_mode(unsigned int dmanr, char mode) { if (dmanr<=3) dma_outb(mode dmanr, DMA1_MODE_REG); else dma_outb(mode (dmanr&3), DMA2_MODE_REG); } DMAC 的Mode Register中的bit[1:0]指定對該DMAC上的哪一個DMA通道進行模式設置。 (4)為DMA通道設置DMA緩沖區的起始物理地址和大小 由於8237中的DMA通道是通過一個8位的Page Register和一個16位的Address Register來尋址位於系統RAM中的DMA緩沖區,因此8237 DMAC最大只能尋址系統RAM中物理地址在0x000000~0xffffff范圍內的DMA緩沖區,也即只能尋址物理內存的低16MB(24位物理地址)。反過來講,Slave/Master 8237 DMAC又是如何尋址低16MB中的物理內存單元的呢? 首先來看Slave 8237 DMAC(即第一個8237 DMAC)。由於Slave 8237 DMAC是一個8位的DMAC,因此DMA通道0~3在一次DMA傳輸操作(一個DMA傳輸事務又多次DMA傳輸操作組成)中只能傳輸8位數據,即一個字節。Slave 8237 DMAC將低16MB物理內存分成256個64K大小的頁(Page),然後用Page Register來表示內存單元物理地址的高8位(bit[23:16]),也即頁號;用Address Register來表示內存單元物理地址在一個Page(64KB大小)內的頁內偏移量,也即24位物理地址中的低16位(bit[15:0])。由於這種尋址機制,因此DMA通道0~3的DMA緩沖區必須在一個Page之內,也即DMA緩沖區不能跨越64KB頁邊界。 再來看看Master 8237 DMAC(即第二個8237 DMAC)。這是一個16位寬的DMAC,因此DMA通道5~7在一次DMA傳輸操作時可以傳輸16位數據,也即一個字Word。此時DMA通道的Count Register(16位寬)表示以字計的待傳輸數據塊大小,因此數據塊最大可達128KB(64K個字),也即系統RAM中的DMA緩沖區最大可達128KB。由於一次可傳輸一個字,因此Master 8237 DMAC所尋址的內存單元的物理地址肯定是偶數,也即物理地址的bit[0]肯定為0。此時物理內存的低16MB被化分成128個128KB大小的page,Page Register中的bit[7:1]用來表示頁號,也即對應內存單元物理地址的bit[23:17],而Page Register的bit[0]總是被設置為0。Address Register用來表示內存單元在128KB大小的Page中的頁內偏移,也即對應內存單元物理地址的bit[16:1](由於此時物理地址的bit[0]總是為0,因此不需要表示)。由於Master 8237 DMAC的這種尋址機制,因此DMA通道5~7的DMA緩沖區不能跨越128KB的頁邊界。 下面我們來看看Linux是如何實現為各DMA通道設置其Page寄存器的。NOTE!DMA通道5~7的Page Register中的bit[0]總是為0。如下所示: static __inline__ void set_dma_page(unsigned int dmanr, char pagenr) { switch(dmanr) { case 0: dma_outb(pagenr, DMA_PAGE_0); break; case 1: dma_outb(pagenr, DMA_PAGE_1); break; case 2: dma_outb(pagenr, DMA_PAGE_2); break; case 3: dma_outb(pagenr, DMA_PAGE_3); break; case 5: dma_outb(pagenr & 0xfe, DMA_PAGE_5); break; case 6: dma_outb(pagenr & 0xfe, DMA_PAGE_6); break; case 7: dma_outb(pagenr & 0xfe, DMA_PAGE_7); break; } } 在上述函數的基礎上,函數set_dma_addr()用來為特定DMA通道設置DMA緩沖區的基地址,傳輸dmanr指定DMA通道號,傳輸a指定位於系統RAM中的DMA緩沖區起始位置的物理地址。如下: /* Set transfer address & page bits for specific DMA channel. * Assumes dma flipflop is clear. */ static __inline__ void set_dma_addr(unsigned int dmanr, unsigned int a) { set_dma_page(dmanr, a>>16); if (dmanr <= 3) { dma_outb( a & 0xff, ((dmanr&3)<<1) + IO_DMA1_BASE ); dma_outb( (a>>8) & 0xff, ((dmanr&3)<<1) + IO_DMA1_BASE ); } else { dma_outb( (a>>1) & 0xff, ((dmanr&3)<<2) + IO_DMA2_BASE ); dma_outb( (a>>9) & 0xff, ((dmanr&3)<<2) + IO_DMA2_BASE ); } } 函數set_dma_count()為特定DMA通道設置其Count Register的值。傳輸dmanr指定DMA通道,傳輸count指定待傳輸的數據塊大小(以字節計),實際寫到Count Register中的值應該是count-1。如下所示: static __inline__ void set_dma_count(unsigned int dmanr, unsigned int count) { count--; if (dmanr <= 3) { dma_outb( count & 0xff, ((dmanr&3)<<1) + 1 + IO_DMA1_BASE ); dma_outb( (count>>8) & 0xff, ((dmanr&3)<<1) + 1 + IO_DMA1_BASE ); } else { dma_outb( (count>>1) & 0xff, ((dmanr&3)<<2) + 2 + IO_DMA2_BASE ); dma_outb( (count>>9) & 0xff, ((dmanr&3)<<2) + 2 + IO_DMA2_BASE ); } } 函數get_dma_residue()獲取某個DMA通道上當前DMA傳輸事務的未傳輸剩余數據塊的大小(以字節計)。DMA通道的Count Register的值在當前DMA傳輸事務進行期間會不斷地自動將減小,直到當前DMA傳輸事務完成,Count Register的值減小為0。如下: static __inline__ int get_dma_residue(unsigned int dmanr) { unsigned int io_port = (dmanr<=3)? ((dmanr&3)<<1) + 1 + IO_DMA1_BASE : ((dmanr&3)<<2) + 2 + IO_DMA2_BASE; /* using short to get 16-bit wrap around */ unsigned short count; count = 1 + dma_inb(io_port); count += dma_inb(io_port) << 8; return (dmanr<=3)? count : (count<<1); } 3.3 對DMAC的保護 DMAC是一種全局的共享資源,為了保證設備驅動程序對它的獨占訪問,Linux在kernel/dma.c文件中定義了自旋鎖dma_spin_lock來保護它(實際上是保護DMAC的I/O端口資源)。任何想要訪問DMAC的設備驅動程序都首先必須先持有自旋鎖dma_spin_lock。如下: static __inline__ unsigned long claim_dma_lock(void) { unsigned long flags; spin_lock_irqsave(&dma_spin_lock, flags); /* 關中斷,加鎖*/ return flags; } static __inline__ void release_dma_lock(unsigned long flags) { spin_unlock_irqrestore(&dma_spin_lock, flags);/* 開中斷,開鎖*/ } 4 Linux對ISA DMA通道資源的管理 DMA通道是一種系統全局資源。任何ISA外設想要進行DMA傳輸,首先都必須取得某個DMA通道資源的使用權,並在傳輸結束後釋放所使用DMA通道資源。從這個角度看,DMA通道資源是一種共享的獨占型資源。 Linux在kernel/Dma.c文件中實現了對DMA通道資源的管理。 4.1 對DMA通道資源的描述 Linux在kernel/Dma.c文件中定義了數據結構dma_chan來描述DMA通道資源。該結構類型的定義如下: strUCt dma_chan { int lock; const char *device_id; }; 其中,如果成員lock!=0則表示DMA通道正被某個設備所使用;否則該DMA通道就處於free狀態。而成員device_id就指向使用該DMA通道的設備名字字符串。 基於上述結構類型dma_chan,Linux定義了全局數組dma_chan_busy[],以分別描述8個DMA通道資源各自的使用狀態。如下: static struct dma_chan dma_chan_busy[MAX_DMA_CHANNELS] = { { 0, 0 }, { 0, 0 }, { 0, 0 }, { 0, 0 }, { 1, "cascade" }, { 0, 0 }, { 0, 0 }, { 0, 0 } }; 顯然,在初始狀態時除了DMA通道4外,其余DMA通道皆處於free狀態。 4.2 DMA通道資源的申請 任何ISA卡在使用某個DMA通道進行DMA傳輸之前,其設備驅動程序都必須向內核提出DMA通道資源的申請。只有申請獲得成功後才能使用相應的DMA通道。否則就會發生資源沖突。 函數request_dma()實現DMA通道資源的申請。其源碼如下: int request_dma(unsigned int dmanr, const char * device_id) { if (dmanr >= MAX_DMA_CHANNELS) return -EINVAL; if (xchg(&dma_chan_busy[dmanr].lock, 1) != 0) return -EBUSY; dma_chan_busy[dmanr].device_id = device_id; /* old flag was 0, now contains 1 to indicate busy */ return 0; } 上述函數的核心實現就是用原子操作xchg()讓成員變量dma_chan_busy[dmanr].lock和值1進行交換操作,xchg()將返回lock成員在交換操作之前的值。因此:如果xchg()返回非0值,這說明dmanr所指定的DMA通道已被其他設備所占用,所以request_dma()函數返回錯誤值-EBUSY表示指定DMA通道正忙;否則,如果xchg()返回0值,說明dmanr所指定的DMA通道正處於free狀態,於是xchg()將其lock成員設置為1,取得資源的使用權。 4.3 釋放DMA通道資源 DMA傳輸事務完成後,設備驅動程序一定要記得釋放所占用的DMA通道資源。否則別的外設將一直無法使用該DMA通道。 函數free_dma()釋放指定的DMA通道資源。如下: void free_dma(unsigned int dmanr) { if (dmanr >= MAX_DMA_CHANNELS) { printk("Trying to free DMA%d ", dmanr); return; } if (xchg(&dma_chan_busy[dmanr].lock, 0) == 0) { printk("Trying to free free DMA%d ", dmanr); return; } } /* free_dma */ 顯然,上述函數的核心實現就是用原子操作xchg()將lock成員清零。 4.4 對/proc/dma文件的實現 文件/proc/dma將列出當前8個DMA通道的使用狀況。Linux在kernel/Dma.c文件中實現了函數個get_dma_list()函數來至此/proc/dma文件的實現。函數get_dma_list()的實現比較簡單。主要就是遍歷數組dma_chan_busy[],並將那些lock成員為非零值的數組元素輸出到列表中即可。如下: int get_dma_list(char *buf) { int i, len = 0; for (i = 0 ; i < MAX_DMA_CHANNELS ; i++) { if (dma_chan_busy[i].lock) { len += sprintf(buf+len, "%2d: %s ", i, dma_chan_busy[i].device_id); } } return len; } /* get_dma_list */ 5 使用DMA的ISA設備驅動程序 DMA雖然是一種硬件機制,但它離不開軟件(尤其是設備驅動程序)的配合。任何使用DMA進行數據傳輸的ISA設備驅動程序都必須遵循一定的框架。 5.1 DMA通道資源的申請與釋放 同I/O端口資源類似,設備驅動程序必須在一開始就調用request_dma()函數來向內核申請DMA通道資源的使用權。而且,最好在設備驅動程序的open()方法中完成這個操作,而不是在模塊的初始化例程中調用這個函數。因為這在一定程度上可以讓多個設備共享DMA通道資源(只要多個設備不同時使用一個DMA通道)。這種共享有點類似於進程對CPU的分時共享:-) 設備使用完DMA通道後,其驅動程序應該記得調用free_dma()函數來釋放所占用的DMA通道資源。通常,最好再驅動程序的release()方法中調用該函數,而不是在模塊的卸載例程中進行調用。 還需要注意的一個問題是:資源的申請順序。為了避免死鎖(deadlock),驅動程序一定要在申請了中斷號資源後才申請DMA通道資源。釋放時則要先釋放DMA通道,然後再釋放中斷號資源。 使用DMA的ISA設備驅動程序的open()方法的如下: int xxx_open(struct inode * inode, struct file * filp) { ┆ if((err = request_irq(irq,xxx_ISR,SA_INTERRUPT,”YourDeviceName”,NULL)) return err; if((err = request_dma(dmanr, “YourDeviceName”)){ free_irq(irq, NULL); return err; } ┆ return 0; } release()方法的范例代碼如下: void xxx_release(struct inode * inode, struct file * filp) { ┆ free_dma(dmanr); free_irq(irq,NULL); ┆ } 5.2 申請DMA緩沖區 由於8237 DMAC只能尋址系統RAM中低16MB物理內存,因此:ISA設備驅動程序在申請DMA緩沖區時,一定要以GFP_DMA標志來調用kmalloc()函數或get_free_pages()函數,以便在系統內存的DMA區中分配物理內存。 5.3 編程DMAC 設備驅動程序可以在他的read()方法、write()方法或ISR中對DMAC進行編程,以便准備啟動一個DMA傳輸事務。一個DMA傳輸事務有兩種典型的過程:(1)用戶請求設備進行DMA傳輸;(2)硬件異步地將外部數據寫道系統中。 用戶通過I/O請求觸發設備進行DMA傳輸的步驟如下: 1.用戶進程通過系統調用read()/write()來調用設備驅動程序的read()方法或write()方法,然後由設備驅動程序read/write方法負責申請DMA緩沖區,對DMAC進行編程,以准備啟動一個DMA傳輸事務,最後正確地設置設備(setup device),並將用戶進程投入睡眠。 2.DMAC負責在DMA緩沖區和I/O外設之間進行數據傳輸,並在結束後觸發一個中斷。 3.設備的ISR檢查DMA傳輸事務是否成功地結束,並將數據從DMA緩沖區中拷貝到驅動程序的其他內核緩沖區中(對於I/O device to memory的情況)。然後喚醒睡眠的用戶進程。 硬件異步地將外部數據寫到系統中的步驟如下: 1.外設觸發一個中斷通知系統有新數據到達。 2.ISR申請一個DMA緩沖區,並對DMAC進行編程,以准備啟動一個DMA傳輸事務,最後正確地設置好外設。 3.硬件將外部數據寫到DMA緩沖區中,DMA傳輸事務結束後,觸發一個中斷。 4. ISR檢查DMA傳輸事務是否成功地結束,然後將DMA緩沖區中的數據拷貝驅動程序的其他內核緩沖區中,最後喚醒相關的等待進程。 網卡就是上述過程的一個典型例子。 為准備一個DMA傳輸事務而對DMAC進行編程的典型代碼段如下: unsigned long flags; flags = claim_dma_lock(); disable_dma(dmanr); clear_dma_ff(dmanr); set_dma_mode(dmanr,mode); set_dma_addr(dmanr, virt_to_bus(buf)); set_dma_count(dmanr, count); enable_dma(dmanr); release_dma_lock(flags); 檢查一個DMA傳輸事務是否成功地結束的代碼段如下: int residue; unsigned long flags = claim_dma_lock(); residue = get_dma_residue(dmanr); release_dma_lock(flags); ASSERT(residue == 0); 注:本節大部分內容來自於ldd2。