某些Intel的FLASH芯片(如StrataFlash系列)支持多分區,也就是各個分區可以同時進行操作。應該說這是不錯的特性,但是也會帶來些問題。記得當初移植Linux-2.4.21,掛JFFS2文件系統的時候,經常會報一些"Magic bitmask not found"之類的錯誤,跟進去發現FLASH讀出來的都是些0x80之類的數據,查看資料發現該款FLASH有分區的特性,而Linux的FLASH驅動只用一個狀態變量表示整個FLASH的狀態,這就會造成某個分區的實際狀態和系統記錄的不符,從而導致讀FLASH的時候該點實際上不處在讀狀態。當時的解決辦法是,每次讀的時候,不管記錄的狀態是什麼,先進入讀狀態再說,當然這會帶來性能的下降,具體損失多少個時鐘周期就不算了。
話說進入Linux-2.6.x的時代(具體是2.6.13),除了Lock/Unlock(Linux在擦/寫的時候不先Unlock,解決辦法就是初始化的時候先全部Unlock)這個老問題外,竟然多分區的錯誤沒有出現,驚訝之下決定好好研究下Linux的MTD/FLASH驅動。
說驅動之前,先明確幾個編程要點:
1:讀寫,要按照總線位寬讀寫,注意不是FLASH芯片位寬(例如背靠背)。
2:尋址,程序要訪問的地址和FLASH芯片地址引腳得到的值是不一樣的,例如16位的FLASH芯片,對於CPU,0x00和0x01表示2個不同的字節,但是到了FLASH引腳得到的都是0,也就是都指向FLASH的第一個Word。可以認為地址總線的bit0懸空,或者認為轉換總線, bit0上實際輸出的是bit1。這個解釋了要點1。
3:芯片手冊提到偏移量都是基於WORD的,而WORD的位寬取決於芯片的位寬,因此在下命令的時候,實際偏移=手冊偏移*buswidth/8。
4:芯片手冊提到的變量長度(典型如CFI信息)例如2,指的是,變量是個16bit數,但是讀的時候,要讀2個WORD,然後把每個WORD的低8位拼成1個16bit數。讀WORD再拼湊確實挺麻煩,尤其是讀取大結構的時候,不過參照cfi_util.c的cfi_read_pri函數的做法就簡單了。
5:背靠背,也就是比方說2塊16位的芯片一起接在32位的總線上。帶來的就是尋址的問題,很顯然,首先要按32位讀寫;其次就是下命令的地址,實際偏移=手冊偏移*interleave*device_type/8,device_type=buswidth/interleave,而buswidth這個時候是32(總線位寬)。另外就是背靠背的時候,命令和返回的狀態碼是“雙份的”,例如2塊16位背靠背,讀命令是0x00ff00ff。
如果不是想寫像Linux那麼靈活的代碼(考慮各種接法/位寬/CFI獲取信息等),那事情就簡單很多,只要考慮要點1以及擦除塊的大小就好了,當然如果是背靠背接法,擦除塊的實際大小要乘個interleave。
進入Linux代碼
關於CHIP/MAP/MTD之間繞來繞去的關系現在還糊塗著呢,因此下面只是簡單的跟一下脈絡和各個編程要點。
1:構造map_info結構,指定基址/位寬/大小等信息以及"cfi_probe"限定,然後調用do_map_probe()。
2:do_map_probe()根據名字"cfi_probe"找到芯片驅動"cfi_probe.c"直接調用cfi_probe()。
3:cfi_probe()直接調用mtd_do_chip_probe(),傳入cfi_probe_chip()函數指針。
4:mtd_do_chip_probe()分2步,先調用genprobe_ident_chips()探測芯片信息,後調用check_cmd_set()獲取和初始化芯片命令集(多分區初始化就在裡面)。
5:genprobe_ident_chips()函數如果不考慮多芯片串連的情況,那只需看前面的genprobe_new_chip()調用,完成後cfi.chipshift=cfi.cfiq->DevSize,2^chipshift=FLASH大小。
6:genprobe_new_chip()枚舉各種不同的芯片位寬和背靠背數量,結合配置設定依次調用步驟3的cfi_probe_chip(),注意cfi->device_type=bankwidth/nr_chips,bankwidth是總線位寬,device_type是芯片位寬。這裡我們只需要注意有限復雜情況即可,所謂有限復雜指的是編譯時確定的復雜連接。這樣,cfi_probe_chip()只有第1次調用才成功,如果考慮32位寬的FLASH插在16bit總線上的情況,那第2次調用成功。
7:cfi_probe_chip(),由於步驟6的原因,函數就在cfi_chip_setup()直接返回,後面的代碼就不用考慮了。
8:cfi_chip_setup()讀取CFI信息,可以留意下Linux是怎麼實現要點4的。
9:回到步驟4的check_cmd_set()階段,進入cfi_cmdset_0001()函數,先調用read_pri_intelext()讀取Intel的擴展信息,然後調用cfi_intelext_setup()初始化自身結構。
10:read_pri_intelext()函數,可以留意下怎麼讀取變長結構的技巧,也就是"need_more"的用法。這裡說明下一些變量的含義,例如對於StrataFlash 128Mb Bottom類型的的FLASH芯片,塊結構是4*32KB+127*128KB=16MB,一共16個分區,每個分區1MB。nb_parts=2。
第1部分
NumIdentPartitions=1 // 有1個重復的分區
NumBlockTypes=2 // 分區內有2種不同的Block類型
第1類型
NumIdentBlocks=3 // 有4個Block(3+1)
BlockSize=0x80 // 32KB(0x80*256)
第2類型
NumIdentBlocks=6 // 有7個Block(6+1)
BlockSize=0x200 // 128KB(0x200*256)
第2部分
NumIdentPartitions=15// 有15個重復的分區
NumBlockTypes=1 // 分區內有1種Block類型
第1類型
NumIdentBlocks=7 // 有8個Block(7+1)
BlockSize=0x200 // 128KB(0x200*256)
11:cfi_intelext_setup()函數首先根據CFI建立mtd_erase_region_info信息,然後調用cfi_intelext_partition_fixup()來支持分區。
12:cfi_intelext_partition_fixup()用來建立虛擬Chip,每個分區對應1個Chip,不過並沒有完全根據CFI擴展信息來建立,而是假定每個分區的大小都一致。cfi->chipshift調整為partshift,各個虛擬chip->start調整為各分區的基址。將來訪問FLASH的入口函數cfi_varsize_frob()就根據ofs得到chipnum(chipnum=ofs>>cfi->chipshift),這也是為什麼要假定分區一致的原因。