假定機器內存為512M, 從3G開始,到3G + 512M 為連續固定影射區。zone_dma, zone_normal為這個區域的。固定影射的VADDR可以直接使用(get a free page, then use pfn_to_virt()等宏定義轉換得到vaddr)或用kmalloc等分配. 這樣的vaddr的物理頁是連續的。得到的地址也一定在固定影射區域內。
如果內存緊張,連續區域無法滿足,調用vmalloc分配是必須的,因為它可以將物理不連續的空間組合後分配,所以更能滿足分配要求。
但vmalloc分配的vaddr一定不能與固定影射區域的vaddr重合。因為vaddr到物理頁的影射同時只能唯一。所以vmalloc得到的vaddr要在3G + 512m 以上才可以。也就是從VMALLOC_START開始分配。 VMALLOC_START比連續固定影射區大最大vaddr地址還多8-16M(2*VMALLOC_OFFSET)--有個鬼公式在
#define VMALLOC_OFFSET 8*1024 #define VMALLOC_START (high_memory - 2*VMALLOC_OFFSET) & ~(VMALLOC_OFFSET-1)
high_memory 就是固定影射區域最高處。
空開8-16M做什麼? 為了捕獲越界的mm_fault. 同樣,vmalloc每次得到的VADDR空間中間要留一個PAGE的空(空洞),目的和上面的空開一樣。你vmalloc(100)2次,得到的2個地址中間相距8K。 如果連續分配無空洞,那麼比如 p1=vmalloc(4096); p2=vmalloc(4096); 如果p1使用越界到p2中了,也不會mm_falut. 那不容易debug.
下面說明VMALLOC_RESERVE和896M的問題。
上面假設機器物理512M的case. 如果機器有1G物理內存如何是好?那vmalloc()的vaddr是不是要在3G + 1G + 8M 空洞以上分配?超過尋址空間了嗎。 這時,4G 下面保留的VMALLOC_RESERVER 128m 就派上用場了。 也就是說如果物理內存超過896M, high_memory也只能在3G + 896地方。可尋址空間最高處要保留VMALLOC_RESREVER 128M給vmalloc用。
所以這128M的VADDR空間是為了vmalloc在物理超過了896M時候使用。如果物理僅僅有512M, 一般使用不到。因為VMALLOC_START很低了。如果vmalloc太多了才會用到。
high_memory在arch/i386/kernel, mm的初始化中設置。根據物理內存大小和VMALLOC_RESERVE得到數值.
所以說那128M僅僅是為了影射1G以上的物理內存的不對的。如果物理內存2G,1G以下的vmalloc也用那空間影射。
看vmalloc分配的東西可以用
CODE:[Copy to clipboard]show_vmalloc() { struct vm_struct **p, *tmp;
for(p = &vmlist; (tmp = *p); p = &tmp->next) { printk("%p %p %d\n", tmp, tmp->addr, tmp->size
} }
糾正一下: 2.4.21內核 i386 平台上的定義: #define VMALLOC_OFFSET (8*1024*1024) #define VMALLOC_START (((unsigned long) high_memory + 2*VMALLOC_OFFSET-1) & \ ~(VMALLOC_OFFSET-1)) #define VMALLOC_VMADDR(x) ((unsigned long)(x)) #if CONFIG_HIGHMEM # define VMALLOC_END (PKMAP_BASE-2*PAGE_SIZE) #else # define VMALLOC_END (FIXADDR_START-2*PAGE_SIZE) #endif
2.6.9內核 i386 平台上的定義: #define VMALLOC_OFFSET (8*1024*1024) #define VMALLOC_START (((unsigned long) high_memory + vmalloc_earlyreserve + \ 2*VMALLOC_OFFSET-1) & ~(VMALLOC_OFFSET-1)) #ifdef CONFIG_HIGHMEM # define VMALLOC_END (PKMAP_BASE-2*PAGE_SIZE) #else # define VMALLOC_END (FIXADDR_START-2*PAGE_SIZE) #endif
可以看一下ULK 2nd(中文版) 的圖7-7。 英文版就是 Figure 7-7 了 2.6內核的對應 ULK 3rd 的Figure 8-7
摘自:http://www.linuxforum.net