之前我們深入了解了glibc malloc的運行機制(文章鏈接請看文末▼),下面就讓我們開始真正的堆溢出漏洞利用學習吧。說實話,寫這類文章,我是比較慫的,因為我當前從事的工作跟漏洞挖掘完全無關,學習這部分知識也純粹是個人愛好,於周末無聊時打發下時間,甚至我最初的目標也僅僅是能快速看懂、復現各種漏洞利用POC而已…鑒於此,後續的文章大致會由兩種內容構成:1)各種相關文章的總結,再提煉;2)某些好文章的翻譯及拓展。
首先,存在漏洞的程序如下:
在代碼[3]中存在一個堆溢出漏洞:如果用戶輸入的argv[1]的大小比first變量的666字節更大的話,那麼輸入的數據就有可能覆蓋掉下一個chunk的chunk header——這可以導致任意代碼執行。而攻擊的核心思路就是利用glibc malloc的unlink機制。
上述程序的內存圖如下所示:
unlink攻擊技術就是利用”glibc malloc”的內存回收機制,將上圖中的second chunk給unlink掉,並且,在unlink的過程中使用shellcode地址覆蓋掉free函數(或其他函數也行)的GOT表項。這樣當程序後續調用free函數的時候(如上面代碼[5]),就轉而執行我們的shellcode了。顯然,核心就是理解glibc malloc的free機制。
在正常情況下,free的執行流程如下文所述:
PS: 鑒於篇幅,這裡主要介紹非mmaped的chunks的回收機制,回想一下在哪些情況下使用mmap分配新的chunk,哪些情況下不用mmap?
一旦涉及到free內存,那麼就意味著有新的chunk由allocated狀態變成了free狀態,此時glibc malloc就需要進行合並操作——向前以及(或)向後合並。這裡所謂向前向後的概念如下:將previous free chunk合並到當前free chunk,叫做向後合並;將後面的free chunk合並到當前free chunk,叫做向前合並。
一、向後合並:
相關代碼如下:
首先檢測前一個chunk是否為free,這可以通過檢測當前free chunk的PREV_INUSE(P)比特位知曉。在本例中,當前chunk(first chunk)的前一個chunk是allocated的,因為在默認情況下,堆內存中的第一個chunk總是被設置為allocated的,即使它根本就不存在。
如果為free的話,那麼就進行向後合並:
1)將前一個chunk占用的內存合並到當前chunk;
2)修改指向當前chunk的指針,改為指向前一個chunk。
3)使用unlink宏,將前一個free chunk從雙向循環鏈表中移除(這裡最好自己畫圖理解,學過數據結構的應該都沒問題)。
在本例中由於前一個chunk是allocated的,所以並不會進行向後合並操作。
二、向前合並操作:
首先檢測next chunk是否為free。那麼如何檢測呢?很簡單,查詢next chunk之後的chunk的PREV_INUSE (P)即可。相關代碼如下:
整個操作與”向後合並“操作類似,再通過上述代碼結合注釋應該很容易理解free chunk的向前結合操作。在本例中當前chunk為first,它的下一個chunk為second,再下一個chunk為top chunk,此時top chunk的PREV_INUSE位是設置為1的(表示top chunk的前一個chunk,即second chunk,已經使用),因此first的下一個chunk不會被“向前合並“掉。
介紹完向前、向後合並操作,下面就需要了解合並後(或因為不滿足合並條件而沒合並)的chunk該如何進一步處理了。在glibc malloc中,會將合並後的chunk放到unsorted bin中(還記得unsorted bin的含義麼?)。相關代碼如下:
上述代碼完成的整個過程簡要概括如下:將當前chunk插入到unsorted bin的第一個chunk(第一個chunk是鏈表的頭結點,為空)與第二個chunk之間(真正意義上的第一個可用chunk);然後通過設置自己的size字段將前一個chunk標記為已使用;再更改後一個chunk的prev_size字段,將其設置為當前chunk的size。
注意:上一段中描述的”前一個“與”後一個“chunk,是指的由chunk的prev_size與size字段隱式連接的chunk,即它們在內存中是連續、相鄰的!而不是通過chunk中的fd與bk字段組成的bin(雙向鏈表)中的前一個與後一個chunk,切記!。
在本例中,只是將first chunk添加到unsorted bin中。
現在我們再來分析如果一個攻擊者在代碼[3]中精心構造輸入數據並通過strcpy覆蓋了second chunk的chunk header後會發生什麼情況。
假設被覆蓋後的chunk header相關數據如下:
1) prev_size =一個偶數,這樣其PREV_INUSE位就是0了,即表示前一個chunk為free。
2) size = -4
3) fd = free函數的got表地址address – 12;(後文統一簡稱為“free addr – 12”)
4) bk = shellcode的地址
那麼當程序在[4]處調用free(first)後會發生什麼呢?我們一步一步分析。
一、向後合並
鑒於first的前一個chunk非free的,所以不會發生向後合並操作。
二、向前合並
先判斷後一個chunk是否為free,前文已經介紹過,glibc malloc通過如下代碼判斷:
PS:在本例中next chunk即second chunk,為了便於理解後文統一用next chunk。
從上面代碼可以知道,它是通過將nextchunk + nextsize計算得到指向下下一個chunk的指針,然後判斷下下個chunk的size的PREV_INUSE標記位。在本例中,此時nextsize被我們設置為了-4,這樣glibc malloc就會將next chunk的prev_size字段看做是next-next chunk的size字段,而我們已經將next chunk的prev_size字段設置為了一個偶數,因此此時通過inuse_bit_at_offset宏獲取到的nextinuse為0,即next chunk為free!既然next chunk為free,那麼就需要進行向前合並,所以就會調用unlink(nextchunk, bck, fwd);函數。真正的重點就是這個unlink函數!
在前文2.1節中已經介紹過unlink函數的實現,這裡為了便於說明攻擊思路和過程,再詳細分析一遍,unlink代碼如下:
此時P = nextchunk, BK = bck, FD = fwd。
1)首先FD = nextchunk->fd = free地址– 12;
2)然後BK = nextchunk->bk = shellcode起始地址;
3)再將BK賦值給FD->bk,即(free地址– 12)->bk = shellcode起始地址;
4)最後將FD賦值給BK->fd,即(shellcode起始地址)->fd = free地址– 12。
前面兩步還好理解,主要是後面2步比較迷惑。我們作圖理解:
結合上圖就很好理解第3,4步了。細心的朋友已經注意到,free addr -12和shellcode addr對應的prev_size等字段是用虛線標記的,為什麼呢?因為事實上它們對應的內存並不是chunk header,只是在我們的攻擊中需要讓glibc malloc在進行unlink操作的時候將它們強制看作malloc_chunk結構體。這樣就很好理解為什麼要用free addr – 12替換next chunk的fd了,因為(free addr -12)->bk剛好就是free addr,也就是說第3步操作的結果就是將free addr處的數據替換為shellcode的起始地址。
由於已經將free addr處的數據替換為了shellcode的起始地址,所以當程序在代碼[5]處再次執行free的時候,就會轉而執行shellcode了。
至此,整個unlink攻擊的原理已經介紹完畢,剩下的工作就是根據上述原理,編寫shellcode了。只不過這裡需要注意一點,glibc malloc在unlink的過程中會將shellcode + 8位置的4字節數據替換為free addr – 12,所以我們編寫的shellcode應該跳過前面的12字節。
當前,上述unlink技術已經過時了(但不代表所有的unlink技術都失效,詳情見後文),因為glibc malloc對相應的安全機制進行了加強,具體而言,就是添加了如下幾條安全檢測機制。
該機制不允許釋放一個已經處於free狀態的chunk。因此,當攻擊者將second chunk的size設置為-4的時候,就意味著該size的PREV_INUSE位為0,也就是說second chunk之前的first chunk(我們需要free的chunk)已經處於free狀態,那麼這時候再free(first)的話,就會報出double free錯誤。相關代碼如下:
該機制檢測next size是否在8到當前arena的整個系統內存大小之間。因此當檢測到next size為-4的時候,就會報出invalid next size錯誤。相關代碼如下:
該機制會在執行unlink操作的時候檢測鏈表中前一個chunk的fd與後一個chunk的bk是否都指向當前需要unlink的chunk。這樣攻擊者就無法替換second chunk的fd與fd了。相關代碼如下:
經過上述3層安全檢測,是否意味著所有unlink技術都失效了呢?答案是否定的,因為進行漏洞攻擊的人腦洞永遠比天大!之前剛好看到一篇AndroidHeapUnlinkExploitPractice/" target="_blank">好文(強烈推薦),主講在Android4.4上利用unlink機制實現堆溢出攻擊。眾所周知,Android內核基於linux,且其堆內存管理也是使用的glibc malloc,雖然在一些細節上有些許不同,但核心原理類似。該文介紹的攻擊方式就成功繞過了上述三層檢測。
本文詳細介紹了unlink攻擊技術的核心原理,雖然上述介紹的unlink漏洞利用技術已經失效,而其他的unlink技術難度也越來越大,但是我們還是有必要認真學習,因為它一方面可以進一步加深我們對glibc malloc的堆棧管理機制的理解,另一方面也為後續的各種堆溢出攻擊技術提供了思路。
從上文的分析可以看出,unlink主要還是利用的glibc malloc中隱式鏈表機制,通過覆蓋相鄰chunk的數據實現攻擊,那麼我們能不能在顯示鏈表中也找到攻擊點呢?請關注下一篇文章:基於fastbin的堆溢出漏洞利用介紹。