幾個星期前去面試C++研發的實習崗位,面試官問了個問題:
new與malloc有什麼區別?
這是個老生常談的問題。當時我回答new從自由存儲區上分配內存,malloc從堆上分配內存;new/delete會調用構造函數/析構函數對對象進行初始化與銷毀;operator new/delete可以進行重載;然後強行分析了一下自由存儲區與堆的區別。回來後感覺這個問題其實回答得不怎麼好,因為關於new與malloc的區別實際上很多。面試期間剛好是剛期末考完,之後是幾個課設沒時間去整理。今天花了點時間整理下這個問題。
new操作符從自由存儲區(free store)上為對象動態分配內存空間,而malloc函數從堆上動態分配內存。自由存儲區是C++基於new操作符的一個抽象概念,凡是通過new操作符進行內存申請,該內存即為自由存儲區。而堆是操作系統中的術語,是操作系統所維護的一塊特殊內存,用於程序的內存動態分配,C語言使用malloc從堆上分配內存,使用free釋放已分配的對應內存。
那麼自由存儲區是否能夠是堆(問題等價於new是否能在堆上動態分配內存),這取決於operator new 的實現細節。自由存儲區不僅可以是堆,還可以是靜態存儲區,這都看operator new在哪裡為對象分配內存。
特別的,new甚至可以不為對象分配內存!定位new的功能可以辦到這一點:
new (place_address) type
place_address為一個指針,代表一塊內存的地址。當使用上面這種僅以一個地址調用new操作符時,new操作符調用特殊的operator new,也就是下面這個版本:
void * operatornew (size_t,void *) //不允許重定義這個版本的operator new
這個operator new不分配任何的內存,它只是簡單地返回指針實參,然後右new表達式負責在place_address指定的地址進行對象的初始化工作。
new操作符內存分配成功時,返回的是對象類型的指針,類型嚴格與對象匹配,無須進行類型轉換,故new是符合類型安全性的操作符。而malloc內存分配成功則是返回void * ,需要通過強制類型轉換將void*指針轉換成我們需要的類型。
類型安全很大程度上可以等價於內存安全,類型安全的代碼不會試圖方法自己沒被授權的內存區域。關於C++的類型安全性可說的又有很多了。
new內存分配失敗時,會拋出bac_alloc異常,它不會返回NULL;malloc分配內存失敗時返回NULL。
在使用C語言時,我們習慣在malloc分配內存後判斷分配是否成功:
int *a = (int *)malloc ( sizeof (int ));
if(NULL == a)
{
...
}
else
{
...
}
從C語言走入C++陣營的新手可能會把這個習慣帶入C++:
int * a = new int();
if(NULL == a)
{
...
}
else
{
...
}
實際上這樣做一點意義也沒有,因為new根本不會返回NULL,而且程序能夠執行到if語句已經說明內存分配成功了,如果失敗早就拋異常了。正確的做法應該是使用異常機制:
try
{
int *a = new int();
}
catch (bad_alloc)
{
...
}
如果你想順便了解下異常基礎,可以看 http://www.linuxidc.com/Linux/2016-01/127589.htm C++ 異常機制分析。
使用new操作符申請內存分配時無須指定內存塊的大小,編譯器會根據類型信息自行計算,而malloc則需要顯式地指出所需內存的尺寸。
class A{...}
A * ptr = new A;
A * ptr = (A *)malloc(sizeof(A)); //需要顯式指定所需內存大小sizeof(A);
當然了,我這裡使用malloc來為我們自定義類型分配內存是不怎麼合適的,請看下一條。
使用new操作符來分配對象內存時會經歷三個步驟:
使用delete操作符來釋放對象內存時會經歷兩個步驟:
總之來說,new/delete會調用對象的構造函數/析構函數以完成對象的構造/析構。而malloc則不會。如果你不嫌啰嗦可以看下我的例子:
class A
{
public:
A() :a(1), b(1.11){}
private:
int a;
double b;
};
int main()
{
A * ptr = (A*)malloc(sizeof(A));
return 0;
}
在return處設置斷點,觀看ptr所指內存的內容:
可以看出A的默認構造函數並沒有被調用,因為數據成員a,b的值並沒有得到初始化,這也是上面我為什麼說使用malloc/free來處理C++的自定義類型不合適,其實不止自定義類型,標准庫中凡是需要構造/析構的類型通通不合適。
而使用new來分配對象時:
int main()
{
A * ptr = new A;
}
查看程序生成的匯編代碼可以發現,A的默認構造函數被調用了:
C++提供了new[]與delete[]來專門處理數組類型:
A * ptr = new A[10];//分配10個A對象
使用new[]分配的內存必須使用delete[]進行釋放:
delete [] ptr;
new對數組的支持體現在它會分別調用構造函數函數初始化每一個數組元素,釋放對象時為每個對象調用析構函數。注意delete[]要與new[]配套使用,不然會找出數組對象部分釋放的現象,造成內存洩漏。
至於malloc,它並知道你在這塊內存上要放的數組還是啥別的東西,反正它就給你一塊原始的內存,在給你個內存的地址就完事。所以如果要動態分配一個數組的內存,還需要我們手動自定數組的大小:
int * ptr = (int *) malloc( sizeof(int) );//分配一個10個int元素的數組
operator new /operator delete的實現可以基於malloc,而malloc的實現不可以去調用new。下面是編寫operator new /operator delete 的一種簡單方式,其他版本也與之類似:
void * operatornew (sieze_t size)
{
if(void * mem = malloc(size)
return mem;
else
throw bad_alloc();
}
voidoperatordelete(void *mem) noexcept{
free(mem);
}
opeartor new /operator delete可以被重載。標准庫是定義了operator new函數和operator delete函數的8個重載版本:
//這些版本可能拋出異常
void * operatornew(size_t);
void * operator new[](size_t);
void * operatordelete (void * )noexcept;
void * operator delete[](void *0)noexcept;
//這些版本承諾不拋出異常
void * operatornew(size_t ,nothrow_t&) noexcept;
void * operator new[](size_t, nothrow_t& );
void * operatordelete (void *,nothrow_t& )noexcept;
void * operator delete[](void *0,nothrow_t& )noexcept;
我們可以自定義上面函數版本中的任意一個,前提是自定義版本必須位於全局作用域或者類作用域中。太細節的東西不在這裡講述,總之,我們知道我們有足夠的自由去重載operator new /operator delete ,以決定我們的new與delete如何為對象分配內存,如何回收對象。
而malloc/free並不允許重載。
使用malloc分配的內存後,如果在使用過程中發現內存不足,可以使用realloc函數進行內存重新分配實現內存的擴充。realloc先判斷當前的指針所指內存是否有足夠的連續空間,如果有,原地擴大可分配的內存地址,並且返回原來的地址指針;如果空間不夠,先按照新指定的大小分配空間,將原有數據從頭到尾拷貝到新分配的內存區域,而後釋放原來的內存區域。
new沒有這樣直觀的配套設施來擴充內存。
在operator new拋出異常以反映一個未獲得滿足的需求之前,它會先調用一個用戶指定的錯誤處理函數,這就是new-handler。new_handler是一個指針類型:
namespace std
{
typedefvoid (*new_handler)();
}
指向了一個沒有參數沒有返回值的函數,即為錯誤處理函數。為了指定錯誤處理函數,客戶需要調用set_new_handler,這是一個聲明於的一個標准庫函數:
namespace std
{
new_handler set_new_handler(new_handler p ) throw();
}
set_new_handler的參數為new_handler指針,指向了operator new 無法分配足夠內存時該調用的函數。其返回值也是個指針,指向set_new_handler被調用前正在執行(但馬上就要發生替換)的那個new_handler函數。
對於malloc,客戶並不能夠去編程決定內存不足以分配時要干什麼事,只能看著malloc返回NULL。
將上面所述的10點差別整理成表格:
malloc給你的就好像一塊原始的土地,你要種什麼需要自己在土地上來播種
而new幫你劃好了田地的分塊(數組),幫你播了種(構造函數),還提供其他的設施給你使用:
當然,malloc並不是說比不上new,它們各自有適用的地方。在C++這種偏重OOP的語言,使用new/delete自然是更合適的。