從誕生至今,20多年過去,Java至今仍是使用最為廣泛的語言。這仰賴於Java提供的各種技術和特性,讓開發人員能優雅的編寫高效的程序。今天我們就來說說Java的一項基本但非常重要的技術內存管理
了解C語言的同學都知道,在C語言中內存的開辟和釋放都是由我們自己來管理的,每一個new操作都要對於一個delete操作,否則就會參數內存洩漏和溢出的問題,導致非常槽糕的後果。但在Java開發過程中,則完全不需要擔心這個問題。因為jvm提供了自動內存管理的機制。內存管理的工作由jvm幫我們完成。這樣我們就不用為了釋放內存而頭疼了。
雖然jvm幫我們做了內存管理的工作,但是我們仍需要了解jvm到底做了什麼,下面我們就一起去看一看
jvm啟動時進行一系列的工作,其中一項就是開辟一塊運行時內存。而這一塊內存中又分為了五大區域,分別用於不同的功能。
程序計數器
記錄程序運行的下一條指令的地址,這裡的“地址”可以是一個本地指針,也可以是在方法字節碼中相對於該方法起始指令的偏移量。如果該線程正在執行一個本地方法,那麼此時程序計數器的值為”undefined”.在多線程環境下,每一個線程都有自己的程序計數器,在jvm調度線程時,會把當前的線程的程序計數器保存到快照,以便下次線程獲取執行時間時獲取
VM Stack
虛擬機棧是Java方法執行的內存模型,每個方法執行的時候,會在棧中創建一幀用於存儲局部變量表、操作數棧、動態鏈接、方法出口。方法開始調用時,會創建棧幀並入棧,方法執行結束時會出棧。每個線程都有自己的棧。
動態鏈接:
方法出口:
可以通過 -xxs 大小 來配置棧的大小,當嵌套調用使用不當,會導致方法不停的入棧,最終導致棧空間被占滿產生 StackOverflowError
本地方法棧
Heap
堆是用於存放對象實例的地方,幾乎所有對象實例在堆中分配。堆是線程共享的,這是多線程時同步機制的原因。
堆是GC管理的主要區域,GC在對堆進行回收前,首先要確定對象是否已死(不可能再被使用的對象)
判斷對象是否存活的算法有兩種:引用計數算法、可達性分析算法
引用計數算法是為每一個對象添加一個引用計數器,每當有一個引用指向它時,計數器就加一,任何時刻計數器為0的對象就不可能再被使用。這種算法實現簡單,但是它很難解決對象循環引用的問題(何為循環引用見下方備注)
可達性分析算法是Java語言正在使用的算法。它的基本思想是通過一系統被稱為“GC Root”的對象為起點,從這個起點向下搜索,搜索走過的路徑稱為引用鏈,當一個對象不再任何引用鏈上時,則說明這個對象是不可能再被使用的。
在Java語言中,GC Root包括以下幾種對象:
可以看出分析對象是否存活,都與引用有關。在JDK1.2之後,Java對引用的概念進行了擴充,將引用分為 強引用(Strong Reference)、軟引用(Soft Reference)、弱引用(Weak Reference)、虛引用(Phantom Reference)
強引用即為原來意義上的引用,只要強引用存在,被引用的對象就不會被回收
SoftReference類表示軟引用,對於被軟引用關聯的對象,在系統將要發生內存溢出時,會把這些對象列入回收范圍後,進行二次回收
WeakReference類表示弱引用,對於被弱引用關聯的對象,只能生存到下一次垃圾回收發生之前
PhantomReference類表示虛引用,虛引用不對關聯的對象的生存時間構成影響,也無法取得對象實例,它唯一的作用是在對象被GC回收是收到一條系統通知
堆得大小可以通過-Xmx和-Xms來控制。對於主流的Jvm,GC基本都采用分代收集的算法。基於這個算法, Java堆又分為新生代(Young Generation)和老年代(Old Generation),新生代又被進一步劃分為Eden和Survivor區,最後Survivor由FromSpace和ToSpace組成。新建的對象都是用新生代分配內存,Eden空間不足的時候,會把存活的對象轉移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例。老生代用於存放新生代中經過多次垃圾回收(也即Minor GC)仍然存活的對象。
永生代(Permanent Space)為方法區
方法區
方法區也為所以線程所共享,用於存放已加載的類信息、靜態變量、常量和即時編譯器編譯後的代碼。-XX:MaxPermSize用於設置方法區大小
直接內存
直接內存不是虛擬機運行時數據區的一部分。通過Native函數庫直接分配的堆外內存,然後通過存儲在Java堆中的DirectByteBuffer對象作為這塊內存的引用進行操作
目前為止,jvm已經發展處三種比較成熟的垃圾收集算法:1.標記-清除算法;2.復制算法;3.標記-整理算法;4.分代收集算法
1. 標記-清除算法
這種垃圾回收一次回收分為兩個階段:標記、清除。首先標記所有需要回收的對象,在標記完成後回收所有被標記的對象。這種回收算法會產生大量不連續的內存碎片,當要頻繁分配一個大對象時,jvm在新生代中找不到足夠大的連續的內存塊,會導致jvm頻繁進行內存回收(目前有機制,對大對象,直接分配到老年代中)
2. 復制算法
這種算法會將內存劃分為兩個相等的塊,每次只使用其中一塊。當這塊內存不夠使用時,就將還存活的對象復制到另一塊內存中,然後把這塊內存一次清理掉。這樣做的效率比較高,也避免了內存碎片。但是這樣內存的可使用空間減半,是個不小的損失。
3. 標記-整理算法
這是標記-清除算法的升級版。在完成標記階段後,不是直接對可回收對象進行清理,而是讓存活對象向著一端移動,然後清理掉邊界以外的內存
4. 分代收集算法
當前商業虛擬機都采用這種算法。首先根據對象存活周期的不同將內存分為幾塊即新生代、老年代,然後根據不同年代的特點,采用不同的收集算法。在新生代中,每次垃圾收集時都有大量對象死去,只有少量存活,所以選擇了復制算法。而老年代中因為對象存活率比較高,所以采用標記-整理算法(或者標記-清除算法)
GC的執行機制
由於對象進行了分代處理,因此垃圾回收區域、時間也不一樣。GC有兩種類型:Scavenge GC和Full GC。
Minor GC
一般情況下,當新對象生成,並且在Eden申請空間失敗時,就會觸發Minor GC,對Eden區域進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。這種方式的GC是對年輕代的Eden區進行,不會影響到年老代。因為大部分對象都是從Eden區開始的,同時Eden區不會分配的很大,所以Eden區的GC會頻繁進行。因而,一般在這裡需要使用速度快、效率高的算法,使Eden去能盡快空閒出來。
Full GC
對整個堆進行整理,包括Young、Tenured和Perm。Full GC因為需要對整個堆進行回收,所以比Minor GC要慢,因此應該盡可能減少Full GC的次數。在對JVM調優的過程中,很大一部分工作就是對於FullGC的調節。有如下原因可能導致Full GC:
1.年老代(Tenured)被寫滿
2.持久代(Perm)被寫滿
3.System.gc()被顯示調用
4.上一次GC之後Heap的各域分配策略動態變化
Java常見的內存洩漏