深入理解JVM(2)——GC算法与内存分配策略
說起垃圾收集(Garbage Collection, GC),想必大家都不陌生,它是JVM實(shí)現(xiàn)里非常重要的一環(huán),JVM成熟的內(nèi)存動(dòng)態(tài)分配與回收技術(shù)使Java(當(dāng)然還有其他運(yùn)行在JVM上的語言,如Scala等)程序員在提升開發(fā)效率上獲得了驚人的便利。理解GC,對(duì)于理解JVM和Java語言有著非常重要的作用。并且當(dāng)我們需要排查各種內(nèi)存溢出、內(nèi)存泄漏問題時(shí),當(dāng)垃圾收集稱為系統(tǒng)達(dá)到更高并發(fā)量的瓶頸時(shí),只有深入理解GC和內(nèi)存分配,才能對(duì)這些“自動(dòng)化”的技術(shù)實(shí)施必要的監(jiān)控和調(diào)節(jié)。
在Java的運(yùn)行時(shí)數(shù)據(jù)區(qū)中,程序計(jì)數(shù)器、虛擬機(jī)棧、本地方法棧三個(gè)區(qū)域都是線程私有的,隨線程而生,隨線程而滅,在方法結(jié)束或線程結(jié)束時(shí),內(nèi)存自然就跟著回收了,不需要過多考慮回收的問題。而Java堆和方法區(qū)則不一樣,一個(gè)接口中的多個(gè)實(shí)現(xiàn)類需要的內(nèi)存可能不一樣,一個(gè)方法中的多個(gè)分支需要的內(nèi)存也可能不一樣,我們只有在程序處于運(yùn)行期間才能知道會(huì)創(chuàng)建哪些對(duì)象,這部分內(nèi)存的分配和回收都是動(dòng)態(tài)的,垃圾回收器關(guān)注的是這部分內(nèi)存,后續(xù)討論的“內(nèi)存”分配回收也是指這一塊,尤其需要注意。
GC主要回答了以下三個(gè)問題:
- 哪些內(nèi)存需要回收?
- 什么時(shí)候回收?
- 如何回收?
這三個(gè)問題的具體解決方案,也就是本文接下來要講解的內(nèi)容。
對(duì)象存活判定算法
在堆里存放著Java世界中幾乎所有的對(duì)象實(shí)例,垃圾收集器在對(duì)堆進(jìn)行回收前,首要的就是確定這些對(duì)象中哪些還“存活”著,哪些已經(jīng)“死去”(即不可能再被任何途徑使用的對(duì)象)。
引用計(jì)數(shù)算法
引用計(jì)數(shù)算法是在JVM中被摒棄的一種對(duì)象存活判定算法,不過它也有一些知名的應(yīng)用場景(如Python、FlashPlayer),因此在這里也簡單介紹一下。
用引用計(jì)數(shù)器判斷對(duì)象是否存活的過程是這樣的:給對(duì)象中添加一個(gè)引用計(jì)數(shù)器,每當(dāng)有一個(gè)地方引用它時(shí),計(jì)數(shù)器加1;當(dāng)引用失效時(shí),計(jì)數(shù)器減1;任何時(shí)刻計(jì)數(shù)器為0的對(duì)象就是不可能再被使用的。
引用計(jì)數(shù)算法的實(shí)現(xiàn)簡單,判定效率也很高,大部分情況下是一個(gè)不錯(cuò)的算法。它沒有被JVM采用的原因是它很難解決對(duì)象之間循環(huán)引用的問題。例如以下例子:
/** * testGC()方法執(zhí)行后,objA和objB會(huì)不會(huì)被GC呢? */ public class ReferenceCountingGC {public Object instance = null;private static final int _1MB = 1024 * 1024;/** * 這個(gè)成員屬性的唯一意義就是占點(diǎn)內(nèi)存,以便在能在GC日志中看清楚是否有回收過 */private byte[] bigSize = new byte[2 * _1MB];public static void testGC() {ReferenceCountingGC objA = new ReferenceCountingGC();ReferenceCountingGC objB = new ReferenceCountingGC();objA.instance = objB;objB.instance = objA;objA = null;objB = null;// 假設(shè)在這行發(fā)生GC,objA和objB是否能被回收?System.gc();} }在上面這段代碼中,對(duì)象objA 和對(duì)象objB都有字段instance,賦值令objA.instance = objB;、objB.instance = objA;,除此之外,這兩個(gè)對(duì)象再無引用。如果JVM采用引用計(jì)數(shù)算法來管理內(nèi)存,這兩個(gè)對(duì)象不可能再被訪問,但是他們互相引用著對(duì)方,導(dǎo)致它們引用計(jì)數(shù)不為0,所以引用計(jì)數(shù)器無法通知GC收集器回收它們。
而事實(shí)上執(zhí)行這段代碼,objA和objB是可以被回收的,下面一節(jié)將介紹JVM實(shí)際使用的存活判定算法。
可達(dá)性分析算法
在主流商用程序語言的實(shí)現(xiàn)中,都是通過可達(dá)性分析(tracing GC)來判定對(duì)象是否存活的。此算法的基本思路是:通過一系列的稱為“GC Roots”的對(duì)象作為起點(diǎn),從這些節(jié)點(diǎn)向下搜索,搜索所走過的路徑稱為引用鏈(Reference Chain),當(dāng)一個(gè)對(duì)象到GC Roots沒有任何引用鏈相連(用圖論的話來說,就是GC Roots 到這個(gè)對(duì)象不可達(dá))時(shí),則證明此對(duì)象時(shí)不可用的。用下圖來加以說明:
上圖中,對(duì)象object 5、object 6、object 7雖然互有關(guān)聯(lián),但是它們到GC Roots是不可達(dá)的,所以它們將會(huì)被判定為是可回收的對(duì)象。
可以看到,GC Roots在對(duì)象圖之外,是特別定義的“起點(diǎn)”,不可能被對(duì)象圖內(nèi)的對(duì)象所引用。
準(zhǔn)確地說,GC Roots其實(shí)不是一組對(duì)象,而通常是一組特別管理的指向引用類型對(duì)象的指針,這些指針是tracing GC的trace的起點(diǎn)。它們不是對(duì)象圖里的對(duì)象,對(duì)象也不可能引用到這些“外部”的指針,這也是tracing GC算法不會(huì)出現(xiàn)循環(huán)引用問題的基本保證。因此也容易得出,只有引用類型的變量才被認(rèn)為是Roots,值類型的變量永遠(yuǎn)不被認(rèn)為是Roots。只有深刻理解引用類型和值類型的內(nèi)存分配和管理的不同,才能知道為什么root只能是引用類型。
在Java中,可作為GC Roots的對(duì)象包括以下幾種:
- 虛擬機(jī)棧(棧幀中的局部變量表,Local Variable Table)中引用的對(duì)象。
- 方法區(qū)中類靜態(tài)屬性引用的對(duì)象。
- 方法區(qū)中常量引用的對(duì)象。
- 本地方法棧中JNI(即一般說的Native方法)引用的對(duì)象。
看到這里你可能要問,選擇這些對(duì)象的依據(jù)是什么呢?
可以概括得出,可作為GC Roots的節(jié)點(diǎn)主要在全局性的引用與執(zhí)行上下文中。要明確的是,tracing gc必須以當(dāng)前存活的對(duì)象集為Roots,因此必須選取確定存活的引用類型對(duì)象。GC管理的區(qū)域是Java堆,虛擬機(jī)棧、方法區(qū)和本地方法棧不被GC所管理,因此選用這些區(qū)域內(nèi)引用的對(duì)象作為GC Roots,是不會(huì)被GC所回收的。其中虛擬機(jī)棧和本地方法棧都是線程私有的內(nèi)存區(qū)域,只要線程沒有終止,就能確保它們中引用的對(duì)象的存活。而方法區(qū)中類靜態(tài)屬性引用的對(duì)象是顯然存活的。常量引用的對(duì)象在當(dāng)前可能存活,因此,也可能是GC roots的一部分。
兩次標(biāo)記與 finalize()方法
即使在可達(dá)性分析算法中不可達(dá)的對(duì)象,也不是一定會(huì)死亡的,它們暫時(shí)都處于“緩刑”階段,要真正宣告一個(gè)對(duì)象“死亡”,至少要經(jīng)歷兩次標(biāo)記過程:
如果對(duì)象在進(jìn)行可達(dá)性分析后發(fā)現(xiàn)沒有與 GC Roots相連接的引用鏈,那它將會(huì)被第一次標(biāo)記并且進(jìn)行一次篩選,篩選的條件是此對(duì)象是否有必要執(zhí)行finaliza()方法。當(dāng)對(duì)象沒有覆蓋finaliza()方法,或者finaliza()方法已經(jīng)被虛擬機(jī)調(diào)用過,虛擬機(jī)將這兩種情況都視為“沒有必要執(zhí)行”。
如果這個(gè)對(duì)象被判定為有必要執(zhí)行finaliza()方法,那么此對(duì)象將會(huì)放置在一個(gè)叫做 F-Queue 的隊(duì)列中,并在稍后由一個(gè)虛擬機(jī)自動(dòng)建立的、低優(yōu)先級(jí)的Finalizer線程去執(zhí)行它。這里所謂的“執(zhí)行”是指虛擬機(jī)會(huì)觸發(fā)此方法,但并不承諾會(huì)等待它運(yùn)行結(jié)束,原因是:如果一個(gè)對(duì)象在finaliza()方法中執(zhí)行緩慢,或者發(fā)生了死循環(huán)(更極端的情況),將很可能導(dǎo)致F-Queue 隊(duì)列中的其它對(duì)象永久處于等待,甚至導(dǎo)致整個(gè)內(nèi)存回收系統(tǒng)崩潰。
finaliza()方法是對(duì)象逃脫死亡命運(yùn)的最后一次機(jī)會(huì),稍后GC將對(duì)F-Queue 隊(duì)列中的對(duì)象進(jìn)行第二次小規(guī)模的標(biāo)記。如果對(duì)象想在finaliza()方法中成功拯救自己,只要重新與引用鏈上的任何一個(gè)對(duì)象建立關(guān)聯(lián)即可,例如把自己(this關(guān)鍵字)賦值給某個(gè)類變量或者對(duì)象的成員變量,這樣在第二次標(biāo)記時(shí)它將被移出“即將回收”的集合;如果對(duì)象這時(shí)候還沒有逃脫,基本上它就真的被回收了。
值得注意的是,如果代碼中有兩段一模一樣的代碼段,執(zhí)行結(jié)果卻是一次逃脫成功,一次失敗。這是因?yàn)槿魏我粋€(gè)對(duì)象的finalize()方法都只會(huì)被系統(tǒng)調(diào)用一次,如果對(duì)象面臨下一次回收,它的finalize()方法不會(huì)再被執(zhí)行,因此第二次逃脫行動(dòng)失敗。
需要說明的是,使用finalize()方法來“拯救”對(duì)象是不值得提倡的,因?yàn)樗皇荂/C++中的析構(gòu)函數(shù),而是Java剛誕生時(shí)為了使C/C++程序員更容易接受它所做的一個(gè)妥協(xié)。它的運(yùn)行代價(jià)高昂,不確定性大,無法保證各個(gè)對(duì)象的調(diào)用順序。finalize()?能做的工作,使用try-finally或者其它方法都更適合、及時(shí),所以筆者建議大家可以忘掉此方法存在。
回收方法區(qū)
很多人認(rèn)為方法區(qū)沒有垃圾回收,Java虛擬機(jī)規(guī)范中確實(shí)說過不要求,而且在方法區(qū)中進(jìn)行垃圾收集的“性價(jià)比”較低:在堆中,尤其是新生代,常規(guī)應(yīng)用進(jìn)行一次垃圾收集可以回收70%~95%的空間,而方法區(qū)的效率遠(yuǎn)低于此。在JDK 1.8中,JVM摒棄了永久代,用元空間來作為方法區(qū)的實(shí)現(xiàn),下面介紹的將是元空間的垃圾回收。
元空間的內(nèi)存管理由元空間虛擬機(jī)來完成。先前,對(duì)于類的元數(shù)據(jù)我們需要不同的垃圾回收器進(jìn)行處理,現(xiàn)在只需要執(zhí)行元空間虛擬機(jī)的C++代碼即可完成。在元空間中,類和其元數(shù)據(jù)的生命周期和其對(duì)應(yīng)的類加載器是相同的。話句話說,只要類加載器存活,其加載的類的元數(shù)據(jù)也是存活的,因而不會(huì)被回收掉。
我們從行文到現(xiàn)在提到的元空間稍微有點(diǎn)不嚴(yán)謹(jǐn)。準(zhǔn)確的來說,每一個(gè)類加載器的存儲(chǔ)區(qū)域都稱作一個(gè)元空間,所有的元空間合在一起就是我們一直說的元空間。當(dāng)一個(gè)類加載器被垃圾回收器標(biāo)記為不再存活,其對(duì)應(yīng)的元空間會(huì)被回收。在元空間的回收過程中沒有重定位和壓縮等操作。但是元空間內(nèi)的元數(shù)據(jù)會(huì)進(jìn)行掃描來確定Java引用。
垃圾收集算法
本節(jié)將介紹幾種垃圾收集算法的思想及其發(fā)展過程,具體的實(shí)現(xiàn)將在稍后介紹。
標(biāo)記-清除(Mark-Sweep)算法
標(biāo)記-清除(Mark-Sweep)算法是最基礎(chǔ)的垃圾收集算法,后續(xù)的收集算法都是基于它的思路并對(duì)其不足進(jìn)行改進(jìn)而得到的。顧名思義,算法分成“標(biāo)記”、“清除”兩個(gè)階段:首先標(biāo)記出所有需要回收的對(duì)象,在標(biāo)記完成后統(tǒng)一回收所有被標(biāo)記的對(duì)象,標(biāo)記過程在前一節(jié)講述對(duì)象標(biāo)記判定時(shí)已經(jīng)講過了。
標(biāo)記-清除算法的不足主要有以下兩點(diǎn):
- 空間問題,標(biāo)記清除之后會(huì)產(chǎn)生大量不連續(xù)的內(nèi)存碎片,空間碎片太多可能會(huì)導(dǎo)致以后在程序運(yùn)行過程中需要分配較大對(duì)象時(shí),無法找到足夠的連續(xù)內(nèi)存而不得不觸發(fā)另一次垃圾收集動(dòng)作。
- 效率問題,因?yàn)閮?nèi)存碎片的存在,操作會(huì)變得更加費(fèi)時(shí),因?yàn)椴檎蚁乱粋€(gè)可用空閑塊已不再是一個(gè)簡單操作。
標(biāo)記-清除算法的執(zhí)行過程如下圖所示:
復(fù)制(Copying)算法
為了解決標(biāo)記-清除算法的效率問題,一種稱為“復(fù)制”(Copying)的收集算法出現(xiàn)了,思想為:它將可用內(nèi)存按容量分成大小相等的兩塊,每次只使用其中的一塊。當(dāng)這一塊內(nèi)存用完,就將還存活著的對(duì)象復(fù)制到另一塊上面,然后再把已使用過的內(nèi)存空間一次清理掉。
這樣做使得每次都是對(duì)整個(gè)半?yún)^(qū)進(jìn)行內(nèi)存回收,內(nèi)存分配時(shí)也就不用考慮內(nèi)存碎片等復(fù)雜情況,只要移動(dòng)堆頂指針,按順序分配內(nèi)存即可,實(shí)現(xiàn)簡單,運(yùn)行高效。只是這種算法的代價(jià)是將內(nèi)存縮小為原來的一半,代價(jià)可能過高了。復(fù)制算法的執(zhí)行過程如下圖所示:
Minor GC與復(fù)制算法
現(xiàn)在的商業(yè)虛擬機(jī)都使用復(fù)制算法來回收新生代。新生代的GC又叫“Minor GC”,IBM公司的專門研究表明:新生代中的對(duì)象98%是“朝生夕死”的,所以Minor GC非常頻繁,一般回收速度也比較快,同時(shí)“朝生夕死”的特性也使得Minor GC使用復(fù)制算法時(shí)不需要按照1:1的比例來劃分新生代內(nèi)存空間。
Minor GC過程
事實(shí)上,新生代將內(nèi)存分為一塊較大的Eden空間和兩塊較小的Survivor空間(From Survivor和To Survivor),每次Minor GC都使用Eden和From Survivor,當(dāng)回收時(shí),將Eden和From Survivor中還存活著的對(duì)象都一次性地復(fù)制到另外一塊To Survivor空間上,最后清理掉Eden和剛使用的Survivor空間。一次Minor GC結(jié)束的時(shí)候,Eden空間和From Survivor空間都是空的,而To Survivor空間里面存儲(chǔ)著存活的對(duì)象。在下次MinorGC的時(shí)候,兩個(gè)Survivor空間交換他們的標(biāo)簽,現(xiàn)在是空的“From” Survivor標(biāo)記成為“To”,“To” Survivor標(biāo)記為“From”。因此,在MinorGC結(jié)束的時(shí)候,Eden空間是空的,兩個(gè)Survivor空間中的一個(gè)是空的,而另一個(gè)存儲(chǔ)著存活的對(duì)象。
HotSpot虛擬機(jī)默認(rèn)的Eden : Survivor的比例是8 : 1,由于一共有兩塊Survivor,所以每次新生代中可用內(nèi)存空間為整個(gè)新生代容量的90%(80%+10%),只有10%的容量會(huì)被“浪費(fèi)”。
分配擔(dān)保
上文說的98%的對(duì)象可回收只是一般場景下的數(shù)據(jù),我們沒有辦法保證每次回收都只有不多于10%的對(duì)象存活,當(dāng)Survivor空間不夠用時(shí),需要依賴老年代內(nèi)存進(jìn)行分配擔(dān)保(Handle Promotion)。如果另外一塊Survivor上沒有足夠空間存放上一次新生代收集下來的存活對(duì)象,這些對(duì)象將直接通過分配擔(dān)保機(jī)制進(jìn)入老年代。
標(biāo)記-整理(Mark-Compact)算法
復(fù)制算法在對(duì)象存活率較高時(shí)要進(jìn)行較多的復(fù)制操作,效率將會(huì)變低。更關(guān)鍵的是:如果不想浪費(fèi)50%的空間,就需要有額外的空間進(jìn)行分配擔(dān)保,以應(yīng)對(duì)被使用的內(nèi)存中所有對(duì)象都100%存活的極端情況,所以在老年代一般不能直接選用復(fù)制算法。
根據(jù)老年代的特點(diǎn),標(biāo)記-整理(Mark-Compact)算法被提出來,主要思想為:此算法的標(biāo)記過程與標(biāo)記-清除算法一樣,但后續(xù)步驟不是直接對(duì)可回收對(duì)象進(jìn)行清理,而是讓所有存活的對(duì)象都向一端移動(dòng),然后直接清理掉邊界以外的內(nèi)存。具體示意圖如下所示:
分代收集(Generational Collection)算法
當(dāng)前商業(yè)虛擬機(jī)的垃圾收集都采用分代收集(Generational Collection)算法,此算法相較于前幾種沒有什么新的特征,主要思想為:根據(jù)對(duì)象存活周期的不同將內(nèi)存劃分為幾塊,一般是把Java堆分為新生代和老年代,這樣就可以根據(jù)各個(gè)年代的特點(diǎn)采用最適合的收集算法:
-
新生代?在新生代中,每次垃圾收集時(shí)都發(fā)現(xiàn)有大批對(duì)象死去,只有少量存活,那就選用復(fù)制算法,只需要付出少量存活對(duì)象的復(fù)制成本就可以完成收集。
-
老年代?在老年代中,因?yàn)閷?duì)象存活率高、沒有額外空間對(duì)它進(jìn)行分配擔(dān)保,就必須使用“標(biāo)記-清除”或“標(biāo)記-整理”算法來進(jìn)行回收。
HotSpot的算法實(shí)現(xiàn)
前面兩大節(jié)主要從理論上介紹了對(duì)象存活判定算法和垃圾收集算法,而在HotSpot虛擬機(jī)上實(shí)現(xiàn)這些算法時(shí),必須對(duì)算法的執(zhí)行效率有嚴(yán)格的考量,才能保證虛擬機(jī)高效運(yùn)行。
枚舉根節(jié)點(diǎn)
從可達(dá)性分析中從GC Roots節(jié)點(diǎn)找引用鏈這個(gè)操作為例,可作為GC Roots的節(jié)點(diǎn)主要在全局性的引用(例如常量或類靜態(tài)屬性)與執(zhí)行上下文(例如棧幀中的局部變量表)中,現(xiàn)在很多應(yīng)用僅僅方法區(qū)就有數(shù)百兆,如果要逐個(gè)檢查這里面的引用,那么必然會(huì)消耗很多時(shí)間。
GC停頓(”Stop The World”)
另外,可達(dá)性分析工作必須在一個(gè)能確保一致性的快照中進(jìn)行——這里“一致性”的意思是指在整個(gè)分析期間整個(gè)執(zhí)行系統(tǒng)看起來就像被凍結(jié)在某個(gè)時(shí)間點(diǎn)上,不可以出現(xiàn)分析過程中對(duì)象引用關(guān)系還在不斷變化的情況,這是保證分析結(jié)果準(zhǔn)確性的基礎(chǔ)。這點(diǎn)是導(dǎo)致GC進(jìn)行時(shí)必須停頓所有Java執(zhí)行線程(Sun將這件事情稱為“Stop The World”)的其中一個(gè)重要原因,即使是在號(hào)稱(幾乎)不會(huì)發(fā)生停頓的CMS收集器中,枚舉根節(jié)點(diǎn)時(shí)也是必須要停頓的。
準(zhǔn)確式GC與OopMap
由于目前的主流Java虛擬機(jī)使用的都是準(zhǔn)確式GC(即使用準(zhǔn)確式內(nèi)存管理,虛擬機(jī)可用知道內(nèi)存中某個(gè)位置的數(shù)據(jù)具體是什么類型),所以當(dāng)執(zhí)行系統(tǒng)停頓下來后,并不需要一個(gè)不漏地檢查完所有執(zhí)行上下文和全局的引用位置,虛擬機(jī)應(yīng)當(dāng)是有辦法直接得知哪些地方存放著對(duì)象引用。在HotSpot的實(shí)現(xiàn)中,是使用一組稱為OopMap的數(shù)據(jù)結(jié)構(gòu)來達(dá)到這個(gè)目的的,在類加載完成的時(shí)候,HotSpot就把對(duì)象內(nèi)什么偏移量上是什么類型的數(shù)據(jù)計(jì)算出來,在JIT編譯過程中,也會(huì)在特定的位置記錄下棧和寄存器中哪些位置是引用。這樣,GC在掃描時(shí)就可以直接得知這些信息了。
安全點(diǎn)(Safepoint)——進(jìn)行GC時(shí)程序停頓的位置
在OopMap的協(xié)助下,HotSpot可以快速且準(zhǔn)確地完成GC Roots枚舉,但一個(gè)很現(xiàn)實(shí)的問題隨之而來:可能導(dǎo)致引用關(guān)系變化,或者說OopMap內(nèi)容變化的指令非常多,如果為每一條指令都生成對(duì)應(yīng)的OopMap,那將會(huì)需要大量的額外空間,這樣GC的空間成本將會(huì)變得很高。
為此,HotSpot選擇不為每條指令都生成OopMap,而是只在“特定的位置”記錄這些信息,這些位置便被稱為安全點(diǎn)(Safepoint)。也就是說,程序執(zhí)行時(shí)并非在所有地方都能停頓下來開始GC,只有在到達(dá)安全點(diǎn)時(shí)才能暫停。Safepoint的選定既不能太少以致于讓GC等待時(shí)間太長,也不能過于頻繁以致于過分增大運(yùn)行時(shí)的負(fù)荷。所以,安全點(diǎn)的選定基本上是以程序“是否具有讓程序長時(shí)間執(zhí)行的特征”為標(biāo)準(zhǔn)進(jìn)行選定的——因?yàn)槊織l指令執(zhí)行的時(shí)間都非常短暫,程序不太可能因?yàn)橹噶盍鏖L度太長這個(gè)原因而過長時(shí)間運(yùn)行,“長時(shí)間執(zhí)行”的最明顯特征就是指令序列復(fù)用,例如方法調(diào)用、循環(huán)跳轉(zhuǎn)、異常跳轉(zhuǎn)等,所以具有這些功能的指令才會(huì)產(chǎn)生Safepoint。
對(duì)于Sefepoint,另一個(gè)需要考慮的問題是如何在GC發(fā)生時(shí)讓所有線程(這里不包括執(zhí)行JNI調(diào)用的線程)都“跑”到最近的安全點(diǎn)上再停頓下來。這里有兩種方案可供選擇:
- 搶先式中斷(Preemptive Suspension)?搶先式中斷不需要線程的執(zhí)行代碼主動(dòng)去配合,在GC發(fā)生時(shí),首先把所有線程全部中斷,如果發(fā)現(xiàn)有線程中斷的地方不在安全點(diǎn)上,就恢復(fù)線程,讓它“跑”到安全點(diǎn)上。現(xiàn)在幾乎沒有虛擬機(jī)實(shí)現(xiàn)采用搶先式中斷來暫停線程從而響應(yīng)GC事件。
- 主動(dòng)式中斷(Voluntary Suspension): 主動(dòng)式中斷的思想是當(dāng)GC需要中斷線程的時(shí)候,不直接對(duì)線程操作,僅僅簡單地設(shè)置一個(gè)標(biāo)志,各個(gè)線程執(zhí)行時(shí)主動(dòng)去輪詢這個(gè)標(biāo)志,發(fā)現(xiàn)中斷標(biāo)志為真時(shí)就自己中斷掛起。輪詢標(biāo)志的地方和安全點(diǎn)是重合的,另外再加上創(chuàng)建對(duì)象需要分配內(nèi)存的地方。
安全區(qū)域(Safe Region)
Safepoint機(jī)制保證了程序執(zhí)行時(shí),在不太長的時(shí)間內(nèi)就會(huì)遇到可進(jìn)入GC的Safepoint。但是,程序“不執(zhí)行”的時(shí)候(如線程處于Sleep狀態(tài)或Blocked狀態(tài)),這時(shí)線程無法響應(yīng)JVM的中斷請(qǐng)求,“走到”安全的地方去中斷掛起,這時(shí)候就需要安全區(qū)域(Safe Region)來解決。
安全區(qū)域是指在一段代碼片段之中,引用關(guān)系不會(huì)發(fā)生變化。在這個(gè)區(qū)域中的任意地方開始GC都是安全的。我們也可以把Safe Region看做是被擴(kuò)展了的Safepoint。
在線程執(zhí)行到Safe Region中的代碼時(shí),首先標(biāo)識(shí)自己已經(jīng)進(jìn)入了Safe Region,那樣,當(dāng)在這段時(shí)間里JVM要發(fā)起GC時(shí),就不用管標(biāo)識(shí)自己為Safe Region狀態(tài)的線程了。在線程要離開Safe Region時(shí),它要檢查系統(tǒng)是否已經(jīng)完成了根節(jié)點(diǎn)枚舉(或者是整個(gè)GC過程),如果完成了,那線程就繼續(xù)執(zhí)行,否則它就必須等待直到收到可以安全離開Safe Region的信號(hào)為止。
內(nèi)存分配策略
Java的自動(dòng)內(nèi)存管理最終可以歸結(jié)為自動(dòng)化地解決了兩個(gè)問題:
- 給對(duì)象分配內(nèi)存
- 回收分配給對(duì)象的內(nèi)存
對(duì)象的內(nèi)存分配通常是在堆上分配(除此以外還有可能經(jīng)過JIT編譯后被拆散為標(biāo)量類型并間接地棧上分配),對(duì)象主要分配在新生代的Eden區(qū)上,如果啟動(dòng)了本地線程分配緩沖,將按線程優(yōu)先在TLAB上分配。少數(shù)情況下也可能會(huì)直接分配在老年代中,分配的規(guī)則并不是固定的,實(shí)際取決于垃圾收集器的具體組合以及虛擬機(jī)中與內(nèi)存相關(guān)的參數(shù)的設(shè)置。至于內(nèi)存回收策略,在上文已經(jīng)描述得很詳盡了。
下面以使用Serial/Serial Old收集器(將在下一篇文章中講解)為例,介紹內(nèi)存分配的策略。
對(duì)象優(yōu)先在Eden區(qū)分配
大多數(shù)情況下,對(duì)象在新生代的Eden區(qū)中分配。當(dāng)Eden區(qū)沒有足夠空間進(jìn)行分配時(shí),虛擬機(jī)將發(fā)起一次Minor GC。
大對(duì)象直接進(jìn)入老年代
所謂的大對(duì)象是指,需要大量連續(xù)內(nèi)存空間的Java對(duì)象,最典型的大對(duì)象就是很長的字符串以及數(shù)組。大對(duì)象對(duì)虛擬機(jī)的內(nèi)存分配來說是一個(gè)壞消息(尤其是遇到朝生夕滅的“短命大對(duì)象”,寫程序時(shí)應(yīng)避免),經(jīng)常出現(xiàn)大對(duì)象容易導(dǎo)致內(nèi)存還有不少空間時(shí)就提前觸發(fā)GC以獲取足夠的連續(xù)空間來安置它們。
虛擬機(jī)提供了一個(gè)-XX:PretenureSizeThreshold參數(shù),令大于這個(gè)設(shè)置值的對(duì)象直接在老年代分配。這樣做的目的是避免在Eden區(qū)及兩個(gè)Survivor區(qū)之間發(fā)生大量的內(nèi)存復(fù)制(新生代采用復(fù)制算法回收內(nèi)存)。
長期存活的對(duì)象將進(jìn)入老年代
既然虛擬機(jī)采用了分代收集的思想來管理內(nèi)存,那么內(nèi)存回收時(shí)就必須能識(shí)別哪些對(duì)象應(yīng)放在新生代,哪些對(duì)象應(yīng)放在老年代中。為了做到這點(diǎn),虛擬機(jī)給每個(gè)對(duì)象定義了一個(gè)對(duì)象年齡(Age)計(jì)數(shù)器。如果對(duì)象在Eden出生并經(jīng)過第一次Minor GC后仍然存活,并且能被Survivor容納的話,將被移動(dòng)到Survivor空間中,并且對(duì)象年齡設(shè)為1。對(duì)象在Survivor區(qū)中每“熬過”一次Minor GC,年齡就增加1歲,當(dāng)它的年齡增加到一定程度(默認(rèn)為15歲),就將會(huì)被晉升到老年代中。對(duì)象晉升老年代的年齡閾值,可以通過參數(shù)-XX:MaxTenuringThreshold設(shè)置。
動(dòng)態(tài)對(duì)象年齡判定
為了能更好地適應(yīng)不同程序的內(nèi)存狀況,虛擬機(jī)并不是永遠(yuǎn)地要求對(duì)象的年齡必須達(dá)到了MaxTenuringThreshold才能晉升老年代,如果在Survivor空間中相同年齡所有對(duì)象大小的總和大于Survivor空間的一半,年齡大于或等于該年齡的對(duì)象就可以直接進(jìn)入老年代,無須等到MaxTenuringThreshold中要求的年齡。
空間分配擔(dān)保
在發(fā)生Minor GC之前,虛擬機(jī)會(huì)先檢查老年代最大可用的連續(xù)空間是否大于新生代所有對(duì)象總空間,如果這個(gè)條件成立,那么Minor GC可以確保是安全的。如果不成立,則虛擬機(jī)會(huì)查看HandlePromotionFailure設(shè)置值是否允許擔(dān)保失敗。如果允許,那么會(huì)繼續(xù)檢查老年代最大可用的連續(xù)空間是否大于歷次晉升到老年代對(duì)象的平均大小,如果大于,將嘗試著進(jìn)行一次Minor GC,盡管這次Minor GC是有風(fēng)險(xiǎn)的;如果小于,或者HandlePromotionFailure設(shè)置不允許冒險(xiǎn),那這時(shí)也要改為進(jìn)行一次Full GC。
前面提到過,新生代使用復(fù)制收集算法,但為了內(nèi)存利用率,只使用其中一個(gè)Survivor空間來作為輪換備份,因此當(dāng)出現(xiàn)大量對(duì)象在Minor GC后仍然存活的情況(最極端的情況就是內(nèi)存回收后新生代中所有對(duì)象都存活),就需要老年代進(jìn)行分配擔(dān)保,把Survivor無法容納的對(duì)象直接進(jìn)入老年代。與生活中的貸款擔(dān)保類似,老年代要進(jìn)行這樣的擔(dān)保,前提是老年代本身還有容納這些對(duì)象的剩余空間,一共有多少對(duì)象會(huì)活下來在實(shí)際完成內(nèi)存回收之前是無法明確知道的,所以只好取之前每一次回收晉升到老年代對(duì)象容量的平均大小值作為經(jīng)驗(yàn)值,與老年代的剩余空間進(jìn)行比較,決定是否進(jìn)行Full GC來讓老年代騰出更多空間。
取平均值進(jìn)行比較其實(shí)仍然是一種動(dòng)態(tài)概率的手段,也就是說,如果某次Minor GC存活后的對(duì)象突增,遠(yuǎn)遠(yuǎn)高于平均值的話,依然會(huì)導(dǎo)致擔(dān)保失敗(Handle Promotion Failure)。如果出現(xiàn)了HandlePromotionFailure失敗,那就只好在失敗后重新發(fā)起一次Full GC。雖然擔(dān)保失敗時(shí)繞的圈子是最大的,但大部分情況下都還是會(huì)將HandlePromotionFailure開關(guān)打開,避免Full GC過于頻繁。
Full GC的觸發(fā)條件
對(duì)于Minor GC,其觸發(fā)條件非常簡單,當(dāng)Eden區(qū)空間滿時(shí),就將觸發(fā)一次Minor GC。而Full GC則相對(duì)復(fù)雜,因此本節(jié)我們主要介紹Full GC的觸發(fā)條件。
調(diào)用System.gc()
此方法的調(diào)用是建議JVM進(jìn)行Full GC,雖然只是建議而非一定,但很多情況下它會(huì)觸發(fā) Full GC,從而增加Full GC的頻率,也即增加了間歇性停頓的次數(shù)。因此強(qiáng)烈建議能不使用此方法就不要使用,讓虛擬機(jī)自己去管理它的內(nèi)存,可通過-XX:+ DisableExplicitGC來禁止RMI調(diào)用System.gc()。
老年代空間不足
老年代空間不足的常見場景為前文所講的大對(duì)象直接進(jìn)入老年代、長期存活的對(duì)象進(jìn)入老年代等,當(dāng)執(zhí)行Full GC后空間仍然不足,則拋出如下錯(cuò)誤:?Java.lang.OutOfMemoryError: Java heap space為避免以上兩種狀況引起的Full GC,調(diào)優(yōu)時(shí)應(yīng)盡量做到讓對(duì)象在Minor GC階段被回收、讓對(duì)象在新生代多存活一段時(shí)間及不要?jiǎng)?chuàng)建過大的對(duì)象及數(shù)組。
空間分配擔(dān)保失敗
前文介紹過,使用復(fù)制算法的Minor GC需要老年代的內(nèi)存空間作擔(dān)保,如果出現(xiàn)了HandlePromotionFailure擔(dān)保失敗,則會(huì)觸發(fā)Full GC。
JDK 1.7及以前的永久代空間不足
在JDK 1.7及以前,HotSpot虛擬機(jī)中的方法區(qū)是用永久代實(shí)現(xiàn)的,永久代中存放的為一些class的信息、常量、靜態(tài)變量等數(shù)據(jù),當(dāng)系統(tǒng)中要加載的類、反射的類和調(diào)用的方法較多時(shí),Permanet Generation可能會(huì)被占滿,在未配置為采用CMS GC的情況下也會(huì)執(zhí)行Full GC。如果經(jīng)過Full GC仍然回收不了,那么JVM會(huì)拋出如下錯(cuò)誤信息:?java.lang.OutOfMemoryError: PermGen space?為避免PermGen占滿造成Full GC現(xiàn)象,可采用的方法為增大PermGen空間或轉(zhuǎn)為使用CMS GC。
在JDK 1.8中用元空間替換了永久代作為方法區(qū)的實(shí)現(xiàn),元空間是本地內(nèi)存,因此減少了一種Full GC觸發(fā)的可能性。
Concurrent Mode Failure
執(zhí)行CMS GC的過程中同時(shí)有對(duì)象要放入老年代,而此時(shí)老年代空間不足(有時(shí)候“空間不足”是CMS GC時(shí)當(dāng)前的浮動(dòng)垃圾過多導(dǎo)致暫時(shí)性的空間不足觸發(fā)Full GC),便會(huì)報(bào)Concurrent Mode Failure錯(cuò)誤,并觸發(fā)Full GC。
小結(jié)
本文簡要地介紹了HotSpot虛擬機(jī)如何去發(fā)起內(nèi)存回收的問題,也解答了文章開頭提出的三個(gè)問題中的前兩個(gè)——“哪些內(nèi)存需要回收”和“何時(shí)回收”,同時(shí)對(duì)于第三個(gè)問題——“如何回收”,在原理層面作出了解答。在下一篇文章中,筆者將通過介紹幾種具體的垃圾收集器,來更深入地回答第三個(gè)問題。
參考資料
- 《深入理解Java虛擬機(jī)——JVM高級(jí)特性與最佳實(shí)踐》-周志明
總結(jié)
以上是生活随笔為你收集整理的深入理解JVM(2)——GC算法与内存分配策略的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入理解JVM(5) : Java垃圾收
- 下一篇: 深入理解JVM(1)——Java内存区域