JVM讲解
-=-=-=-=-=-=-第一部分-=-=-=-=-=-=-=-=-=-=-
JVM學(xué)習(xí)筆記(一)------基本結(jié)構(gòu)
從Java平臺的邏輯結(jié)構(gòu)上來看,我們可以從下圖來了解JVM:
從上圖能清晰看到Java平臺包含的各個邏輯模塊,也能了解到JDK與JRE的區(qū)別
對于JVM自身的物理結(jié)構(gòu),我們可以從下圖鳥瞰一下:
對于JVM的學(xué)習(xí),在我看來這么幾個部分最重要:
- Java代碼編譯和執(zhí)行的整個過程
- JVM內(nèi)存管理及垃圾回收機制
下面將這兩個部分進行詳細(xì)學(xué)習(xí)
-=-=-=-=-=-=-第二部分-=-=-=-=-=-=-=-=-=-=-
JVM學(xué)習(xí)筆記(二)------Java代碼編譯和執(zhí)行的整個過程
Java代碼編譯是由Java源碼編譯器來完成,流程圖如下所示:
Java字節(jié)碼的執(zhí)行是由JVM執(zhí)行引擎來完成,流程圖如下所示:
?
Java代碼編譯和執(zhí)行的整個過程包含了以下三個重要的機制:
- Java源碼編譯機制
- 類加載機制
- 類執(zhí)行機制
Java源碼編譯機制
Java源碼編譯由以下三個過程組成:
- 分析和輸入到符號表
- 注解處理
- 語義分析和生成class文件
流程圖如下所示:
最后生成的class文件由以下部分組成:
- 結(jié)構(gòu)信息。包括class文件格式版本號及各部分的數(shù)量與大小的信息
- 元數(shù)據(jù)。對應(yīng)于Java源碼中聲明與常量的信息。包含類/繼承的超類/實現(xiàn)的接口的聲明信息、域與方法聲明信息和常量池
- 方法信息。對應(yīng)Java源碼中語句和表達式對應(yīng)的信息。包含字節(jié)碼、異常處理器表、求值棧與局部變量區(qū)大小、求值棧的類型記錄、調(diào)試符號信息
類加載機制
JVM的類加載是通過ClassLoader及其子類來完成的,類的層次關(guān)系和加載順序可以由下圖來描述:
1)Bootstrap ClassLoader
負(fù)責(zé)加載$JAVA_HOME中jre/lib/rt.jar里所有的class,由C++實現(xiàn),不是ClassLoader子類
2)Extension ClassLoader
負(fù)責(zé)加載java平臺中擴展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar或-Djava.ext.dirs指定目錄下的jar包
3)App ClassLoader
負(fù)責(zé)記載classpath中指定的jar包及目錄中class
4)Custom ClassLoader
屬于應(yīng)用程序根據(jù)自身需要自定義的ClassLoader,如tomcat、jboss都會根據(jù)j2ee規(guī)范自行實現(xiàn)ClassLoader
加載過程中會先檢查類是否被已加載,檢查順序是自底向上,從Custom ClassLoader到BootStrap ClassLoader逐層檢查,只要某個classloader已加載就視為已加載此類,保證此類只所有ClassLoader加載一次。而加載的順序是自頂向下,也就是由上層來逐層嘗試加載此類。
類執(zhí)行機制
JVM是基于棧的體系結(jié)構(gòu)來執(zhí)行class字節(jié)碼的。線程創(chuàng)建后,都會產(chǎn)生程序計數(shù)器(PC)和棧(Stack),程序計數(shù)器存放下一條要執(zhí)行的指令在方法內(nèi)的偏移量,棧中存放一個個棧幀,每個棧幀對應(yīng)著每個方法的每次調(diào)用,而棧幀又是有局部變量區(qū)和操作數(shù)棧兩部分組成,局部變量區(qū)用于存放方法中的局部變量和參數(shù),操作數(shù)棧中用于存放方法執(zhí)行過程中產(chǎn)生的中間結(jié)果。棧的結(jié)構(gòu)如下圖所示:
-=-=-=-=-=-=-第三部分-=-=-=-=-=-=-=-=-=-=-
JVM學(xué)習(xí)筆記(三)------內(nèi)存管理和垃圾回收
JVM內(nèi)存組成結(jié)構(gòu)
JVM棧由堆、棧、本地方法棧、方法區(qū)等部分組成,結(jié)構(gòu)圖如下所示:
1)堆
所有通過new創(chuàng)建的對象的內(nèi)存都在堆中分配,其大小可以通過-Xmx和-Xms來控制。堆被劃分為新生代和舊生代,新生代又被進一步劃分為Eden和Survivor區(qū),最后Survivor由From Space和To Space組成,結(jié)構(gòu)圖如下所示:
- 新生代。新建的對象都是用新生代分配內(nèi)存,Eden空間不足的時候,會把存活的對象轉(zhuǎn)移到Survivor中,新生代大小可以由-Xmn來控制,也可以用-XX:SurvivorRatio來控制Eden和Survivor的比例
- 舊生代。用于存放新生代中經(jīng)過多次垃圾回收仍然存活的對象
2)棧
每個線程執(zhí)行每個方法的時候都會在棧中申請一個棧幀,每個棧幀包括局部變量區(qū)和操作數(shù)棧,用于存放此次方法調(diào)用過程中的臨時變量、參數(shù)和中間結(jié)果
3)本地方法棧
用于支持native方法的執(zhí)行,存儲了每個native方法調(diào)用的狀態(tài)
4)方法區(qū)
存放了要加載的類信息、靜態(tài)變量、final類型的常量、屬性和方法信息。JVM用持久代(Permanet Generation)來存放方法區(qū),可通過-XX:PermSize和-XX:MaxPermSize來指定最小值和最大值
垃圾回收機制
JVM分別對新生代和舊生代采用不同的垃圾回收機制
新生代的GC:
新生代通常存活時間較短,因此基于Copying算法來進行回收,所謂Copying算法就是掃描出存活的對象,并復(fù)制到一塊新的完全未使用的空間中,對應(yīng)于新生代,就是在Eden和From Space或To Space之間copy。新生代采用空閑指針的方式來控制GC觸發(fā),指針保持最后一個分配的對象在新生代區(qū)間的位置,當(dāng)有新的對象要分配內(nèi)存時,用于檢查空間是否足夠,不夠就觸發(fā)GC。當(dāng)連續(xù)分配對象時,對象會逐漸從eden到survivor,最后到舊生代,
用java visualVM來查看,能明顯觀察到新生代滿了后,會把對象轉(zhuǎn)移到舊生代,然后清空繼續(xù)裝載,當(dāng)舊生代也滿了后,就會報outofmemory的異常,如下圖所示:
在執(zhí)行機制上JVM提供了串行GC(Serial GC)、并行回收GC(Parallel Scavenge)和并行GC(ParNew)
1)串行GC
在整個掃描和復(fù)制過程采用單線程的方式來進行,適用于單CPU、新生代空間較小及對暫停時間要求不是非常高的應(yīng)用上,是client級別默認(rèn)的GC方式,可以通過-XX:+UseSerialGC來強制指定
2)并行回收GC
在整個掃描和復(fù)制過程采用多線程的方式來進行,適用于多CPU、對暫停時間要求較短的應(yīng)用上,是server級別默認(rèn)采用的GC方式,可用-XX:+UseParallelGC來強制指定,用-XX:ParallelGCThreads=4來指定線程數(shù)
3)并行GC
與舊生代的并發(fā)GC配合使用
舊生代的GC:
舊生代與新生代不同,對象存活的時間比較長,比較穩(wěn)定,因此采用標(biāo)記(Mark)算法來進行回收,所謂標(biāo)記就是掃描出存活的對象,然后再進行回收未被標(biāo)記的對象,回收后對用空出的空間要么進行合并,要么標(biāo)記出來便于下次進行分配,總之就是要減少內(nèi)存碎片帶來的效率損耗。在執(zhí)行機制上JVM提供了串行GC(Serial MSC)、并行GC(parallel MSC)和并發(fā)GC(CMS),具體算法細(xì)節(jié)還有待進一步深入研究。
以上各種GC機制是需要組合使用的,指定方式由下表所示:
| 指定方式 | 新生代GC方式 | 舊生代GC方式 |
| -XX:+UseSerialGC | 串行GC | 串行GC |
| -XX:+UseParallelGC | 并行回收GC | 并行GC |
| -XX:+UseConeMarkSweepGC | 并行GC | 并發(fā)GC |
| -XX:+UseParNewGC | 并行GC | 串行GC |
| -XX:+UseParallelOldGC | 并行回收GC | 并行GC |
| -XX:+ UseConeMarkSweepGC -XX:+UseParNewGC | 串行GC | 并發(fā)GC |
| 不支持的組合 | 1、-XX:+UseParNewGC -XX:+UseParallelOldGC 2、-XX:+UseParNewGC -XX:+UseSerialGC | |
-=-=-=-=-=-=-第四部分-=-=-=-=-=-=-=-=-=-=-
JVM學(xué)習(xí)筆記(四)------內(nèi)存調(diào)優(yōu)
首先需要注意的是在對JVM內(nèi)存調(diào)優(yōu)的時候不能只看操作系統(tǒng)級別Java進程所占用的內(nèi)存,這個數(shù)值不能準(zhǔn)確的反應(yīng)堆內(nèi)存的真實占用情況,因為GC過后這個值是不會變化的,因此內(nèi)存調(diào)優(yōu)的時候要更多地使用JDK提供的內(nèi)存查看工具,比如JConsole和Java VisualVM。
對JVM內(nèi)存的系統(tǒng)級的調(diào)優(yōu)主要的目的是減少GC的頻率和Full GC的次數(shù),過多的GC和Full GC是會占用很多的系統(tǒng)資源(主要是CPU),影響系統(tǒng)的吞吐量。特別要關(guān)注Full GC,因為它會對整個堆進行整理,導(dǎo)致Full GC一般由于以下幾種情況:
- 舊生代空間不足
調(diào)優(yōu)時盡量讓對象在新生代GC時被回收、讓對象在新生代多存活一段時間和不要創(chuàng)建過大的對象及數(shù)組避免直接在舊生代創(chuàng)建對象? - Pemanet Generation空間不足
增大Perm Gen空間,避免太多靜態(tài)對象? - 統(tǒng)計得到的GC后晉升到舊生代的平均大小大于舊生代剩余空間
控制好新生代和舊生代的比例? - System.gc()被顯示調(diào)用
垃圾回收不要手動觸發(fā),盡量依靠JVM自身的機制?
調(diào)優(yōu)手段主要是通過控制堆內(nèi)存的各個部分的比例和GC策略來實現(xiàn),下面來看看各部分比例不良設(shè)置會導(dǎo)致什么后果
1)新生代設(shè)置過小
一是新生代GC次數(shù)非常頻繁,增大系統(tǒng)消耗;二是導(dǎo)致大對象直接進入舊生代,占據(jù)了舊生代剩余空間,誘發(fā)Full GC
2)新生代設(shè)置過大
一是新生代設(shè)置過大會導(dǎo)致舊生代過小(堆總量一定),從而誘發(fā)Full GC;二是新生代GC耗時大幅度增加
一般說來新生代占整個堆1/3比較合適
3)Survivor設(shè)置過小
導(dǎo)致對象從eden直接到達舊生代,降低了在新生代的存活時間
4)Survivor設(shè)置過大
導(dǎo)致eden過小,增加了GC頻率
另外,通過-XX:MaxTenuringThreshold=n來控制新生代存活時間,盡量讓對象在新生代被回收
由上一篇博文JVM學(xué)習(xí)筆記(三)------內(nèi)存管理和垃圾回收可知新生代和舊生代都有多種GC策略和組合搭配,選擇這些策略對于我們這些開發(fā)人員是個難題,JVM提供兩種較為簡單的GC策略的設(shè)置方式
1)吞吐量優(yōu)先
JVM以吞吐量為指標(biāo),自行選擇相應(yīng)的GC策略及控制新生代與舊生代的大小比例,來達到吞吐量指標(biāo)。這個值可由-XX:GCTimeRatio=n來設(shè)置
2)暫停時間優(yōu)先
JVM以暫停時間為指標(biāo),自行選擇相應(yīng)的GC策略及控制新生代與舊生代的大小比例,盡量保證每次GC造成的應(yīng)用停止時間都在指定的數(shù)值范圍內(nèi)完成。這個值可由-XX:MaxGCPauseRatio=n來設(shè)置
?
最后匯總一下JVM常見配置
- -Xms:初始堆大小
- -Xmx:最大堆大小
- -XX:NewSize=n:設(shè)置年輕代大小
- -XX:NewRatio=n:設(shè)置年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
- -XX:SurvivorRatio=n:年輕代中Eden區(qū)與兩個Survivor區(qū)的比值。注意Survivor區(qū)有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區(qū)占整個年輕代的1/5
- -XX:MaxPermSize=n:設(shè)置持久代大小
- -XX:+UseSerialGC:設(shè)置串行收集器
- -XX:+UseParallelGC:設(shè)置并行收集器
- -XX:+UseParalledlOldGC:設(shè)置并行年老代收集器
- -XX:+UseConcMarkSweepGC:設(shè)置并發(fā)收集器
- -XX:+PrintGC
- -XX:+PrintGCDetails
- -XX:+PrintGCTimeStamps
- -Xloggc:filename
- -XX:ParallelGCThreads=n:設(shè)置并行收集器收集時使用的CPU數(shù)。并行收集線程數(shù)。
- -XX:MaxGCPauseMillis=n:設(shè)置并行收集最大暫停時間
- -XX:GCTimeRatio=n:設(shè)置垃圾回收時間占程序運行時間的百分比。公式為1/(1+n)
- -XX:+CMSIncrementalMode:設(shè)置為增量模式。適用于單CPU情況。
- -XX:ParallelGCThreads=n:設(shè)置并發(fā)收集器年輕代收集方式為并行收集時,使用的CPU數(shù)。并行收集線程數(shù)。
附:
本系列學(xué)習(xí)資料主要來自博文http://rednaxelafx.javaeye.com/blog/656951里提到的PPT和《分布式Java應(yīng)用》里有關(guān)JVM的章節(jié),推薦大家繼續(xù)深入學(xué)習(xí)
總結(jié)
- 上一篇: 一本书看懂数字化转型|全新《2021年度
- 下一篇: 数据分析师想收入翻倍,不懂点时间管理怎么