當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

JVM学习笔记之-StringTable String的基本特性,内存分配,基本操作,拼接操作,intern()的使用,垃圾回收 ,G1中的String去重操作

發布時間：2024/4/15 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 JVM学习笔记之-StringTable String的基本特性,内存分配,基本操作,拼接操作,intern()的使用,垃圾回收 ,G1中的String去重操作小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

String的基本特性

string:字符串，使用一對""引起來表示。

String s1 = “”; //字面量的定義方式
String s2 = new String(“Hello”);·

string聲明為final的，不可被繼承

string實現了serializable接口:表示字符串是支持序列化的。

實現了Comparable接口:表示string可以比較大小

string在jdk8及以前內部定義了final char[ ] value用于存儲字符串數據。jdk9時改為byte [ ]

String在jdk9中存儲結構變更

結論:
String 再也不用char[]來存儲啦，改成了byte[]加上編碼標記，節約了一些空間。
那StringBuffer和 StringBuilder是否仍無動于衷呢?

String 的不可變性

string:代表不可變的字符序列。簡稱:不可變性。

當對字符串重新賦值時，需要重寫指定內存區域賦值，不能使用原有的value進行賦值。

當對現有的字符串進行連接操作時，也需要重新指定內存區域賦值，不能使用原有的value進行賦值。

當調用string的replace ()方法修改指定字符或字符串時，也需要重新指定內存區域賦值，不能使用原有的value進行賦值。

通過字面量的方式（區別于new）給一個字符串賦值，此時的字符串值聲明在字符串常量池中。

筆試案列

package com.fs.str;/*** 筆試題*/ public class StringDemo {String str = new String("good");char[] ch = {'t', 'e', 's', 't'};public static void main(String[] args) {StringDemo ex = new StringDemo(); // ex.change(ex.str, ex.ch);String s = ex.changeString(ex.str, ex.ch);System.out.println(ex.str);//goodSystem.out.println(ex.ch);//bestSystem.out.println(s);//test ok}public void change(String str, char ch[]) {str = "test ok";ch[0] = 'b';}public String changeString(String str, char ch[]) {str = "test ok";ch[0] = 'b';return str;} }

字符串常量池中是不會存儲相同內容的字符串的。

String的string Pool是一個固定大小的Hashtable，默認值大小長度是1009。如果放進string Pool的string非常多，就會造成Hash沖突嚴重，從而導致鏈表會很長，而鏈表長了后直接會造成的影響就是當調string.intern時性能會大幅下降。

使用-xx :StringTablesize可設置stringTable的長度

在jdk6中stringTable是固定的，就是1009的長度，所以如果常量池中的字符串過多就會導致效率下降很快。StringTablesize設置沒有要求

在jdk7中，stringTable的長度默認值是60013

在jdk8中，stringTable的長度默認值是60013，1009是可設置的最小值。

代碼案列 jdk8查看stringTable的長度默認值

package com.fs.str;public class StringDemo02 {public static void main(String[] args) {System.out.println("jps jinfo -flag StringTableSize pid");try {Thread.sleep(100000);} catch (InterruptedException e) {e.printStackTrace();}} }

由案列的jdk8默認值為60013,可設置參數-xx :StringTablesize 10000執行修改大小,jdk8最小值為1009

-xx :StringTablesize 100執行修改大小,jdk8最小值為1009

String的內存分配

在Java語言中有8種基本數據類型和一種比較特殊的類型string。這些類型為了使它們在運行過程中速度更快、更節省內存，都提供了一種常量池的概念。

常量池就類似一個Java系統級別提供的緩存。8種基本數據類型的常量池都是系統協調的，String類型的常量池比較特殊。它的主要使用方法有兩種。

直接使用雙引號聲明出來的string對象會直接存儲在常量池中。
比如:string info = “xiaofu.com”;

如果不是用雙引號聲明的string對象，可以使用string提供的intern ()方法。這個后面重點談

Java 6及以前，字符串常量池存放在永久代。

Java 7 中 oracle 的工程師對字符串池的邏輯做了很大的改變，即將字符串常量池的位置調整到Java堆內。

所有的字符串都保存在堆（Heap）中，和其他普通對象一樣，這樣可以讓你在進行調優應用時僅需要調整堆大小就可以了。

字符串常量池概念原本使用得比較多，但是這個改動使得我們有足夠的理由讓我們重新考慮在Java 7 中使用string.intern ( )。

Java8元空間，字符串常量在堆

jdk6

jdk7

jdk8

String的基本操作

操作1

Java語言規范里要求完全相同的字符串字面量，應該包含同樣的Unicode字符序列(包含同一份碼點序列的常量)，并且必須是指向同一個string類實例。

操作2 虛擬機官方案列

字符串拼接操作

1.常量與常量的拼接結果在常量池，原理是編譯期優化
2.常量池中不會存在相同內容的常量。
3.只要其中有一個是變量，結果就在堆中。變量拼接的原理是stringBuilder
4.如果拼接的結果調用intern()方法，則主動將常量池中還沒有的字符串對象放入池中，并返回此對象地址。

案列1

常量與常量的拼接結果在常量池，原理是編譯期優化
常量池中不會存在相同內容的常量。

案列2

只要其中有一個是變量，結果就在堆中。變量拼接的原理是stringBuilder

如果拼接的結果調用intern()方法，則主動將常量池中還沒有的字符串對象放入池中，并返回此對象地址。

如果拼接符號的前后出現了變量，則相當于在堆空間中new String()，具體的內容為拼接的結果。

案列3

如下的s1 + s2的執行細節:
StringBuilder s = new StringBuilder( );
s.append(“a”)
s.append(“b”)
s.tostring( ) —> 約等于 new String(“ab”)

補充:在jdk5.0之后使用的是StringBuilder,在jdk5.0之前使用的是StringBuffer

案列4

字符串拼接操作不一定使用的是stringBuilder
如果拼接符號左右兩邊都是字符串常量或常量引用，則仍然使用編譯期優化，即非stringBuilder的方式。

被final修飾的變量就是常量了

案列5 體驗字符串拼接速度

體會執行效率:通過stringBuilder的append()的方式添加字符串的效率要遠高于使用string的字符串拼接方式

詳情:

stringBuilder的append()的方式:自始至終中只創建過一個StringBuilder的對象
使用string的字符串拼接方式:創建過多個stringBuilder和String的對象
使用strinq的字符串拼接方式:內存中由于創建了較多的StringBuilder和Strinq的對象，內存占用更大;GC也會需要時間

改進空間:
在實際開發中，如果基本確定要前前后后添加的字符串長度不高于某個限定值highLevel的情況下,建議使用如下構造器實例化:stringBuilder s = new stringBuiLder(highLevel) ;//new char[ highLevel]

intern()的使用

如果不是用雙引號聲明的string對象，可以使用string提供的intern方法:intern方法會從字符串常量池中查詢當前字符串是否存在，若不存在就會將當前字符串放入常量池中。

比如:string myInfo = new string (“I love xiaofu” ).intern() ;

也就是說，如果在任意字符串上調用string.intern方法，那么其返回結果所指向的那個類實例，必須和直接以常量形式出現的字符串實例完全相同。因此，下列表達式的值必定是true:

( “a” + “b” + “c” ) .intern ( ) == “abc”

通俗點講，Interned string就是確保字符串在內存里只有一份拷貝，這樣可以節約內存空間，加快字符串操作任務的執行速度。注意，這個值會被存放在字符串內部池( String Intern Pool) 。

如何保證變量s指向的是字符串常量池中的數據呢?有兩種方式:

方式一:String s = “fs”;//字面量定義的方式

方式二:String s = new string( “fs” ).intern( );
String s = new StringBuilder( “fs”).toString( ).intern();
無論前面怎么拼接或者怎樣,只要后面調用.intern()方法就是直接只想字符串常量池

關于intern面試題

題一

題目: new String ( “ab”)會創建幾個對象?

答案:兩個對象
一個對象是: new關鍵字在堆空間創建的
另一個對象是:字符串常量池中的對象。字節碼指令: ldc

題二

拓展: new String ( “a”’) +new String ( “b”)呢?

答案:五個對象
對象1: new StringBuilder( )
對象2:new String( “a” )
對象3:常量池中的"a"
對象4:new String( “b”)
對象5:常量池中的"b"

實際深究還不止5個對象
深入剖析:StringBuilder的toString( ) :

對象6 : new String( “ab”)
注意:toString()調用,在字符串常量池中,沒有生成"ab" 因為StringBuilder的toString方法是沒有ldc的

題三關于 jdk6 與 jdk7/8 的String

代碼解釋

package com.fs.str;public class StringDemo03 {public static void main(String[] args) {String s = new String("1");s.intern();//調用此方法之前,字符串常量池中已經存在了"1"String s2 = "1";System.out.println(s == s2);//jdk6: false | jdk7/8: false 這里為false的原因是 s 為堆空間的地址,s2為常量池中的地址String s3 = new String("1") + new String("1");//s3 的地址記錄變量的地址為:new String("11"),理由題目二已經解釋//執行上面的代碼后字符串常量池中是否有"11"嗎? 答案是:不存在,理由題目二已經解釋s3.intern();//在字符串常量池中生成"11"/*15行的s3.intern();代碼怎么理解?jdk6:創建了一個新的對象"11",也就有新的地址jdk7/8:因為常量池放在堆當中了,調用intern()方法的時候,常量池中并沒有創建一個新"11",而是常量池指向的是堆中的newString("11")的地址歸根結底的原因就是因為jdk6的常量池在永久代中,而jdk7/8常量池在堆空間中*/String s4 = "11";//使用的上一行 intern代碼執行后在常量池生成的"11"的地址值System.out.println(s3 == s4);//jdk6: false | jdk7/8: true//那么為什么jdk7/8是true呢? s3為堆地址 s4是常量池地址}}

圖解題三 jdk6

圖解題三 jdk7/8

題目三的拓展

package com.fs.str;public class StringDemo04 {public static void main(String[] args) {String s3 = new String("1") + new String("1");//s3 在堆內存中String s4 = "11";//s4 在常量池中String s5 = s3.intern();//去常量池發現有"11" 所以就不會干什么事,不會講s3的"11"地址指向常量池中,所以s4的地址不變 s3的地址不變所以是false//使用s5來接收的話,意思就去常量池發現有"11"那么就將s4的堆內存中的"11"的地址指向s5,那么就是trueSystem.out.println(s3 == s4);//jdk7/8: falseSystem.out.println(s5 == s4);//jdk7/8: true}}

題目四圖解

題目五

答案:
注釋第一行 true
解釋:因為s1的"11"沒有在常量池中,那么s1.inter就會將s1堆內存中的"11"指向常量池,那么s2就是s1的地址值

注釋第二行 false
解釋:因為new String(“11”)的"11"是在常量池中,s1.intern就發現常量池中有,就不做處理,s1的地址又是堆內存中的,而s2的地址又是常量池的,所以就false

總結string的intern ( )的使用:

.jdk1.6中，將這個字符串對象嘗試放入串池。

如果串池中有，則并不會放入。返回已有的串池中的對象的地址
如果沒有，會把此對象復制一份，放入串池，并返回串池中的對象地址

.Jdk1.7起，將這個字符串對象嘗試放入串池。

如果串池中有，則并不會放入。返回已有的串池中的對象的地址
如果沒有，則會把對象的引用地址復制一份，放入串池，并返回串池中的引用地址

intern)的效率測試︰空間角度

結論:對于程序中大量存在存在的字符串，尤其其中存在很多重復字符串時，使用intern()可以節省內存空間。

大的網站平臺，需要內存中存儲大量的字符串。比如社交網站，很多人都存儲:北京市、海淀區等信息。這時候如果字符串都調用intern ()方法，就會明顯降低內存的大小。

StringTable的垃圾回收

G1中的String去重操作

官方描述

不是去重字符串常量池,因為字符串常量池本身就不存在重復字符串,而是去重堆空間中的char[]

背景:對許多Java應用(有大的也有小的）做的測試得出以下結果:

堆存活數據集合里面string對象占了25%
堆存活數據集合里面重復的string對象有13.5%
string對象的平均長度是45

許多大規模的Java應用的瓶頸在于內存，測試表明，在這些類型的應用里面，Java堆中存活的數據集合差不多25%是string對象。更進一步，這里面差不多一半string對象是重復的，重復的意思是說:
stringl.equals (string2) =true。堆上存在重復的string對象必然是一種內存的浪費。這個項目將在G1垃圾收集器中實現自動持續對重復的string對象進行去重，這樣就能避免浪費內存。

G1中的String去重操作實現步驟

當垃圾收集器工作的時候，會訪問堆上存活的對象。對每一個訪問的對象都會檢查是否是候選的要去重的string對象。

如果是，把這個對象的一個引用插入到隊列中等待后續的處理。一個去重的線程在后臺運行，處理這個隊列。處理隊列的一個元素意味著從隊列刪除這個元素，然后嘗試去重它引用的string對象。

使用一個hashtable來記錄所有的被string對象使用的不重復的char數組。當去重的時候，會查這個hashtable，來看堆上是否已經存在一個一模一樣的char數組。

如果存在，string對象會被調整引用那個數組，釋放對原來的數組的引用，最終會被垃圾收集器回收掉。

如果查找失敗，char數組會被插入到hashtable，這樣以后的時候就可以共享這個數組了。

命令行選項

UsestringDeduplication (bool):開啟string去重，默認是不開啟的，需要手動開啟。

PrintstringDeduplicationStatistics (bool):打印詳細的去重統計信息

StringDeduplicationAgeThreshold (uintx):達到這個年齡的string對象被認為是去重的候選對象

總結

以上是生活随笔為你收集整理的JVM学习笔记之-StringTable String的基本特性,内存分配,基本操作,拼接操作,intern()的使用,垃圾回收 ,G1中的String去重操作的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： JVM学习笔记之-执行引擎(Execut
下一篇： JVM学习笔记之-拉圾回收概述,垃圾回收