當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Dalivik垃圾回收收机制Cocurrent GC简介

發布時間：2023/12/19 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了 Dalivik垃圾回收收机制Cocurrent GC简介小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在C/C++中，開發者需要手動地管理在堆中分配的內存，但是這往往導致很多問題。

1、內存分配之后忘記釋放，造成內存泄漏。

2、非法訪問那些已經釋放了的內存，引發程序崩潰。

沒有一個好的C/C++應用程序開發框架，一般的開發者根本無法駕馭內存問題，因為程序大了之后，很容易造成失控。最要命的是，內存被破壞的時候，并不一定就是程序崩潰的時候，它就是一顆不定時炸彈，說不準什么時候會被引爆，查找原因也是非常困難的。Java 語言運行在虛擬機上，虛擬機可以自動回收那些不再使用了的Java Object，也就是那些不再被引用了的Java Object。這就是Java語言的一種重要特性--垃圾自動收集機制。 ?垃圾回收機制將開發者從內存問題中解放出來，極大地提高了開發效率，以及提高了程序的可維護性。這也是Android為什么會選擇Java而不是C/C++來作為主要應用程序開發語言的原因之一。就是為了能夠讓開發遠離內存問題，而將精力集中在業務上，開發出更多更好的APP來，從而迎頭趕超iOS。Android系統內存也存在大量的C/C++代碼，這只要考慮性能問題，?不過，為了避免出現內存問題，在Android系統內部的C++代碼，大量地使用了智能指針來自動管理對象的生命周期。選擇Java來作為Android應用程序的開發語言，可以說是技術與商業之間一個折衷，事實證明，這種折衷是成功的。?

Android 垃圾回收機制簡史：

在GingerBread（android2.3）之前，Dalvik虛擬使用的垃圾收集機制有以下特點：

1. Stop-the-world，也就是垃圾收集線程在執行的時候，其它的線程都停止；

2. Full heap collection，也就是一次收集完全部的垃圾；

3. 一次垃圾收集造成的程序中止時間通常都大于100ms。

GingerBread（android2.3）---Kit Kat（4.4），Dalvik虛擬使用的垃圾收集機制得到了改進

1. ?Cocurrent GC :?也就是大多數情況下，垃圾收集線程與其它線程是并發執行的

2. ?Partial collection，也就是一次可能只收集一部分垃圾；

3. ?一次垃圾收集造成的程序中止時間通常都小于5ms。

Kit Kat（4.4以上版本），Android開始使用ART替代Dalivk虛擬機, ART的垃圾回收機制有一次做了優化

特點和Dalivik基本一致，效率上比Dalivik更優！！！

Dalivk的堆管理
? ? ? ? ? ? ? ? ? ? ?圖1 Dalvik虛擬機垃圾收集機制的基本概念
???????? 1、Dalivik堆:? 所有的java對象都是在Dalivik堆上面申請的， Dalivik堆分為兩部分。Active Heap 和 Zygote Heap。?事實上，Dalvik虛擬機的堆最初是只有一個的，也就是Zygote進程在啟動過程中創建Dalvik虛擬機的時候，只有一個堆。但是當Zygote進程在fork第一個應用程序進程之前，會將已經使用了的那部分堆內存劃分為一部分，還沒有使用的堆內存劃分為另外一部分。前者就稱為Zygote堆，后者就稱為Active堆
2、Heap Bitmap:? 堆位圖，用于記錄android中所有應用程序的Java 對象的引用情況。?兩個Bitmap來描述堆的對象的狀態。一個稱為Live Bitmap，另一個稱為Mark Bitmap。Heap Bitmap使用位圖來標記對象是否被使用。如果一個對象被引用，那么在Bitmap中與它對應的那一位就會被設置為1。否則的話，就設置為0。Live Bitmap用來標記上一次GC時被引用的對象，也就是沒有被回收的對象，而Mark Bitmap用來標記當前GC有被引用的對象。有了這兩個信息之后，我們就可以很容易地知道哪些對象是需要被回收的，即在Live Bitmap在標記為1，但是在Mark Bitmap中標記為0的對象。?
3、Card Table:?
在垃圾收集的Mark階段，要求除了垃圾收集線程之外，其它的線程都停止，否則的話，就會可能導致不能正確地標記每一個對象。這種現象在垃圾收集算法中稱為Stop The World，會導致程序中止執行，造成停頓的現象。為了盡可能地減少停頓，我們必須要允許在Mark階段有條件地允許程序的其它線程執行。這種垃圾收集算法稱為并行垃圾收集算法Concurrent GC。為了實現Concurrent GC，Mark階段又劃分兩個子階段。

4、Mark Stack: 在Mark階段，Dalvik虛擬機能過遞歸方式來標記對象。但是，這不是通過函數的遞歸調用來實現的，而是借助一個稱為Mark Stack的棧來實現的。

1. 為什么要把用來分配對象的堆劃分為Active堆和Zygote堆 ? Android系統的第一個Dalvik虛擬機是由Zygote進程創建的。?應用程序進程是由Zygote進程fork出來的。也就是說，應用程序進程使用了一種寫時拷貝技術（COW）來復制了Zygote進程的地址空間。這意味著一開始的時候，應用程序進程和Zygote進程共享了同一個用來分配對象的堆。然而，當Zygote進程或者應用程序進程對該堆進行寫操作時，內核就會執行真正的拷貝操作，使得Zygote進程和應用程序進程分別擁有自己的一份拷貝。拷貝是一件費時費力的事情。因此，為了盡量地避免拷貝，Dalvik虛擬機將自己的堆劃分為兩部分。事實上，Dalvik虛擬機的堆最初是只有一個的。也就是Zygote進程在啟動過程中創建Dalvik虛擬機的時候，只有一個堆。但是當Zygote進程在fork第一個應用程序進程之前，會將已經使用了的那部分堆內存劃分為一部分，還沒有使用的堆內存劃分為另外一部分。前者就稱為Zygote堆，后者就稱為Active堆。以后無論是Zygote進程，還是應用程序進程，當它們需要分配對象的時候，都在Active堆上進行。這樣就可以使得Zygote堆盡可能少地被執行寫操作，因而就可以減少執行寫時拷貝的操作。
在Zygote堆里面分配的對象其實主要就是Zygote進程在啟動過程中預加載的類、資源和對象了。這意味著這些預加載的類、資源和對象可以在Zygote進程和應用程序進程中做到長期共享。這樣既能減少拷貝操作，還能減少對內存的需求。?

2. 堆/堆管理 ? ? ?圖2 Dalvik虛擬機的堆???????
在Dalvik虛擬機中，堆實際上就是一塊匿名共享內存。Dalvik虛擬機并不是直接管理這塊匿名共享內存，而是將它封裝成一個mspace，交給C庫來管理。mspace是libc中的概念，我們可以通過libc提供的函數create_mspace_with_base創建一個mspace，然后再通過mspace_開頭的函數管理該mspace。例如，我們可以通過mspace_malloc和mspace_bulk_free來在指定的mspace中分配和釋放內存。?實際上，我們在使用libc提供的函數malloc和free分配和釋放內存時，也是在一個mspace進行的，只不過這個mspace是由libc默認創建的。Dalvik虛擬機除了要給應用層分配對象之外，最重要的還是要對這些已經分配出去的對象進行管理，也就是要在對象不再被使用的時候，對其進行自動回收。
???? ???? GC回收原理

Dalvik虛擬機執行完成一次垃圾收集之后，我們通常可以看到類似以下的日志輸出：

D/dalvikvm(9050):?GC_CONCURRENT?freed?2049K,?65%?free?3571K/9991K,?external?4703K/5261K,?paused?2ms+2ms ?copy

在這一行日志中， 1、 GC_CONCURRENT表示GC原因 2、 2049K表示總共回收的內存 3、 3571K/9991K表示Java Object Heap統計，即在9991K的Java Object Heap中，有3571K是正在使用的 4、 4703K/5261K表示External Memory統計，即在5261K的External Memory中，有4703K是正在使用的

5、 2ms+2ms表示垃圾收集造成的程序中止時間。
Dalivk垃圾收集的使用的?耳熟能詳，大名鼎鼎的的Mark-Sweep算法。?Mark-Sweep垃圾收集算法主要分為兩個階段：Mark和Sweep。
1.Mark階段從對象的根集開始標記被引用的對象。標記完成后，就進入到Sweep階段
2.Sweep階段所做的事情就是回收沒有被標記的對象占用的內存。
下面我們來介紹一下在Mark和Sweep 過程中堆管理的結構體的作用

1.Bitmap:
這里涉及到的一個核心概念就是我們怎么標記對象有沒有被引用的，換句說就是通過什么數據結構來描述對象有沒有被引用。是的，就是圖1中的Heap Bitmap了。Heap Bitmap的結構如圖3所示：

? ? ? ? ? ? ? ? ? ? ? ? ? ? ?圖3 Heap Bitmap
1、在Dalvik虛擬機中，使用一個unsigned long數組來描述一個Heap Bitmap。? 2、我們使用libc提供的函數mspace_malloc來從堆里面分配內存時，得到的內存的地址總是對齊到HB_OBJECT_ALIGNMENT（8）的，也就是說，我們分配的對象的地址的最低三位總是0。為了減少Bitmap的大小。?Bitmap中的位與對象的對應關系時，忽略最低三位。
2.Card Table:
在垃圾收集的Mark階段，要求除了垃圾收集線程之外，其它的線程都停止，否則的話，就會可能導致不能正確地標記每一個對象。這種現象在垃圾收集算法中稱為Stop The World，會導致程序中止執行，造成停頓的現象。為了盡可能地減少停頓，我們必須要允許在Mark階段有條件地允許程序的其它線程執行。這種垃圾收集算法稱為并行垃圾收集算法Concurrent GC。為了實現Concurrent GC，Mark階段又劃分兩個子階段。 1、第一階段：只負責標記根集對象。所謂的根集對象，就是指在GC開始的瞬間，被全局變量、棧變量和寄存器等引用的對象。 2、第二階段：負責標記被根集對象引用的對象的過程就是。有了這些根集變量之后，我們就可以順著它們找到其余的被引用變量。例如，一個棧變量引了一個對象，而這個對象又通過成員變量引用了另外一個對象，那該被引用的對象也會同時標記為正在使用。
在Concurrent GC，第一個子階段是不允許垃圾收集線程之外的線程運行的，但是第二個子階段是允許的。不過，在第二個子階段執行的過程中，如果一個線程修改了一個對象，那么該對象必須要記錄起來，因為它很有可能引用了新的對象，或者引用了之前未引用過的對象。如果不這樣做的話，那么就會導致被引用對象還在使用然而卻被回收。這種情況出現在只進行部分垃圾收集的情況，這時候Card Table的作用就是用來記錄非垃圾收集堆對象對垃圾收集堆對象的引用。
Dalvik虛擬機進行部分垃圾收集時，實際上就是只收集在Active堆上分配的對象。因此對Dalvik虛擬機來說，Card Table就是用來記錄在Zygote堆上分配的對象在部收垃圾收集執行過程中對在Active堆上分配的對象的引用。 ? ? ? ? 我們是不是想到再用一個Bitmap在描述上述第二個子階段被修改的對象呢？雖然我們盡大努力減少了用來標記對象的Bitmap的大小，不過還是比較可觀的。
因此，為了減少內存的消耗，我們使用另外一種技術來標記Mark第二子階段被修改的對象。這種技術使用到了一種稱為Card Table的數據結構，如圖4所示：
? ? ? ? ? ? ? ? 圖4 Card Table
??????? 從名字可以看出，Card Table由Card組成，一個Card實際上就是一個字節，它的值要么是CLEAN，要么是DIRTY。
如果一個Card的值是CLEAN，就表示與它對應的對象在Mark第二子階段沒有被程序修改過。否則的話，就意味著被程序修改過，對于這些被修改過的對象。需要在Mark第二子階段結束之后，再次禁止垃圾收集線程之外的其它線程執行，以便垃圾收集線程再次根據Card Table記錄的信息對被修改過的對象引用的其它對象進行重新標記。由于Mark第二子階段執行的時間不會太長，因此在該階段被修改的對象不會很多，這樣就可以保證第二次子階段結束后，再次執行標記對象的過程是很快的，因而此時對程序造成的停頓非常小。
在Card Table中，在連續GC_CARD_SIZE地址中的對象共用一個Card。Dalvik虛擬機將GC_CARD_SIZE的值設置為128。因此，假設堆的大小為Max Heap Size，那么我們只需要一塊字節數為（Max Heap Size / 128）的Card Table。相比大小為（Max Heap Size / 8 / 32）× 4的Bitmap，減少了一半的內存需求。???? ????

2.Mark Stack: 在Mark階段，Dalvik虛擬機能過遞歸方式來標記對象。但是，這不是通過函數的遞歸調用來實現的，而是借助一個稱為Mark Stack的棧來實現的。
具體來說，當我們標記完成根集對象之后，就按照它們的地址從小到大的順序標記它們所引用的其它對象。假設有A、B、C和D四個對象，它的地址大小關系為A < B < C < D，其中，B和D是根集對象，A被D引用，C沒有被B和D引用。那么我們將依次遍歷B和D。當遍歷到B的時候，沒有發現它引用其它對象，然后就繼續向前遍歷D對象。發現它引用了A對象。按照遞歸的算法，這時候除了標記A對象是正在使用之外，還應該去檢查A對象有沒有引用其它對象，然后又再檢查它引用的對象有沒有又引用其它的對象，一直這樣遍歷下去。這樣就跟函數遞歸一樣。更好的做法是將對象A記錄在一個Mark Stack中，然后繼續檢查地址值比對象D大的其它對象。對于地址值比對象D大的其它對象，如果它們引用了一個地址值比它們小的其它對象，那么這些其它對象同樣要記錄在Mark Stack中。等到該輪檢查結束之后，再回過頭來檢查記錄在Mark Stack里面的對象。然后又重復上述過程，直到Mark Stack等于空為止。 ? ? ? ??? 這就是我們在圖1中顯示的Mark Stack的作用，它的具體結構如圖5所示：
? ? ? ? ? ? ? ?圖5 Mark Stack
?????? 在Dalvik虛擬機中，每一個對象都是從Object類繼承下來的，也就是說，每一個對象占用的內存大小都至少等于sizeof(Object)。此外，我們通過libc提供的函數mspace_malloc為對象分配內存時，libc需要額外的內存來記錄被分配出去的內存的信息。例如，需要記錄被分配出去的內存的大小。每一塊分配出去的內存需要額外的HEAP_SOURCE_CHUNK_OVERHEAD內存來記錄上述的管理信息。因此，在Dalvik虛擬機中，每一個對象的大小都至少為sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD。這就意味著對于一個大小為Max Heap Size的堆來說，最多可以分配Max Heap Size / (sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD)個對象。于是，在最壞情況下，我們就需要一個大小為（Max Heap Size / (sizeof(Object) + HEAP_SOURCE_CHUNK_OVERHEAD)）的Object*數組來描述Mark Stack，以便可以實現上述的非遞歸函數調用的遞歸標記算法。

總結

以上是生活随笔為你收集整理的Dalivik垃圾回收收机制Cocurrent GC简介的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：魔兽世界60级通灵学院的钥匙任务怎么做
下一篇：关于Dalvik虚拟机你需要知道的15个