Golang 垃圾回收机制
1. Golang GC 發展
Golang 從第一個版本以來,GC 一直是大家詬病最多的。但是每一個版本的發布基本都伴隨著 GC 的改進。下面列出一些比較重要的改動。
- v1.1 STW
- v1.3 Mark STW, Sweep 并行
- v1.5 三色標記法
- v1.8 hybrid write barrier
2. GC 算法簡介
這一小節介紹三種經典的 GC 算法:
- 引用計數(reference counting)
- 標記-清掃(mark & sweep)
- 節點復制(Copying Garbage Collection)
- 分代收集(Generational Garbage Collection)
?
?3. 引用計數
引用計數的思想非常簡單:每個單元維護一個域,保存其它單元指向它的引用數量(類似有向圖的入度)。當引用數量為 0 時,將其回收。引用計數是漸進式的,能夠將內存管理的開銷分布到整個程序之中。C++ 的 share_ptr 使用的就是引用計算方法。
引用計數算法實現一般是把所有的單元放在一個單元池里,比如類似 free list。這樣所有的單元就被串起來了,就可以進行引用計數了。新分配的單元計數值被設置為 1(注意不是 0,因為申請一般都說 ptr = new object 這種)。每次有一個指針被設為指向該單元時,該單元的計數值加 1;而每次刪除某個指向它的指針時,它的計數值減 1。當其引用計數為 0 的時候,該單元會被進行回收。雖然這里說的比較簡單,實現的時候還是有很多細節需要考慮,比如刪除某個單元的時候,那么它指向的所有單元都需要對引用計數減 1。那么如果這個時候,發現其中某個指向的單元的引用計數又為 0,那么是遞歸的進行還是采用其他的策略呢?遞歸處理的話會導致系統顛簸。關于這些細節這里就不討論了,可以參考文章后面的給的參考資料。
優點
缺點
4. 標記-清掃
標記-清掃算法是第一種自動內存管理,基于追蹤的垃圾收集算法。算法思想在 70 年代就提出了,是一種非常古老的算法。內存單元并不會在變成垃圾立刻回收,而是保持不可達狀態,直到到達某個閾值或者固定時間長度。這個時候系統會掛起用戶程序,也就是 STW,轉而執行垃圾回收程序。垃圾回收程序對所有的存活單元進行一次全局遍歷確定哪些單元可以回收。算法分兩個部分:標記(mark)和清掃(sweep)。標記階段表明所有的存活單元,清掃階段將垃圾單元回收。可視化可以參考下圖。
標記-清掃算法的優點也就是基于追蹤的垃圾回收算法具有的優點:避免了引用計數算法的缺點(不能處理循環引用,需要維護指針)。缺點也很明顯,需要 STW。
三色標記算法
三色標記算法是對標記階段的改進,原理如下:
可視化如下。
三色標記的一個明顯好處是能夠讓用戶程序和 mark 并發的進行,具體可以參考論文:《On-the-fly garbage collection: an exercise in cooperation.》。Golang 的 GC 實現也是基于這篇論文,后面再具體說明。
5. 節點復制
節點復制也是基于追蹤的算法。其將整個堆等分為兩個半區(semi-space),一個包含現有數據,另一個包含已被廢棄的數據。節點復制式垃圾收集從切換(flip)兩個半區的角色開始,然后收集器在老的半區,也就是 Fromspace 中遍歷存活的數據結構,在第一次訪問某個單元時把它復制到新半區,也就是 Tospace 中去。在 Fromspace 中所有存活單元都被訪問過之后,收集器在 Tospace 中建立一個存活數據結構的副本,用戶程序可以重新開始運行了。
優點
缺點
6. 分代收集
基于追蹤的垃圾回收算法(標記-清掃、節點復制)一個主要問題是在生命周期較長的對象上浪費時間(長生命周期的對象是不需要頻繁掃描的)。同時,內存分配存在這么一個事實 “most object die young”。基于這兩點,分代垃圾回收算法將對象按生命周期長短存放到堆上的兩個(或者更多)區域,這些區域就是分代(generation)。對于新生代的區域的垃圾回收頻率要明顯高于老年代區域。
分配對象的時候從新生代里面分配,如果后面發現對象的生命周期較長,則將其移到老年代,這個過程叫做 promote。隨著不斷 promote,最后新生代的大小在整個堆的占用比例不會特別大。收集的時候集中主要精力在新生代就會相對來說效率更高,STW 時間也會更短。
優點
缺點
??
?7. Golang GC
7.1 Overview
在說 Golang 的具體垃圾回收流程時,我們先來看一下幾個基本的問題。
1. 何時觸發 GC
在堆上分配大于 32K byte 對象的時候進行檢測此時是否滿足垃圾回收條件,如果滿足則進行垃圾回收。
上面是自動垃圾回收,還有一種是主動垃圾回收,通過調用 runtime.GC(),這是阻塞式的。
1 // GC runs a garbage collection and blocks the caller until the 2 // garbage collection is complete. It may also block the entire 3 // program. 4 func GC() { 5 gcStart(gcForceBlockMode, false) 6 } View Code 2. GC 觸發條件
觸發條件主要關注下面代碼中的中間部分:forceTrigger || memstats.heap_live >= memstats.gc_trigger 。forceTrigger 是 forceGC 的標志;后面半句的意思是當前堆上的活躍對象大于我們初始化時候設置的 GC 觸發閾值。在 malloc 以及 free 的時候 heap_live 會一直進行更新,這里就不再展開了。
3. 垃圾回收的主要流程
三色標記法,主要流程如下:
- 所有對象最開始都是白色。
- 從 root 開始找到所有可達對象,標記為灰色,放入待處理隊列。
- 遍歷灰色對象隊列,將其引用對象標記為灰色放入待處理隊列,自身標記為黑色。
- 處理完灰色對象隊列,執行清掃工作。
詳細的過程如下圖所示,具體可參考 [9]。
關于上圖有幾點需要說明的是。
另外針對上圖各個階段對應 GCPhase 如下:
-
- Off: _GCoff
- Stack scan ~ Mark: _GCmark
- Mark termination: _GCmarktermination
7.2 寫屏障 (write barrier)
關于 write barrier,完全可以另外寫成一篇文章,所以這里只簡單介紹一下,這篇文章的重點還是 Golang 的 GC。垃圾回收中的 write barrier 可以理解為編譯器在寫操作時特意插入的一段代碼,對應的還有 read barrier。
為什么需要 write barrier,很簡單,對于和用戶程序并發運行的垃圾回收算法,用戶程序會一直修改內存,所以需要記錄下來。
Golang 1.7 之前的 write barrier 使用的經典的 Dijkstra-style insertion write barrier [Dijkstra ‘78], STW 的主要耗時就在 stack re-scan 的過程。自 1.8 之后采用一種混合的 write barrier 方式 (Yuasa-style deletion write barrier [Yuasa ‘90] 和 Dijkstra-style insertion write barrier [Dijkstra ‘78])來避免 re-scan。具體的可以參考 17503-eliminate-rescan。
7.3 標記
下面的源碼還是基于 go1.8rc3。這個版本的 GC 代碼相比之前改動還是挺大的,我們下面盡量只關注主流程。垃圾回收的代碼主要集中在函數 gcStart() 中。
1. STW phase 1
在 GC 開始之前的準備工作。
2. Mark
Mark 階段是并行的運行,通過在后臺一直運行 mark worker 來實現。
Mark 階段的標記代碼主要在函數 gcDrain() 中實現。
1 // gcDrain scans roots and objects in work buffers, blackening grey 2 // objects until all roots and work buffers have been drained. 3 func gcDrain(gcw *gcWork, flags gcDrainFlags) { 4 ... 5 // Drain root marking jobs. 6 if work.markrootNext < work.markrootJobs { 7 for !(preemptible && gp.preempt) { 8 job := atomic.Xadd(&work.markrootNext, +1) - 1 9 if job >= work.markrootJobs { 10 break 11 } 12 markroot(gcw, job) 13 if idle && pollWork() { 14 goto done 15 } 16 } 17 } 18 19 // 處理 heap 標記 20 // Drain heap marking jobs. 21 for !(preemptible && gp.preempt) { 22 ... 23 //從灰色列隊中取出對象 24 var b uintptr 25 if blocking { 26 b = gcw.get() 27 } else { 28 b = gcw.tryGetFast() 29 if b == 0 { 30 b = gcw.tryGet() 31 } 32 } 33 if b == 0 { 34 // work barrier reached or tryGet failed. 35 break 36 } 37 //掃描灰色對象的引用對象,標記為灰色,入灰色隊列 38 scanobject(b, gcw) 39 } 40 } View Code 3. Mark termination (STW phase 2)
mark termination 階段會 stop the world。函數實現在 gcMarkTermination()。1.8 版本已經不會再對 goroutine stack 進行 re-scan 了。細節有點多,這里不細說了。
7.4 清掃
清掃相對來說就簡單很多了。
對于并行式清掃,在 GC 初始化的時候就會啟動 bgsweep(),然后在后臺一直循環。
1 func bgsweep(c chan int) { 2 sweep.g = getg() 3 4 lock(&sweep.lock) 5 sweep.parked = true 6 c <- 1 7 goparkunlock(&sweep.lock, "GC sweep wait", traceEvGoBlock, 1) 8 9 for { 10 for gosweepone() != ^uintptr(0) { 11 sweep.nbgsweep++ 12 Gosched() 13 } 14 lock(&sweep.lock) 15 if !gosweepdone() { 16 // This can happen if a GC runs between 17 // gosweepone returning ^0 above 18 // and the lock being acquired. 19 unlock(&sweep.lock) 20 continue 21 } 22 sweep.parked = true 23 goparkunlock(&sweep.lock, "GC sweep wait", traceEvGoBlock, 1) 24 } 25 } 26 27 func gosweepone() uintptr { 28 var ret uintptr 29 systemstack(func() { 30 ret = sweepone() 31 }) 32 return ret 33 } View Code不管是阻塞式還是并行式,都是通過 sweepone()函數來做清掃工作的。如果對于上篇文章 Golang 內存管理 熟悉的話,這個地方就很好理解。內存管理都是基于 span 的,mheap_ 是一個全局的變量,所有分配的對象都會記錄在 mheap_ 中。在標記的時候,我們只要找到對對象對應的 span 進行標記,清掃的時候掃描 span,沒有標記的 span 就可以回收了。
1 // sweeps one span 2 // returns number of pages returned to heap, or ^uintptr(0) if there is nothing to sweep 3 func sweepone() uintptr { 4 ... 5 for { 6 s := mheap_.sweepSpans[1-sg/2%2].pop() 7 ... 8 if !s.sweep(false) { 9 // Span is still in-use, so this returned no 10 // pages to the heap and the span needs to 11 // move to the swept in-use list. 12 npages = 0 13 } 14 } 15 } 16 17 // Sweep frees or collects finalizers for blocks not marked in the mark phase. 18 // It clears the mark bits in preparation for the next GC round. 19 // Returns true if the span was returned to heap. 20 // If preserve=true, don't return it to heap nor relink in MCentral lists; 21 // caller takes care of it. 22 func (s *mspan) sweep(preserve bool) bool { 23 ... 24 } View Code 7.5 其他
1. gcWork
這里介紹一下任務隊列,或者說灰色對象管理。每個 P 上都有一個 gcw 用來管理灰色對象(get 和 put),gcw 的結構就是 gcWork。gcWork 中的核心是 wbuf1 和 wbuf2,里面存儲就是灰色對象,或者說是 work(下面就全部統一叫做 work)。
既然每個 P 上有一個 work buffer,那么是不是還有一個全局的 work list 呢?是的。通過在每個 P 上綁定一個 work buffer 的好處和 cache 一樣,不需要加鎖。
1 var work struct { 2 full uint64 // lock-free list of full blocks workbuf 3 empty uint64 // lock-free list of empty blocks workbuf 4 pad0 [sys.CacheLineSize]uint8 // prevents false-sharing between full/empty and nproc/nwait 5 ... 6 } View Code那么為什么使用兩個 work buffer (wbuf1 和 wbuf2)呢?我下面舉個例子。比如我現在要 get 一個 work 出來,先從 wbuf1 中取,wbuf1 為空的話則與 wbuf2 swap 再 get。在其他時間將 work buffer 中的 full 或者 empty buffer 移到 global 的 work 中。這樣的好處在于,在 get 的時候去全局的 work 里面取(多個 goroutine 去取會有競爭)。這里有趣的是 global 的 work list 是 lock-free 的,通過原子操作 cas 等實現。下面列舉幾個函數看一下 gcWrok。
初始化。
1 func (w *gcWork) init() { 2 w.wbuf1 = wbufptrOf(getempty()) 3 wbuf2 := trygetfull() 4 if wbuf2 == nil { 5 wbuf2 = getempty() 6 } 7 w.wbuf2 = wbufptrOf(wbuf2) 8 } View Codeput。
1 // put enqueues a pointer for the garbage collector to trace. 2 // obj must point to the beginning of a heap object or an oblet. 3 func (w *gcWork) put(obj uintptr) { 4 wbuf := w.wbuf1.ptr() 5 if wbuf == nil { 6 w.init() 7 wbuf = w.wbuf1.ptr() 8 // wbuf is empty at this point. 9 } else if wbuf.nobj == len(wbuf.obj) { 10 w.wbuf1, w.wbuf2 = w.wbuf2, w.wbuf1 11 wbuf = w.wbuf1.ptr() 12 if wbuf.nobj == len(wbuf.obj) { 13 putfull(wbuf) 14 wbuf = getempty() 15 w.wbuf1 = wbufptrOf(wbuf) 16 flushed = true 17 } 18 } 19 20 wbuf.obj[wbuf.nobj] = obj 21 wbuf.nobj++ 22 } View Codeget。
1 // get dequeues a pointer for the garbage collector to trace, blocking 2 // if necessary to ensure all pointers from all queues and caches have 3 // been retrieved. get returns 0 if there are no pointers remaining. 4 //go:nowritebarrier 5 func (w *gcWork) get() uintptr { 6 wbuf := w.wbuf1.ptr() 7 if wbuf == nil { 8 w.init() 9 wbuf = w.wbuf1.ptr() 10 // wbuf is empty at this point. 11 } 12 if wbuf.nobj == 0 { 13 w.wbuf1, w.wbuf2 = w.wbuf2, w.wbuf1 14 wbuf = w.wbuf1.ptr() 15 if wbuf.nobj == 0 { 16 owbuf := wbuf 17 wbuf = getfull() 18 if wbuf == nil { 19 return 0 20 } 21 putempty(owbuf) 22 w.wbuf1 = wbufptrOf(wbuf) 23 } 24 } 25 26 // TODO: This might be a good place to add prefetch code 27 28 wbuf.nobj-- 29 return wbuf.obj[wbuf.nobj] 30 } View Code 2. forcegc
我們上面講了兩種 GC 觸發方式:自動檢測和用戶主動調用。除此之后 Golang 本身還會對運行狀態進行監控,如果超過兩分鐘沒有 GC,則觸發 GC。監控函數是 sysmon(),在主 goroutine 中啟動。
?
轉載于:https://www.cnblogs.com/hezhixiong/p/9577199.html
總結
以上是生活随笔為你收集整理的Golang 垃圾回收机制的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java程序员集合框架面试题_常见的Ja
- 下一篇: 基于使用AspectJ实现AOP,注解A