伙伴分配器的一个极简实现
提起buddy system相信很多人不會陌生,它是一種經(jīng)典的內(nèi)存分配算法,大名鼎鼎的Linux底層的內(nèi)存管理用的就是它。這里不探討內(nèi)核這么復雜實現(xiàn),而僅僅是將該算法抽象提取出來,同時給出一份及其簡潔的源碼實現(xiàn),以便定制擴展。
伙伴分配的實質(zhì)就是一種特殊的“分離適配”,即將內(nèi)存按2的冪進行劃分,相當于分離出若干個塊大小一致的空閑鏈 表,搜索該鏈表并給出同需求最佳匹配的大小。其優(yōu)點是快速搜索合并(O(logN)時間復雜度)以及低外部碎片(最佳適配best-fit);其缺點是內(nèi) 部碎片,因為按2的冪劃分塊,如果碰上66單位大小,那么必須劃分128單位大小的塊。但若需求本身就按2的冪分配,比如可以先分配若干個內(nèi)存池,在其基 礎(chǔ)上進一步細分就很有吸引力了。
可以在維基百科上找到該算法的描述,大體如是:
分配內(nèi)存:
1.尋找大小合適的內(nèi)存塊(大于等于所需大小并且最接近2的冪,比如需要27,實際分配32)
?
釋放內(nèi)存:
1.釋放該內(nèi)存塊
上面這段文字對你來說可能看起來很費勁,沒事,我們看個內(nèi)存分配和釋放的示意圖你就知道了:
上圖中,首先我們假設(shè)我們一個內(nèi)存塊有1024K,當我們需要給A分配70K內(nèi)存的時候,
后面的,B,C,D都這樣,而釋放內(nèi)存時,則會把相鄰的塊一步一步地合并起來(合并也必需按分裂的逆操作進行合并)。
我們可以看見,這樣的算法,用二叉樹這個數(shù)據(jù)結(jié)構(gòu)來實現(xiàn)再合適不過了。
我在網(wǎng)上分別找到cloudwu和wuwenbin寫的兩份開源實現(xiàn)和測試用例。實際上后一份是對前一份的精簡和優(yōu)化,本文打算從后一份入手講解,因為這份實現(xiàn)真正體現(xiàn)了“極簡”二字,追求突破常規(guī)的,極致簡單的設(shè)計。網(wǎng)友對其評價甚高,甚至可用作教科書標準實現(xiàn),看完之后回過頭來看cloudwu的代碼就容易理解了。
分配器的整體思想是,通過一個數(shù)組形式的完全二叉樹來監(jiān)控管理內(nèi)存,二叉樹的節(jié)點用于標記相應內(nèi)存塊的使用狀態(tài),高層節(jié)點對應大的塊,低層節(jié)點對應 小的塊,在分配和釋放中我們就通過這些節(jié)點的標記屬性來進行塊的分離合并。如圖所示,假設(shè)總大小為16單位的內(nèi)存,我們就建立一個深度為5的滿二叉樹,根 節(jié)點從數(shù)組下標[0]開始,監(jiān)控大小16的塊;它的左右孩子節(jié)點下標[1~2],監(jiān)控大小8的塊;第三層節(jié)點下標[3~6]監(jiān)控大小4的塊……依此類推。
在分配階段,首先要搜索大小適配的塊,假設(shè)第一次分配3,轉(zhuǎn)換成2的冪是4,我們先要對整個內(nèi)存進行對半切割,從16切割到4需要兩步,那么從下標 [0]節(jié)點開始深度搜索到下標[3]的節(jié)點并將其標記為已分配。第二次再分配3那么就標記下標[4]的節(jié)點。第三次分配6,即大小為8,那么搜索下標 [2]的節(jié)點,因為下標[1]所對應的塊被下標[3~4]占用了。
在釋放階段,我們依次釋放上述第一次和第二次分配的塊,即先釋放[3]再釋放[4],當釋放下標[4]節(jié)點后,我們發(fā)現(xiàn)之前釋放的[3]是相鄰的, 于是我們立馬將這兩個節(jié)點進行合并,這樣一來下次分配大小8的時候,我們就可以搜索到下標[1]適配了。若進一步釋放下標[2],同[1]合并后整個內(nèi)存 就回歸到初始狀態(tài)。
還是看一下源碼實現(xiàn)吧,首先是伙伴分配器的數(shù)據(jù)結(jié)構(gòu):
這里的成員size表明管理內(nèi)存的總單元數(shù)目(測試用例中是32),成員longest就是二叉樹的節(jié)點標記,表明所對應的內(nèi)存塊的空閑單位,在下文中會分析這是整個算法中最精妙的設(shè)計。此處數(shù)組大小為1表明這是可以向后擴展的(注:在GCC環(huán)境下你可以寫成longest[0],不占用空間,這里是出于可移植性考慮),我們在分配器初始化的buddy2_new可以看到這種用法。
整個分配器的大小就是滿二叉樹節(jié)點數(shù)目,即所需管理內(nèi)存單元數(shù)目的2倍。一個節(jié)點對應4個字節(jié),longest記錄了節(jié)點所對應的的內(nèi)存塊大小。
內(nèi)存分配的alloc中,入?yún)⑹欠峙淦髦羔樅托枰峙涞拇笮?#xff0c;返回值是內(nèi)存塊索引。alloc函數(shù)首先將size調(diào)整到2的冪大小,并檢查是否超過最大限度。然后進行適配搜索,深度優(yōu)先遍歷,當找到對應節(jié)點后,將其longest標記為0,即分離適配的塊出來,并轉(zhuǎn)換為內(nèi)存塊索引offset返回,依據(jù)二叉樹排列序號,比如內(nèi)存總體大小32,我們找到節(jié)點下標[8],內(nèi)存塊對應大小是4,則offset = (8+1)*4-32 = 4,那么分配內(nèi)存塊就從索引4開始往后4個單位。
在函數(shù)返回之前需要回溯,因為小塊內(nèi)存被占用,大塊就不能分配了,比如下標[8]標記為0分離出來,那么其父節(jié)點下標[0]、[1]、[3]也需要相應大小的分離。將它們的longest進行折扣計算,取左右子樹較大值,下標[3]取4,下標[1]取8,下標[0]取16,表明其對應的最大空閑值。
在內(nèi)存釋放的free接口,我們只要傳入之前分配的內(nèi)存地址索引,并確保它是有效值。之后就跟alloc做反向回溯,從最后的節(jié)點開始一直往上找到longest為0的節(jié)點,即當初分配塊所適配的大小和位置。我們將longest恢復到原來滿狀態(tài)的值。繼續(xù)向上回溯,檢查是否存在合并的塊,依據(jù)就是左右子樹longest的值相加是否等于原空閑塊滿狀態(tài)的大小,如果能夠合并,就將父節(jié)點longest標記為相加的和(多么簡單!)。
上面兩個成對alloc/free接口的時間復雜度都是O(logN),保證了程序運行性能。然而這段程序設(shè)計的獨特之處就在于使用加權(quán)來標記內(nèi)存空閑狀態(tài),而不是一般的有限狀態(tài)機,實際上longest既可以表示權(quán)重又可以表示狀態(tài),狀態(tài)機就毫無必要了,所謂“少即是多”嘛!反 觀cloudwu的實現(xiàn),將節(jié)點標記為UNUSED/USED/SPLIT/FULL四個狀態(tài)機,反而會帶來額外的條件判斷和管理實現(xiàn),而且還不如數(shù)值那 樣精確。從邏輯流程上看,wuwenbin的實現(xiàn)簡潔明了如同教科書一般,特別是左右子樹的走向,內(nèi)存塊的分離合并,塊索引到節(jié)點下標的轉(zhuǎn)換都是一步到 位,不像cloudwu充斥了大量二叉樹的深度和長度的間接計算,讓代碼變得晦澀難讀,這些都是longest的功勞。一個“極簡”的設(shè)計往往在于你想不到的突破常規(guī)思維的地方。
這份代碼唯一的缺陷就是longest的大小是4字節(jié),內(nèi)存消耗大。但cloudwu的博客上有人提議用logN來保存值,這樣就能實現(xiàn)uint8_t大小了,看,又是一個“極簡”的設(shè)計!
說實話,很難在網(wǎng)上找到比這更簡約更優(yōu)雅的buddy system實現(xiàn)了——至少在Google上如此。
原文鏈接:
譯文鏈接:
轉(zhuǎn)載于:https://www.cnblogs.com/rinack/p/3368352.html
總結(jié)
以上是生活随笔為你收集整理的伙伴分配器的一个极简实现的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 宾狗便携投影仪价格怎么样?
- 下一篇: mongodb 如何删除 字段值为 js