ConcurrentHashMap的实现原理和源码分析
原文鏈接:http://www.jianshu.com/p/7f42ba895a64
前言
在Java1.5中,并發(fā)編程大師Doug Lea給我們帶來了concurrent包,而該包中提供的ConcurrentHashMap是線程安全并且高效的HashMap,本節(jié)我們就來研究下ConcurrentHashMap是如何保證線程安全的同時(shí)又能高效的操作。
1.為何用ConcurrentHashMap
在并發(fā)編程中使用HashMap可能會(huì)導(dǎo)致死循環(huán),而使用線程安全的HashTable效率又低下。
線程不安全的HashMap
在多線程環(huán)境下,使用HashMap進(jìn)行put操作會(huì)引起死循環(huán),導(dǎo)致CPU利用率接近100%,所以在并發(fā)情況下不能使用HashMap,如以下代碼會(huì)導(dǎo)致死循環(huán):
final HashMap<String, String> map = new HashMap<String, String>(2); Thread t = new Thread(new Runnable() {@Overridepublic void run() {for (int i = 0; i < 10000; i++) {new Thread(new Runnable() {@Overridepublic void run() {map.put(UUID.randomUUID().toString(), "");}}, "moon" + i).start();}} }, "ftf"); t.start(); t.join();HashMap在并發(fā)執(zhí)行put操作是會(huì)引起死循環(huán),是因?yàn)槎嗑€程會(huì)導(dǎo)致HashMap的Entry鏈表形成環(huán)形數(shù)據(jù)結(jié)構(gòu),一旦形成環(huán)形數(shù)據(jù)結(jié)構(gòu),Entry的next節(jié)點(diǎn)永遠(yuǎn)不為空,就會(huì)產(chǎn)生死循環(huán)。
效率低下的HashTable
HashTable使用synchronized來保證線程的安全,但是在線程競(jìng)爭(zhēng)激烈的情況下HashTable的效率非常低下。當(dāng)一個(gè)線程訪問HashTable的同步方法,其他方法訪問HashTable的同步方法時(shí),會(huì)進(jìn)入阻塞或者輪詢狀態(tài)。如果線程1使用put進(jìn)行元素添加,線程2不但不能用put方法添加于元素同是也無法用get方法來獲取元素,所以競(jìng)爭(zhēng)越激烈效率越低。
ConcurrentHashMap的鎖分段技術(shù)
HashTable容器在競(jìng)爭(zhēng)激烈的并發(fā)環(huán)境效率低下的原因是所有訪問HashTable的線程都必須競(jìng)爭(zhēng)同一把鎖,假如容器有多把鎖,每一把鎖用于鎖住容器中一部分?jǐn)?shù)據(jù),那么多線程訪問容器里不同數(shù)據(jù)段的數(shù)據(jù)時(shí),線程間就不會(huì)存在鎖競(jìng)爭(zhēng),從而可以有效提高并發(fā)訪問率,這就是ConcurrentHashMap的鎖分段技術(shù)。將數(shù)據(jù)分成一段一段的存儲(chǔ),然后給每一段數(shù)據(jù)配一把鎖,當(dāng)一個(gè)線程占用鎖訪問其中一段數(shù)據(jù)的時(shí)候,其他段的數(shù)據(jù)也能被其他線程訪問。
2.Java1.6的ConcurrentHashMap的結(jié)構(gòu)
首先來看看 Java1.6中ConcurrentHashMap的類圖:
ConcurrentHashMap是由Segment數(shù)組結(jié)構(gòu)和HashEntry數(shù)組結(jié)構(gòu)組成。Segment是一種可重入鎖ReentrantLock,在ConcurrentHashMap里扮演鎖的角色,HashEntry則用于存儲(chǔ)鍵值對(duì)數(shù)據(jù)。一個(gè)ConcurrentHashMap里包含一個(gè)Segment數(shù)組,Segment的結(jié)構(gòu)和HashMap類似,是一種數(shù)組和鏈表結(jié)構(gòu), 一個(gè)Segment里包含一個(gè)HashEntry數(shù)組,每個(gè)HashEntry是一個(gè)鏈表結(jié)構(gòu)的元素, 每個(gè)Segment守護(hù)者一個(gè)HashEntry數(shù)組里的元素,當(dāng)對(duì)HashEntry數(shù)組的數(shù)據(jù)進(jìn)行修改時(shí),必須首先獲得它對(duì)應(yīng)的Segment鎖。
3.java1.8的ConcurrentHashMap源碼分析
重要的內(nèi)部類
從Java1.7 版本開始 ConcurrentHashMap 不再采用 Segment 實(shí)現(xiàn),而是改用 Node,Node 是一個(gè)鏈表的結(jié)構(gòu),每個(gè)節(jié)點(diǎn)可以引用到下一個(gè)節(jié)點(diǎn)(next)。
Node類
Node是最核心的內(nèi)部類,包裝了key-value鍵值對(duì),所有插入ConcurrentHashMap的數(shù)據(jù)都包裝在這里面。
它與HashMap中的定義很相似,但是有一些差別它對(duì)value和next屬性設(shè)置了volatile同步鎖,它不允許調(diào)用setValue方法直接改變Node的value域,它增加了find方法輔助map.get()方法。TreeNode類
樹節(jié)點(diǎn)類,另外一個(gè)核心的數(shù)據(jù)結(jié)構(gòu)。 當(dāng)鏈表長(zhǎng)度過長(zhǎng)的時(shí)候,會(huì)轉(zhuǎn)換為TreeNode。
但是與HashMap不相同的是,它并不是直接轉(zhuǎn)換為紅黑樹,而是把這些結(jié)點(diǎn)包裝成TreeNode放在TreeBin對(duì)象中,由TreeBin完成對(duì)紅黑樹的包裝。
而且TreeNode在ConcurrentHashMap繼承自Node類,而并非HashMap中的集成自LinkedHashMap.EntryTreeBin
這個(gè)類并不負(fù)責(zé)包裝用戶的key、value信息,而是包裝的很多TreeNode節(jié)點(diǎn)。它代替了TreeNode的根節(jié)點(diǎn),也就是說在實(shí)際的ConcurrentHashMap“數(shù)組”中,存放的是TreeBin對(duì)象,而不是TreeNode對(duì)象,這是與HashMap的區(qū)別。ForwardingNode
一個(gè)用于連接兩個(gè)table的節(jié)點(diǎn)類。它包含一個(gè)nextTable指針,用于指向下一張表。而且這個(gè)節(jié)點(diǎn)的key value next指針全部為null,它的hash值為-1.
這里面定義的find的方法是從nextTable里進(jìn)行查詢節(jié)點(diǎn),而不是以自身為頭節(jié)點(diǎn)進(jìn)行查找
構(gòu)造函數(shù)
public ConcurrentHashMap() {}public ConcurrentHashMap(int initialCapacity) {if (initialCapacity < 0)throw new IllegalArgumentException();int cap = ((initialCapacity >= (MAXIMUM_CAPACITY >>> 1)) ?MAXIMUM_CAPACITY :tableSizeFor(initialCapacity + (initialCapacity >>> 1) + 1));this.sizeCtl = cap;}public ConcurrentHashMap(Map<? extends K, ? extends V> m) {this.sizeCtl = DEFAULT_CAPACITY;putAll(m);}public ConcurrentHashMap(int initialCapacity, float loadFactor) {this(initialCapacity, loadFactor, 1);}public ConcurrentHashMap(int initialCapacity,float loadFactor, int concurrencyLevel) {if (!(loadFactor > 0.0f) || initialCapacity < 0 || concurrencyLevel <= 0)throw new IllegalArgumentException();if (initialCapacity < concurrencyLevel) // Use at least as many binsinitialCapacity = concurrencyLevel; // as estimated threadslong size = (long)(1.0 + (long)initialCapacity / loadFactor);int cap = (size >= (long)MAXIMUM_CAPACITY) ?MAXIMUM_CAPACITY : tableSizeFor((int)size);this.sizeCtl = cap;}Java1.8版本的 ConcurrentHashMap 在構(gòu)造函數(shù)中不會(huì)初始化 Node 數(shù)組,而是第一次 put 操作的時(shí)候初始化。
整個(gè) Map 第一次 put 的時(shí)候,map 中用于存放數(shù)據(jù)的 Node[] 還是null。
Unsafe與CAS
在ConcurrentHashMap中,大量使用了U.compareAndSwapXXX的方法,這個(gè)方法是利用一個(gè)CAS算法實(shí)現(xiàn)無鎖化的修改值的操作,他可以大大降低鎖代理的性能消耗。這個(gè)算法的基本思想就是不斷地去比較當(dāng)前內(nèi)存中的變量值與你指定的一個(gè)變量值是否相等,如果相等,則接受你指定的修改的值,否則拒絕你的操作。因?yàn)楫?dāng)前線程中的值已經(jīng)不是最新的值,你的修改很可能會(huì)覆蓋掉其他線程修改的結(jié)果。這一點(diǎn)與樂觀鎖,SVN的思想是比較類似的。
unsafe代碼塊控制了一些屬性的修改工作,比如最常用的SIZECTL 。 在這一版本的concurrentHashMap中,大量應(yīng)用來的CAS方法進(jìn)行變量、屬性的修改工作。 利用CAS進(jìn)行無鎖操作,可以大大提高性能。
初始化函數(shù)initTable
調(diào)用ConcurrentHashMap的構(gòu)造方法僅僅是設(shè)置了一些參數(shù)而已,而整個(gè)table的初始化是在向ConcurrentHashMap中插入元素的時(shí)候發(fā)生的。如調(diào)用put、computeIfAbsent、compute、merge等方法的時(shí)候,調(diào)用時(shí)機(jī)是檢查table==null。
初始化方法主要應(yīng)用了關(guān)鍵屬性sizeCtl 如果這個(gè)值 < 0,表示其他線程正在進(jìn)行初始化,就放棄這個(gè)操作。
在這也可以看出ConcurrentHashMap的初始化只能由一個(gè)線程完成。如果獲得了初始化權(quán)限,就用CAS方法將sizeCtl置為-1,防止其他線程進(jìn)入。初始化數(shù)組后,將sizeCtl的值改為0.75*n
sizeCtl含義
1.負(fù)數(shù)代表正在進(jìn)行初始化或擴(kuò)容操作
2.-1代表正在初始化
3.-N 表示有N-1個(gè)線程正在進(jìn)行擴(kuò)容操作
4.正數(shù)或0代表hash表還沒有被初始化,這個(gè)數(shù)值表示初始化或下一次進(jìn)行擴(kuò)容的大小,這一點(diǎn)類似于擴(kuò)容閾值的概念。還后面可以看到,它的值始終是當(dāng)前ConcurrentHashMap容量的0.75倍,這與loadfactor是對(duì)應(yīng)的。
擴(kuò)容方法transfer
支持多線程進(jìn)行擴(kuò)容操作,并沒有加鎖 ,這樣做的目的不僅僅是為了滿足concurrent的要求,而是希望利用并發(fā)處理去減少擴(kuò)容帶來的時(shí)間影響。
單線程擴(kuò)容的大體思想就是遍歷、復(fù)制的過程。首先根據(jù)運(yùn)算得到需要遍歷的次數(shù)i,然后利用tabAt方法獲得i位置的元素:
多線程遍歷節(jié)點(diǎn),處理了一個(gè)節(jié)點(diǎn),就把對(duì)應(yīng)點(diǎn)的值set為forward,另一個(gè)線程看到forward,就向后繼續(xù)遍歷,再加上給節(jié)點(diǎn)上鎖的機(jī)制,就完成了多線程的控制。這樣交叉就完成了復(fù)制工作。而且還很好的解決了線程安全的問題。
put函數(shù)
put方法依然沿用HashMap的put方法的思想,根據(jù)hash值計(jì)算這個(gè)新插入的點(diǎn)在table中的位置i,如果i位置是空的,直接放進(jìn)去,否則進(jìn)行判斷,如果i位置是樹節(jié)點(diǎn),按照樹的方式插入新的節(jié)點(diǎn),否則把i插入到鏈表的末尾。ConcurrentHashMap中依然沿用這個(gè)思想,有一個(gè)最重要的不同點(diǎn)就是ConcurrentHashMap不允許key或value為null值。另外由于涉及到多線程,put方法就要復(fù)雜一點(diǎn)。在多線程中可能有以下兩個(gè)情況:
整體流程就是首先定義不允許key或value為null的情況放入 對(duì)于每一個(gè)放入的值,首先利用spread方法對(duì)key的hashcode進(jìn)行一次hash計(jì)算,由此來確定這個(gè)值在table中的位置。如果這個(gè)位置是空的,那么直接放入,而且不需要加鎖操作。
如果這個(gè)位置存在結(jié)點(diǎn),說明發(fā)生了hash碰撞,首先判斷這個(gè)節(jié)點(diǎn)的類型。如果是鏈表節(jié)點(diǎn)(fh>0),則得到的結(jié)點(diǎn)就是hash值相同的節(jié)點(diǎn)組成的鏈表的頭節(jié)點(diǎn)。需要依次向后遍歷確定這個(gè)新加入的值所在位置。如果遇到hash值與key值都與新加入節(jié)點(diǎn)是一致的情況,則只需要更新value值即可。否則依次向后遍歷,直到鏈表尾插入這個(gè)結(jié)點(diǎn)。 如果加入這個(gè)節(jié)點(diǎn)以后鏈表長(zhǎng)度大于8,就把這個(gè)鏈表轉(zhuǎn)換成紅黑樹。如果這個(gè)節(jié)點(diǎn)的類型已經(jīng)是樹節(jié)點(diǎn)的話,直接調(diào)用樹節(jié)點(diǎn)的插入方法進(jìn)行插入新的值。
協(xié)助擴(kuò)容函數(shù)helpTransfer
這是一個(gè)協(xié)助擴(kuò)容的方法。這個(gè)方法被調(diào)用的時(shí)候,當(dāng)前ConcurrentHashMap一定已經(jīng)有了nextTable對(duì)象,首先拿到這個(gè)nextTable對(duì)象,調(diào)用上面講到的transfer方法來進(jìn)行擴(kuò)容。
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {Node<K,V>[] nextTab; int sc;if (tab != null && (f instanceof ForwardingNode) &&(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {int rs = resizeStamp(tab.length);//計(jì)算一個(gè)操作校驗(yàn)碼while (nextTab == nextTable && table == tab &&(sc = sizeCtl) < 0) {if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||sc == rs + MAX_RESIZERS || transferIndex <= 0)break;if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {transfer(tab, nextTab);break;}}return nextTab;}return table; }紅黑樹轉(zhuǎn)換
在putVal函數(shù)中,treeifyBin是在鏈表長(zhǎng)度達(dá)到一定閾值(8)后轉(zhuǎn)換成紅黑樹的函數(shù)。 但是并不是直接轉(zhuǎn)換,而是進(jìn)行一次容量判斷,如果容量沒有達(dá)到轉(zhuǎn)換的要求,直接進(jìn)行擴(kuò)容操作并返回;如果滿足條件才將鏈表的結(jié)構(gòu)轉(zhuǎn)換為TreeBin ,這與HashMap不同的是,它并沒有把TreeNode直接放入紅黑樹,而是利用了TreeBin這個(gè)小容器來封裝所有的TreeNode。
private final void treeifyBin(Node<K,V>[] tab, int index) {Node<K,V> b; int n, sc;if (tab != null) {if ((n = tab.length) < MIN_TREEIFY_CAPACITY)tryPresize(n << 1);else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {synchronized (b) {if (tabAt(tab, index) == b) {TreeNode<K,V> hd = null, tl = null;for (Node<K,V> e = b; e != null; e = e.next) {TreeNode<K,V> p =new TreeNode<K,V>(e.hash, e.key, e.val,null, null);if ((p.prev = tl) == null)hd = p;elsetl.next = p;tl = p;}setTabAt(tab, index, new TreeBin<K,V>(hd));}}}} }get方法
給定一個(gè)key來確定value的時(shí)候,必須滿足兩個(gè)條件 key相同 hash值相同,對(duì)于節(jié)點(diǎn)可能在鏈表或樹上的情況,需要分別去查找。
public V get(Object key) {Node<K,V>[] tab; Node<K,V> e, p; int n, eh; K ek;//計(jì)算hash值int h = spread(key.hashCode());//根據(jù)hash值確定節(jié)點(diǎn)位置if ((tab = table) != null && (n = tab.length) > 0 &&(e = tabAt(tab, (n - 1) & h)) != null) {//如果搜索到的節(jié)點(diǎn)key與傳入的key相同且不為null,直接返回這個(gè)節(jié)點(diǎn) if ((eh = e.hash) == h) {if ((ek = e.key) == key || (ek != null && key.equals(ek)))return e.val;}//如果eh<0 說明這個(gè)節(jié)點(diǎn)在樹上 直接尋找else if (eh < 0)return (p = e.find(h, key)) != null ? p.val : null;//否則遍歷鏈表 找到對(duì)應(yīng)的值并返回while ((e = e.next) != null) {if (e.hash == h &&((ek = e.key) == key || (ek != null && key.equals(ek))))return e.val;}}return null; }總結(jié)
以上是生活随笔為你收集整理的ConcurrentHashMap的实现原理和源码分析的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hibernate的openSessio
- 下一篇: ConcurrentLinkedQueu