ArrayList和LinkedList使用不当,性能差距会如此之大!
前言
在面試的時(shí)候,經(jīng)常會(huì)被問(wèn)到幾個(gè)問(wèn)題:
ArrayList和LinkedList的區(qū)別,相信大部分朋友都能回答上:
ArrayList是基于數(shù)組實(shí)現(xiàn),LinkedList是基于鏈表實(shí)現(xiàn)
當(dāng)隨機(jī)訪問(wèn)List時(shí),ArrayList比LinkedList的效率更高,等等
當(dāng)被問(wèn)到ArrayList和LinkedList的使用場(chǎng)景是什么時(shí),大部分朋友的答案可能是:
ArrayList和LinkedList在新增、刪除元素時(shí),LinkedList的效率要高于 ArrayList,而在遍歷的時(shí)候,ArrayList的效率要高于LinkedList
那這個(gè)回答是否準(zhǔn)確呢?今天我們就來(lái)研究研究!
?
源碼分析
ArrayList
實(shí)現(xiàn)類(lèi)
public?class?ArrayList<E>?extends?AbstractList<E>implements?List<E>,?RandomAccess,?Cloneable,?java.io.SerializableArrayList實(shí)現(xiàn)了List接口,繼承了AbstractList抽象類(lèi),底層是數(shù)組實(shí)現(xiàn)的,并且實(shí)現(xiàn)了自增擴(kuò)容數(shù)組大小。
ArrayList還實(shí)現(xiàn)了Cloneable接口和Serializable接口,所以他可以實(shí)現(xiàn)克隆和序列化。
ArrayList還實(shí)現(xiàn)了RandomAccess接口,這個(gè)接口是一個(gè)標(biāo)志接口,他標(biāo)志著“只要實(shí)現(xiàn)該接口的List類(lèi),都能實(shí)現(xiàn)快速隨機(jī)訪問(wèn)”。
基本屬性
ArrayList屬性主要由數(shù)組長(zhǎng)度size、對(duì)象數(shù)組elementData、初始化容量default_capacity等組成, 其中初始化容量默認(rèn)大小為10。
//默認(rèn)初始化容量 private?static?final?int?DEFAULT_CAPACITY?=?10; //對(duì)象數(shù)組 transient?Object[]?elementData;? //數(shù)組長(zhǎng)度 private?int?size;從ArrayList屬性來(lái)看,elementData被關(guān)鍵字transient修飾了,transient關(guān)鍵字修飾該字段則表示該屬性不會(huì)被序列化。
但ArrayList其實(shí)是實(shí)現(xiàn)了序列化接口,這是為什么呢?
由于ArrayList的數(shù)組是基于動(dòng)態(tài)擴(kuò)增的,所以并不是所有被分配的內(nèi)存空間都存儲(chǔ)了數(shù)據(jù)。
如果采用外部序列化法實(shí)現(xiàn)數(shù)組的序列化,會(huì)序列化整個(gè)數(shù)組,ArrayList為了避免這些沒(méi)有存儲(chǔ)數(shù)據(jù)的內(nèi)存空間被序列化,內(nèi)部提供了兩個(gè)私有方法writeObject以及readObject來(lái)自我完成序列化與反序列化,從而在序列化與反序列化數(shù)組時(shí)節(jié)省了空間和時(shí)間。
因此使用transient修飾數(shù)組,是防止對(duì)象數(shù)組被其他外部方法序列化。
ArrayList自定義序列化方法如下:
初始化
有三種初始化辦法:無(wú)參數(shù)直接初始化、指定大小初始化、指定初始數(shù)據(jù)初始化,源碼如下:
當(dāng)ArrayList新增元素時(shí),如果所存儲(chǔ)的元素已經(jīng)超過(guò)其已有大小,它會(huì)計(jì)算元素大小后再進(jìn)行動(dòng)態(tài)擴(kuò)容,數(shù)組的擴(kuò)容會(huì)導(dǎo)致整個(gè)數(shù)組進(jìn)行一次內(nèi)存復(fù)制。
因此,我們?cè)诔跏蓟疉rrayList時(shí),可以通過(guò)第一個(gè)構(gòu)造函數(shù)合理指定數(shù)組初始大小,這樣有助于減少數(shù)組的擴(kuò)容次數(shù),從而提高系統(tǒng)性能。
注意點(diǎn):
ArrayList 無(wú)參構(gòu)造器初始化時(shí),默認(rèn)大小是空數(shù)組,并不是大家常說(shuō)的 10,10 是在第一次 add 的時(shí)候擴(kuò)容的數(shù)組值。
新增元素
ArrayList新增元素的方法有兩種,一種是直接將元素加到數(shù)組的末尾,另外一種是添加元素到任意位置。
?public?boolean?add(E?e)?{ensureCapacityInternal(size?+?1);??//?Increments?modCount!!elementData[size++]?=?e;return?true;}public?void?add(int?index,?E?element)?{rangeCheckForAdd(index);ensureCapacityInternal(size?+?1);??//?Increments?modCount!!System.arraycopy(elementData,?index,?elementData,?index?+?1,size?-?index);elementData[index]?=?element;size++;}兩個(gè)方法的相同之處是在添加元素之前,都會(huì)先確認(rèn)容量大小,如果容量夠大,就不用進(jìn)行擴(kuò)容;如果容量不夠大,就會(huì)按照原來(lái)數(shù)組的1.5倍大小進(jìn)行擴(kuò)容,在擴(kuò)容之后需要將數(shù)組復(fù)制到新分配的內(nèi)存地址。
下面是具體的源碼:
這兩個(gè)方法也有不同之處,添加元素到任意位置,會(huì)導(dǎo)致在該位置后的所有元素都需要重新排列,而將元素添加到數(shù)組的末尾,在沒(méi)有發(fā)生擴(kuò)容的前提下,是不會(huì)有元素復(fù)制排序過(guò)程的。
所以ArrayList在大量新增元素的場(chǎng)景下效率不一定就很慢的
如果我們?cè)诔跏蓟瘯r(shí)就比較清楚存儲(chǔ)數(shù)據(jù)的大小,就可以在ArrayList初始化時(shí)指定數(shù)組容量大小,并且在添加元素時(shí),只在數(shù)組末尾添加元素,那么ArrayList在大量新增元素的場(chǎng)景下,性能并不會(huì)變差,反而比其他List集合的性能要好。
刪除元素
ArrayList 刪除元素有很多種方式,比如根據(jù)數(shù)組索引刪除、根據(jù)值刪除或批量刪除等等,原理和思路都差不多。
ArrayList在每一次有效的刪除元素操作之后,都要進(jìn)行數(shù)組的重組,并且刪除的元素位置越靠前,數(shù)組重組的開(kāi)銷(xiāo)就越大。
我們選取根據(jù)值刪除方式來(lái)進(jìn)行源碼說(shuō)明:
遍歷元素
由于ArrayList是基于數(shù)組實(shí)現(xiàn)的,所以在獲取元素的時(shí)候是非常快捷的。
public?E?get(int?index)?{rangeCheck(index);return?elementData(index);}E?elementData(int?index)?{return?(E)?elementData[index];}LinkedList
LinkedList是基于雙向鏈表數(shù)據(jù)結(jié)構(gòu)實(shí)現(xiàn)的。
這個(gè)雙向鏈表結(jié)構(gòu),鏈表中的每個(gè)節(jié)點(diǎn)都可以向前或者向后追溯,有幾個(gè)概念如下:
鏈表每個(gè)節(jié)點(diǎn)我們叫做 Node,Node 有 prev 屬性,代表前一個(gè)節(jié)點(diǎn)的位置,next 屬性,代表后一個(gè)節(jié)點(diǎn)的位置;
first 是雙向鏈表的頭節(jié)點(diǎn),它的前一個(gè)節(jié)點(diǎn)是 null。
last 是雙向鏈表的尾節(jié)點(diǎn),它的后一個(gè)節(jié)點(diǎn)是 null;
當(dāng)鏈表中沒(méi)有數(shù)據(jù)時(shí),first 和 last 是同一個(gè)節(jié)點(diǎn),前后指向都是 null;
因?yàn)槭莻€(gè)雙向鏈表,只要機(jī)器內(nèi)存足夠強(qiáng)大,是沒(méi)有大小限制的。
Node結(jié)構(gòu)中包含了3個(gè)部分:元素內(nèi)容item、前指針prev以及后指針next,代碼如下。
private?static?class?Node<E>?{E?item;//?節(jié)點(diǎn)值Node<E>?next;?//?指向的下一個(gè)節(jié)點(diǎn)Node<E>?prev;?//?指向的前一個(gè)節(jié)點(diǎn)//?初始化參數(shù)順序分別是:前一個(gè)節(jié)點(diǎn)、本身節(jié)點(diǎn)值、后一個(gè)節(jié)點(diǎn)Node(Node<E>?prev,?E?element,?Node<E>?next)?{this.item?=?element;this.next?=?next;this.prev?=?prev;} }LinkedList就是由Node結(jié)構(gòu)對(duì)象連接而成的一個(gè)雙向鏈表。
實(shí)現(xiàn)類(lèi)
LinkedList類(lèi)實(shí)現(xiàn)了List接口、Deque接口,同時(shí)繼承了AbstractSequentialList抽象類(lèi),LinkedList既實(shí)現(xiàn)了List類(lèi)型又有Queue類(lèi)型的特點(diǎn);LinkedList也實(shí)現(xiàn)了Cloneable和Serializable接口,同ArrayList一樣,可以實(shí)現(xiàn)克隆和序列化。
由于LinkedList存儲(chǔ)數(shù)據(jù)的內(nèi)存地址是不連續(xù)的,而是通過(guò)指針來(lái)定位不連續(xù)地址,因此,LinkedList不支持隨機(jī)快速訪問(wèn),LinkedList也就不能實(shí)現(xiàn)RandomAccess接口。
public?class?LinkedListextends?AbstractSequentialListimplements?List,?Deque,?Cloneable,?java.io.Serializable基本屬性
transient?int?size?=?0; transient?Node?first; transient?Node?last;我們可以看到這三個(gè)屬性都被transient修飾了,原因很簡(jiǎn)單,我們?cè)谛蛄谢臅r(shí)候不會(huì)只對(duì)頭尾進(jìn)行序列化,所以LinkedList也是自行實(shí)現(xiàn)readObject和writeObject進(jìn)行序列化與反序列化。
下面是LinkedList自定義序列化的方法。
節(jié)點(diǎn)查詢(xún)
鏈表查詢(xún)某一個(gè)節(jié)點(diǎn)是比較慢的,需要挨個(gè)循環(huán)查找才行,我們看看 LinkedList 的源碼是如何尋找節(jié)點(diǎn)的:
LinkedList 并沒(méi)有采用從頭循環(huán)到尾的做法,而是采取了簡(jiǎn)單二分法,首先看看 index 是在鏈表的前半部分,還是后半部分。
如果是前半部分,就從頭開(kāi)始尋找,反之亦然。通過(guò)這種方式,使循環(huán)的次數(shù)至少降低了一半,提高了查找的性能。
新增元素
LinkedList添加元素的實(shí)現(xiàn)很簡(jiǎn)潔,但添加的方式卻有很多種。
默認(rèn)的add (Ee)方法是將添加的元素加到隊(duì)尾,首先是將last元素置換到臨時(shí)變量中,生成一個(gè)新的Node節(jié)點(diǎn)對(duì)象,然后將last引用指向新節(jié)點(diǎn)對(duì)象,之前的last對(duì)象的前指針指向新節(jié)點(diǎn)對(duì)象。
LinkedList也有添加元素到任意位置的方法,如果我們是將元素添加到任意兩個(gè)元素的中間位置,添加元素操作只會(huì)改變前后元素的前后指針,指針將會(huì)指向添加的新元素,所以相比ArrayList的添加操作來(lái)說(shuō),LinkedList的性能優(yōu)勢(shì)明顯。
刪除元素
在LinkedList刪除元素的操作中,我們首先要通過(guò)循環(huán)找到要?jiǎng)h除的元素,如果要?jiǎng)h除的位置處于List的前半段,就從前往后找;若其位置處于后半段,就從后往前找。
這樣做的話,無(wú)論要?jiǎng)h除較為靠前或較為靠后的元素都是非常高效的,但如果List擁有大量元素,移除的元素又在List的中間段,那效率相對(duì)來(lái)說(shuō)會(huì)很低。
遍歷元素
LinkedList的獲取元素操作實(shí)現(xiàn)跟LinkedList的刪除元素操作基本類(lèi)似,通過(guò)分前后半段來(lái)循環(huán)查找到對(duì)應(yīng)的元素,但是通過(guò)這種方式來(lái)查詢(xún)?cè)厥欠浅5托У?#xff0c;特別是在for循環(huán)遍歷的情況下,每一次循環(huán)都會(huì)去遍歷半個(gè)List。
所以在LinkedList循環(huán)遍歷時(shí),我們可以使用iterator方式迭代循環(huán),直接拿到我們的元素,而不需要通過(guò)循環(huán)查找List。
?
分析測(cè)試
新增元素操作性能測(cè)試
測(cè)試用例源代碼:
ArrayList:https://paste.ubuntu.com/p/gktBvjgMGk/
LinkedList:https://paste.ubuntu.com/p/3jQrY2XMPr/
測(cè)試結(jié)果:
通過(guò)這組測(cè)試,我們可以知道LinkedList添加元素的效率未必要高于ArrayList。
從集合頭部位置添加元素
由于ArrayList是數(shù)組實(shí)現(xiàn)的,在添加元素到數(shù)組頭部的時(shí)候,需要對(duì)頭部以后的數(shù)據(jù)進(jìn)行復(fù)制重排,所以效率很低;
LinkedList是基于鏈表實(shí)現(xiàn),在添加元素的時(shí)候,首先會(huì)通過(guò)循環(huán)查找到添加元素的位置,如果要添加的位置處于List的前半段,就從前往后找;若其位置處于后半段,就從后往前找,因此LinkedList添加元素到頭部是非常高效的。
從集合中間位置位置添加元素
ArrayList在添加元素到數(shù)組中間時(shí),同樣有部分?jǐn)?shù)據(jù)需要復(fù)制重排,效率也不是很高;
LinkedList將元素添加到中間位置,是添加元素最低效率的,因?yàn)榭拷虚g位置,在添加元素之前的循環(huán)查找是遍歷元素最多的操作。
從集合尾部位置添加元素
而在添加元素到尾部的操作中,在沒(méi)有擴(kuò)容的情況下,ArrayList的效率要高于LinkedList。
這是因?yàn)锳rrayList在添加元素到尾部的時(shí)候,不需要復(fù)制重排數(shù)據(jù),效率非常高。
LinkedList雖然也不用循環(huán)查找元素,但LinkedList中多了new對(duì)象以及變換指針指向?qū)ο蟮倪^(guò)程,所以效率要低于ArrayList。
注意:這是排除動(dòng)態(tài)擴(kuò)容數(shù)組容量的情況下進(jìn)行的測(cè)試,如果有動(dòng)態(tài)擴(kuò)容的情況,ArrayList的效率也會(huì)降低。
刪除元素操作性能測(cè)試
ArrayList和LinkedList刪除元素操作測(cè)試的結(jié)果和添加元素操作測(cè)試的結(jié)果很接近!
結(jié)論:如果需要在List的頭部進(jìn)行大量的插入、刪除操作,那么直接選擇LinkedList。否則,ArrayList即可。
遍歷元素操作性能測(cè)試
測(cè)試用例源代碼:
ArrayList:https://paste.ubuntu.com/p/ZNWc9H2pYm/
LinkedList:https://paste.ubuntu.com/p/xSk4nHDHvN/
測(cè)試結(jié)果:
我們可以看到,LinkedList的for循環(huán)性能是最差的,而ArrayList的for循環(huán)性能是最好的。
這是因?yàn)長(zhǎng)inkedList基于鏈表實(shí)現(xiàn)的,在使用for循環(huán)的時(shí)候,每一次for循環(huán)都會(huì)去遍歷半個(gè)List,所以嚴(yán)重影響了遍歷的效率;ArrayList則是基于數(shù)組實(shí)現(xiàn)的,并且實(shí)現(xiàn)了RandomAccess接口標(biāo)志,意味著ArrayList可以實(shí)現(xiàn)快速隨機(jī)訪問(wèn),所以for循環(huán)效率非常高。
LinkedList的迭代循環(huán)遍歷和ArrayList的迭代循環(huán)遍歷性能相當(dāng),也不會(huì)太差,所以在遍歷LinkedList時(shí),我們要切忌使用for循環(huán)遍歷。
有道無(wú)術(shù),術(shù)可成;有術(shù)無(wú)道,止于術(shù)
歡迎大家關(guān)注Java之道公眾號(hào)
好文章,我在看??
總結(jié)
以上是生活随笔為你收集整理的ArrayList和LinkedList使用不当,性能差距会如此之大!的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 博客使用的CSS代码备份
- 下一篇: Python元组tuple(不可变)