日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > java >内容正文

java

[转]为什么Java中的HashMap默认加载因子是0.75

發布時間:2025/5/22 java 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 [转]为什么Java中的HashMap默认加载因子是0.75 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前幾天在一個群里看到有人討論hashmap中的加載因子為什么是默認0.75。

HashMap源碼中的加載因子

static final float DEFAULT_LOAD_FACTOR = 0.75f;

當時想到的是應該是“哈希沖突”和“空間利用率”矛盾的一個折衷。
跟數據結構要么查詢快要么插入快一個道理,hashmap就是一個插入慢、查詢快的數據結構。

加載因子是表示Hash表中元素的填滿的程度。
加載因子越大,填滿的元素越多,空間利用率越高,但沖突的機會加大了。
反之,加載因子越小,填滿的元素越少,沖突的機會減小,但空間浪費多了。

沖突的機會越大,則查找的成本越高。反之,查找的成本越小。

因此,必須在 "沖突的機會"與"空間利用率"之間尋找一種平衡與折衷。

哈希沖突主要與兩個因素有關,(1)填裝因子,填裝因子是指哈希表中已存入的數據元素個數與哈希地址空間的大小的比值,a=n/m ; a越小,沖突的可能性就越小,相反則沖突可能性較大;但是a越小空間利用率也就越小,a越大,空間利用率越高,為了兼顧哈希沖突和存儲空間利用率,通常將a控制在0.6-0.9之間,而.net中的HashTable則直接將a的最大值定義為0.72 (雖然微軟官方MSDN中聲明HashTable默認填裝因子為1.0,但實際上都是0.72的倍數),(2)與所用的哈希函數有關,如果哈希函數得當,就可以使哈希地址盡可能的均勻分布在哈希地址空間上,從而減少沖突的產生,但一個良好的哈希函數的得來很大程度上取決于大量的實踐,不過幸好前人已經總結實踐了很多高效的哈希函數,可以參考大神Lucifer文章:數據結構:HashTable: http://www.cnblogs.com/lucifer1982/archive/2008/06/18/1224319.html


但是為什么一定是0.75?而不是0.8,0.6

本著不嫌事大的精神繼續深挖,在此之前先簡單補充點本文需要的基礎知識:

1.沖突定義:假設哈希表的地址集為[0,n),沖突是指由關鍵字得到的哈希地址為j(0<=j<=n-1)的位置上已經有記錄。在關鍵字得到的哈希地址上已經有記錄,那么就稱之為沖突。

2.處理沖突:就是為該關鍵字的記錄扎到另一個“空”的哈希地址。即在處理哈希地址的沖突時,若得到的另一個哈希地址H1仍然發生沖突,則再求下一個地址H2,若H2仍然沖突,再求的H3,直至Hk不發生沖突為止,則Hk為記錄在表中的地址。


處理沖突的幾種方法:

一、 開放定址法

Hi=(H(key) + di) MOD m i=1,2,...k(k<=m-1)其中H(key)為哈希函數;m為哈希表表長;di為增量序列。

開放定址法根據步長不同可以分為3種:

1)線性探查法(Linear Probing):di=1,2,3,...,m-1
  簡單地說就是以當前沖突位置為起點,步長為1循環查找,直到找到一個空的位置就把元素插進去,循環完了都找不到說明容器滿了。就像你去一條街上的店里吃飯,問了第一家被告知滿座,然后挨著一家家去問是否有位置一樣。

2)線性補償探測法:di=Q 下一個位置滿足 Hi=(H(key) + Q) mod m i=1,2,...k(k<=m-1) ,要求 Q 與 m 是互質的,以便能探測到哈希表中的所有單元。
繼續用上面的例子,現在你不是挨著一家家去問了,拿出計算器算了一下,然后隔Q家問一次有沒有位置。

3)偽隨機探測再散列:di=偽隨機數序列。還是那個例子,這是完全根據心情去選一家店來問了

缺點:

  • 這種方法建立起來的hash表當沖突多的時候數據容易堆聚在一起,這時候對查找不友好;
  • 刪除結點不能簡單地將被刪結 點的空間置為空,否則將截斷在它之后填人散列表的同義詞結點的查找路徑。因此在 用開放地址法處理沖突的散列表上執行刪除操作,只能在被刪結點上做刪除標記,而不能真正刪除結點
  • 當空間滿了,還要建立一個溢出表來存多出來的元素。

二、再哈希法

Hi = RHi(key),i=1,2,...k
RHi均是不同的哈希函數,即在同義詞產生地址沖突時計算另一個哈希函數地址,直到不發生沖突為止。這種方法不易產生聚集,但是增加了計算時間。

缺點:增加了計算時間。

三、建立一個公共溢出區

假設哈希函數的值域為[0,m-1],則設向量HashTable[0...m-1]為基本表,每個分量存放一個記錄,另設立向量OverTable[0....v]為溢出表。所有關鍵字和基本表中關鍵字為同義詞的記錄,不管他們由哈希函數得到的哈希地址是什么,一旦發生沖突,都填入溢出表。

簡單地說就是搞個新表存沖突的元素。

四、鏈地址法(拉鏈法)

將所有關鍵字為同義詞的記錄存儲在同一線性鏈表中,也就是把沖突位置的元素構造成鏈表。

拉鏈法的優點:

  • 拉鏈法處理沖突簡單,且無堆積現象,即非同義詞決不會發生沖突,因此平均查找長度較短;
  • 由于拉鏈法中各鏈表上的結點空間是動態申請的,故它更適合于造表前無法確定表長的情況;
  • 在用拉鏈法構造的散列表中,刪除結點的操作易于實現。只要簡單地刪去鏈表上相應的結點即可。

拉鏈法的缺點:

  • 指針需要額外的空間,故當結點規模較小時,開放定址法較為節省空間,而若將節省的指針空間用來擴大散列表的規模,可使裝填因子變小,這又減少了開放定址法中的沖突,從而提高平均查找速度

Java中HashMap的數據結構

HashMap實際上是一個“鏈表散列”的數據結構,即數組和鏈表的結合體。

HashMap數據結構,來源于網絡

看圖就可以知道Java中的hashMap使用了拉鏈法處理沖突。
HashMap有一個初始容量大小,默認是16

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

為了減少沖突的概率,當hashMap的數組長度到了一個臨界值就會觸發擴容,把所有元素rehash再放到擴容后的容器中,這是一個非常耗時的操作。

而這個臨界值由【加載因子】和當前容器的容量大小來確定:DEFAULT_INITIAL_CAPACITY*DEFAULT_LOAD_FACTOR ,即默認情況下是16x0.75=12時,就會觸發擴容操作。

所以使用hash容器時盡量預估自己的數據量來設置初始值。具體代碼實現自行去研究HashMap的源碼。

基礎知識補充完畢,回到正題,為什么加載因子要默認是0.75?
從hashmap源碼注釋里找到了這一段

Ideally, under random hashCodes, the frequency of

  • nodes in bins follows a Poisson distribution
  • (http://en.wikipedia.org/wiki/Poisson_distribution) with a
  • parameter of about 0.5 on average for the default resizing
  • threshold of 0.75, although with a large variance because of
  • resizing granularity. Ignoring variance, the expected
  • occurrences of list size k are (exp(-0.5) * pow(0.5, k) /
  • factorial(k)). The first values are:
  • 0: 0.60653066
  • 1: 0.30326533
  • 2: 0.07581633
  • 3: 0.01263606
  • 4: 0.00157952
  • 5: 0.00015795
  • 6: 0.00001316
  • 7: 0.00000094
  • 8: 0.00000006
  • more: less than 1 in ten million

注意wiki鏈接中的關鍵字:Poisson_distribution
泊淞分布啊

簡單翻譯一下就是在理想情況下,使用隨機哈希碼,節點出現的頻率在hash桶中遵循泊松分布,同時給出了桶中元素個數和概率的對照表。

從上面的表中可以看到當桶中元素到達8個的時候,概率已經變得非常小,也就是說用0.75作為加載因子,每個碰撞位置的鏈表長度超過8個是幾乎不可能的。

好了,再深挖就要挖到統計學那邊去了,就此打住,重申一下使用hash容器請盡量指定初始容量,且是2的冪次方。

關于泊淞分布的知識請看

http://www.ruanyifeng.com/blog/2015/06/poisson-distribution.html#comment-356111



作者:Eric新之助
鏈接:https://www.jianshu.com/p/dff8f4641814
來源:簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。

轉載于:https://www.cnblogs.com/DarrenChan/p/8854859.html

總結

以上是生活随笔為你收集整理的[转]为什么Java中的HashMap默认加载因子是0.75的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 中国av一级片 | 白浆在线 | 日韩中文字幕免费在线观看 | 欧美一区 | 国产伦精品一区二区三区四区免费 | 91国内视频 | 亚洲一区二区视频在线 | 久久久人体 | 四虎影库永久在线 | 丰满人妻av一区二区三区 | 久久久久久久久久一级 | 粉豆av| 天天想你在线观看完整版电影免费 | 九九爱精品视频 | 老司机性视频 | 久草毛片| 日韩视频在线一区二区 | 欧美成人一区二区视频 | 99热97| 同性色老头性xxxx老头 | 91热热| 中文字幕乱码人妻无码久久 | www.av网| www.五月天婷婷 | 91在线不卡 | 天天干夜夜撸 | 实拍女处破www免费看 | 欧美午夜精品久久久久久浪潮 | 少妇喷水在线观看 | 久久久久久久久久久99 | 久草老司机 | 免费观看a级片 | 肉色欧美久久久久久久免费看 | 成人欧美一区二区三区黑人孕妇 | 91成年人视频 | 黄色三级生活片 | 好妞色妞国产在线视频 | 欧美三极片 | 久久在线免费观看视频 | 丰满人妻一区二区三区免费视频 | 国产精品8888 | 日本老年老熟无码 | 激情六月丁香 | 国产精品va在线观看无码 | 欧美a∨ | 国产欧美视频一区 | 日韩干 | 欧美最猛黑人xxxx黑人猛交 | 女人裸体免费网站 | 日本少妇videos高潮 | 日韩亚洲精品在线 | 免费av网站在线播放 | 久久久久久av | 女生喷液视频 | 日韩精品极品视频 | 色av中文字幕 | 欧日韩视频 | 免费看黄色小视频 | 天天操天天操天天操天天操 | 日韩黄大片 | 看91| 禁网站在线观看免费视频 | 一区二区激情视频 | 色噜噜影院 | 男人的天堂在线 | 日本少妇xxxx | 日日摸天天爽天天爽视频 | 日本三级日本三级日本三级极 | 国产嫩草视频 | 激情自拍视频 | 国产在线视频福利 | 9色在线视频 | 三度诱惑免费版电影在线观看 | 伊人焦久影院 | 亚洲第一二三区 | 日本h在线观看 | 亚洲欧美高清在线 | 超碰在线超碰 | 免费观看黄色一级视频 | 青草视屏 | 在线看黄免费 | 欧美另类视频在线观看 | 狠狠操夜夜 | 成年人黄色一级片 | 国产一区二区片 | 男女草逼视频 | 国产精品久久久久久久久动漫 | 久久久久人妻精品色欧美 | 亚洲高清视频在线 | 天天干夜夜怕 | 国产精品国产三级国产播12软件 | 亚洲成人生活片 | 黄色不卡| 变态 另类 国产 亚洲 | 亚洲夜夜操 | 日韩黄色免费视频 | 亚洲欧美激情视频 | 成人黄色在线网站 | 777米奇影视第四色 五月丁香久久婷婷 |