作為一名程序員,你面試的時候肯定被問過HashMap
這個知識點,它的基本實現(xiàn)原理是每個面試者都該掌握的,當(dāng)我們熟練的掌握了HashMap
的內(nèi)部實現(xiàn)原理。面對面試官的詢問,就能應(yīng)答自如,接下來小編將帶大家了解 JDK7
版本的 HashMap
基礎(chǔ)及其實現(xiàn)原理。
一、 HashMap介紹
HashMap簡介:
HashMap
是一個散列表,它存儲的內(nèi)容是鍵值對(key-value)映射。
HashMap
繼承于AbstractMap
,實現(xiàn)了Map
、Cloneable
、java.io.Serializable
接口。
HashMap
的實現(xiàn)不是同步的,這意味著它不是線程安全的。它的key
、value
都可以為null
。此外,HashMap
中的映射不是有序的。
HashMap
的實例有兩個參數(shù)影響其性能:“初始容量” 和 “加載因子”。容量 是哈希表中桶的數(shù)量,初始容量 只是哈希表在創(chuàng)建時的容量。加載因子 是哈希表在其容量自動增加之前可以達到多滿的一種尺度。當(dāng)哈希表中的條目數(shù)超出了加載因子與當(dāng)前容量的乘積時,則要對該哈希表進行rehash
操作(即重建內(nèi)部數(shù)據(jù)結(jié)構(gòu)),從而哈希表將具有大約兩倍的桶數(shù)。
通常,默認(rèn)加載因子是 0.75, 這是在時間和空間成本上尋求一種折衷。加載因子過高雖然減少了空間開銷,但同時也增加了查詢成本(在大多數(shù) HashMap
類的操作中,包括 get
和 put
操作,都反映了這一點)。在設(shè)置初始容量時應(yīng)該考慮到映射中所需的條目數(shù)及其加載因子,以便最大限度地減少 rehash
操作次數(shù)。如果初始容量大于最大條目數(shù)除以加載因子,則不會發(fā)生 rehash
操作。
HashMap的繼承關(guān)系:
HashMap與Map關(guān)系如下圖:
HashMap的構(gòu)造函數(shù)
HashMap共有4個構(gòu)造函數(shù),如下:
// 默認(rèn)構(gòu)造函數(shù)。
HashMap()
// 指定“容量大小”的構(gòu)造函數(shù)
HashMap(int capacity)
// 指定“容量大小”和“加載因子”的構(gòu)造函數(shù)
HashMap(int capacity, float loadFactor)
// 包含“子Map”的構(gòu)造函數(shù)
HashMap(Map<? extends K, ? extends V> map)
二、JDK7 中 HashMap 底層原理
HashMap
在 JDK7
或者 JDK8
中采用的基本存儲結(jié)構(gòu)都是數(shù)組+鏈表形式。本節(jié)主要是研究 HashMap
在 JDK7
中的底層實現(xiàn),其基本結(jié)構(gòu)圖如下所示:
上圖中左邊橙色區(qū)域是哈希表,右邊藍色區(qū)域為鏈表,鏈表中的元素類型為 Entry
,它包含四個屬性分別是:
- K key
- V value
- int hash
- Entry next
那么為什么會出現(xiàn)數(shù)組+鏈表形式的存儲結(jié)構(gòu)呢?這里簡單地闡述一下,后續(xù)將以源碼的形式詳細(xì)介紹。 我們在使用 HashMap.put("Key", "Value")
方法存儲數(shù)據(jù)的時候,底層實際是將key
和 value
以 Entry
的形式存儲到哈希表中,哈希表是一個數(shù)組,那么它是如何將一個 Entry
對象存儲到數(shù)組中呢?是如何確定當(dāng)前 key
和 value
組成的 Entry
該存到數(shù)組的哪個位置上,換句話說是如何確定 Entry
對象在數(shù)組中的索引的呢?通常情況下,我們在確定數(shù)組的時候,都是在數(shù)組中挨個存儲數(shù)據(jù),直到數(shù)組全滿,然后考慮數(shù)組的擴容,而 HashMap
并不是這么操作的。在 Java
及大多數(shù)面向?qū)ο蟮木幊陶Z言中,每個對象都有一個整型變量 hashcode
,這個 hashcode
是一個很重要的標(biāo)識,它標(biāo)識著不同的對象,有了這個 hashcode
,那么就很容易確定 Entry
對象的下標(biāo)索引了,在 Java
語言中,可以理解 hashcode
轉(zhuǎn)化為數(shù)組下標(biāo)是按照數(shù)組長度取模運算的,基本公式如下所示:
int index = HashCode(key) % Array.length
實際上,在 JDK
中哈希函數(shù)并沒有直接采取取模運算,而是利用了位運算的方式來提高性能,在這里我們理解為簡單的取模運算。 我們知道了對 Key
進行哈希運算然后對數(shù)組長度進行取模就可以得到當(dāng)前 Entry
對象在數(shù)組中的下標(biāo),那么我們可以一直調(diào)用 HashMap
的put
方法持續(xù)存儲數(shù)據(jù)到數(shù)組中。但是存在一種現(xiàn)象,那就是根據(jù)不同的 Key
計算出來的結(jié)果有可能會完全相同,這種現(xiàn)象叫作“哈希沖突”。既然出現(xiàn)了哈希沖突,那么發(fā)生沖突的這個數(shù)據(jù)該如何存儲呢?哈希沖突其實是無法避免的一個事實,既然無法避免,那么就應(yīng)該想辦法來解決這個問題,目前常用的方法主要是兩種,一種是開放尋址法,另外一種是鏈表法。 開放尋址法是原理比較簡單,就是在數(shù)組里面“另謀高就”,嘗試尋找下一個空檔位置。而鏈表法則不是尋找下一個空檔位置,而是繼續(xù)在當(dāng)前沖突的地方存儲,與現(xiàn)有的數(shù)據(jù)組成鏈表,以鏈表的形式進行存儲。HashMap
的存儲形式是數(shù)組+鏈表就是采用的鏈表法來解決哈希沖突問題的。具體的詳細(xì)說明請繼續(xù)往下看。 在日常開發(fā)中,開發(fā)者對于 HashMap
使用的最多的就是它的構(gòu)造方法、put
方法以及get
方法了,下面就開始詳細(xì)地從這三個方法出發(fā),深入理解HashMap
的實現(xiàn)原理。
三、HashMap put、get 方法流程圖
這里提供一個 HashMap
的 put
方法存儲數(shù)據(jù)的流程圖供讀者參考:
這里提供一個 HashMap
的 get
方法獲取數(shù)據(jù)的流程圖供讀者參考:
上面中 get
流程圖畫得稍微比正常的要復(fù)雜一些,只是為了描述流程更加清晰。
四、常見的 HashMap 的迭代方式
在實際開發(fā)過程中,我們對于 HashMap
的迭代遍歷也是常見的操作,HashMap
的迭代遍歷常用方式有如下幾種:
- 方式一:迭代器模式
Map<String, String> map = new HashMap<>(16);
Iterator<Map.Entry<String, String>> iterator = map.entrySet().iterator();
while (iterator.hasNext()) {
Map.Entry<String, String> next = iterator.next();
System.out.println(next.getKey() + ":" + next.getValue());
}
- 方式二:遍歷 Set>方式
Map<String, String> map = new HashMap<>(16);
for (Map.Entry<String, String> entry : map.entrySet()) {
System.out.println(entry.getKey() + ":" + entry.getValue());
}
- 方式三:forEach 方式(JDK8 特性,lambda)
Map<String, String> map = new HashMap<>(16);
map.forEach((key, value) -> System.out.println(key + ":" + value));
- 方式四:keySet 方式
Map<String, String> map = new HashMap<>(16);
Iterator<String> keyIterator = map.keySet().iterator();
while (keyIterator.hasNext()) {
String key = keyIterator.next();
System.out.println(key + ":" + map.get(key));
}
(推薦微課:Java微課)
把這四種方式進行比較,前三種其實屬于同一種,都是迭代器遍歷方式,如果要同時使用到 key
和 value
,推薦使用前三種方式,如果僅僅使用到 key
,那么推薦使用第四種。
文章來源:www.toutiao.com/a6862688709423137294/
以上就是W3Cschool編程獅
關(guān)于hashmap底層原理的相關(guān)介紹了,希望對大家有所幫助。