App下載

給面試官講解hashmap底層原理后,他表示很看好我

猿友 2020-08-20 17:40:03 瀏覽數(shù) (4303)
反饋

作為一名程序員,你面試的時候肯定被問過HashMap這個知識點,它的基本實現(xiàn)原理是每個面試者都該掌握的,當(dāng)我們熟練的掌握了HashMap 的內(nèi)部實現(xiàn)原理。面對面試官的詢問,就能應(yīng)答自如,接下來小編將帶大家了解 JDK7 版本的 HashMap基礎(chǔ)及其實現(xiàn)原理。

一、 HashMap介紹

HashMap簡介: HashMap 是一個散列表,它存儲的內(nèi)容是鍵值對(key-value)映射。 HashMap 繼承于AbstractMap,實現(xiàn)了MapCloneable、java.io.Serializable接口。 HashMap 的實現(xiàn)不是同步的,這意味著它不是線程安全的。它的key、value都可以為null。此外,HashMap中的映射不是有序的。 HashMap 的實例有兩個參數(shù)影響其性能:“初始容量” 和 “加載因子”。容量 是哈希表中桶的數(shù)量,初始容量 只是哈希表在創(chuàng)建時的容量。加載因子 是哈希表在其容量自動增加之前可以達到多滿的一種尺度。當(dāng)哈希表中的條目數(shù)超出了加載因子與當(dāng)前容量的乘積時,則要對該哈希表進行rehash操作(即重建內(nèi)部數(shù)據(jù)結(jié)構(gòu)),從而哈希表將具有大約兩倍的桶數(shù)。 通常,默認(rèn)加載因子是 0.75, 這是在時間和空間成本上尋求一種折衷。加載因子過高雖然減少了空間開銷,但同時也增加了查詢成本(在大多數(shù) HashMap 類的操作中,包括 getput 操作,都反映了這一點)。在設(shè)置初始容量時應(yīng)該考慮到映射中所需的條目數(shù)及其加載因子,以便最大限度地減少 rehash 操作次數(shù)。如果初始容量大于最大條目數(shù)除以加載因子,則不會發(fā)生 rehash 操作。

HashMap的繼承關(guān)系:

HashMap的繼承關(guān)系

HashMap與Map關(guān)系如下圖

HashMap與Map關(guān)系

HashMap的構(gòu)造函數(shù)

HashMap共有4個構(gòu)造函數(shù),如下:

// 默認(rèn)構(gòu)造函數(shù)。
HashMap()
// 指定“容量大小”的構(gòu)造函數(shù)
HashMap(int capacity)
// 指定“容量大小”和“加載因子”的構(gòu)造函數(shù)
HashMap(int capacity, float loadFactor)
// 包含“子Map”的構(gòu)造函數(shù)
HashMap(Map<? extends K, ? extends V> map)

二、JDK7 中 HashMap 底層原理

HashMapJDK7 或者 JDK8 中采用的基本存儲結(jié)構(gòu)都是數(shù)組+鏈表形式。本節(jié)主要是研究 HashMapJDK7 中的底層實現(xiàn),其基本結(jié)構(gòu)圖如下所示:

HashMap基本結(jié)構(gòu)圖

上圖中左邊橙色區(qū)域是哈希表,右邊藍色區(qū)域為鏈表,鏈表中的元素類型為 Entry,它包含四個屬性分別是:

  • K key
  • V value
  • int hash
  • Entry next

那么為什么會出現(xiàn)數(shù)組+鏈表形式的存儲結(jié)構(gòu)呢?這里簡單地闡述一下,后續(xù)將以源碼的形式詳細(xì)介紹。 我們在使用 HashMap.put("Key", "Value")方法存儲數(shù)據(jù)的時候,底層實際是將keyvalueEntry的形式存儲到哈希表中,哈希表是一個數(shù)組,那么它是如何將一個 Entry 對象存儲到數(shù)組中呢?是如何確定當(dāng)前 keyvalue 組成的 Entry 該存到數(shù)組的哪個位置上,換句話說是如何確定 Entry 對象在數(shù)組中的索引的呢?通常情況下,我們在確定數(shù)組的時候,都是在數(shù)組中挨個存儲數(shù)據(jù),直到數(shù)組全滿,然后考慮數(shù)組的擴容,而 HashMap 并不是這么操作的。在 Java 及大多數(shù)面向?qū)ο蟮木幊陶Z言中,每個對象都有一個整型變量 hashcode,這個 hashcode 是一個很重要的標(biāo)識,它標(biāo)識著不同的對象,有了這個 hashcode,那么就很容易確定 Entry 對象的下標(biāo)索引了,在 Java 語言中,可以理解 hashcode 轉(zhuǎn)化為數(shù)組下標(biāo)是按照數(shù)組長度取模運算的,基本公式如下所示:

int index = HashCode(key) % Array.length

實際上,在 JDK 中哈希函數(shù)并沒有直接采取取模運算,而是利用了位運算的方式來提高性能,在這里我們理解為簡單的取模運算。 我們知道了對 Key 進行哈希運算然后對數(shù)組長度進行取模就可以得到當(dāng)前 Entry 對象在數(shù)組中的下標(biāo),那么我們可以一直調(diào)用 HashMapput 方法持續(xù)存儲數(shù)據(jù)到數(shù)組中。但是存在一種現(xiàn)象,那就是根據(jù)不同的 Key 計算出來的結(jié)果有可能會完全相同,這種現(xiàn)象叫作“哈希沖突”。既然出現(xiàn)了哈希沖突,那么發(fā)生沖突的這個數(shù)據(jù)該如何存儲呢?哈希沖突其實是無法避免的一個事實,既然無法避免,那么就應(yīng)該想辦法來解決這個問題,目前常用的方法主要是兩種,一種是開放尋址法,另外一種是鏈表法。 開放尋址法是原理比較簡單,就是在數(shù)組里面“另謀高就”,嘗試尋找下一個空檔位置。而鏈表法則不是尋找下一個空檔位置,而是繼續(xù)在當(dāng)前沖突的地方存儲,與現(xiàn)有的數(shù)據(jù)組成鏈表,以鏈表的形式進行存儲。HashMap 的存儲形式是數(shù)組+鏈表就是采用的鏈表法來解決哈希沖突問題的。具體的詳細(xì)說明請繼續(xù)往下看。 在日常開發(fā)中,開發(fā)者對于 HashMap 使用的最多的就是它的構(gòu)造方法、put 方法以及get 方法了,下面就開始詳細(xì)地從這三個方法出發(fā),深入理解HashMap 的實現(xiàn)原理。

三、HashMap put、get 方法流程圖

這里提供一個 HashMapput 方法存儲數(shù)據(jù)的流程圖供讀者參考:

put 方法存儲數(shù)據(jù)的流程圖

這里提供一個 HashMapget 方法獲取數(shù)據(jù)的流程圖供讀者參考:

 get 方法獲取數(shù)據(jù)的流程圖

上面中 get 流程圖畫得稍微比正常的要復(fù)雜一些,只是為了描述流程更加清晰。

四、常見的 HashMap 的迭代方式

在實際開發(fā)過程中,我們對于 HashMap 的迭代遍歷也是常見的操作,HashMap 的迭代遍歷常用方式有如下幾種:

  • 方式一:迭代器模式

Map<String, String> map = new HashMap<>(16);
Iterator<Map.Entry<String, String>> iterator = map.entrySet().iterator();
while (iterator.hasNext()) {
    Map.Entry<String, String> next = iterator.next();
    System.out.println(next.getKey() + ":" + next.getValue());
}

  • 方式二:遍歷 Set>方式

Map<String, String> map = new HashMap<>(16);
for (Map.Entry<String, String> entry : map.entrySet()) {
    System.out.println(entry.getKey() + ":" + entry.getValue());
}

  • 方式三:forEach 方式(JDK8 特性,lambda)

Map<String, String> map = new HashMap<>(16);
map.forEach((key, value) -> System.out.println(key + ":" + value));

  • 方式四:keySet 方式

Map<String, String> map = new HashMap<>(16);
Iterator<String> keyIterator = map.keySet().iterator();
while (keyIterator.hasNext()) {
    String key = keyIterator.next();
    System.out.println(key + ":" + map.get(key));
}

(推薦微課:Java微課

把這四種方式進行比較,前三種其實屬于同一種,都是迭代器遍歷方式,如果要同時使用到 keyvalue,推薦使用前三種方式,如果僅僅使用到 key,那么推薦使用第四種。

文章來源:www.toutiao.com/a6862688709423137294/

以上就是W3Cschool編程獅關(guān)于hashmap底層原理的相關(guān)介紹了,希望對大家有所幫助。

0 人點贊