HashMap除了死迴圈之外,還有什麼問題?

語言: CN / TW / HK

「這是我參與2022首次更文挑戰的第1天,活動詳情檢視:2022首次更文挑戰」。

本篇的這個問題是一個開放性問題,HashMap 除了死迴圈之外,還有其他什麼問題?總體來說 HashMap 的所有“問題”,都是因為使用(HashMap)不當才導致的,這些問題大致可以分為兩類:

  1. 程式問題:比如 HashMap 在 JDK 1.7 中,併發插入時可能會發生死迴圈或資料覆蓋的問題。
  2. 業務問題:比如 HashMap 無序性造成查詢結果和預期結果不相符的問題。

接下來我們一個一個來看。

1.死迴圈問題

死迴圈問題發生在 JDK 1.7 版本中,形成的原因是 JDK 1.7 HashMap 使用的是頭插法,那麼在併發擴容時可能就會導致死迴圈的問題,具體產生的過程如下流程所示。 HashMap 正常情況下的擴容實現如下圖所示: image.png 舊 HashMap 的節點會依次轉移到新 HashMap 中,舊 HashMap 轉移的順序是 A、B、C,而新 HashMap 使用的是頭插法,所以最終在新 HashMap 中的順序是 C、B、A,也就是上圖展示的那樣。有了這些前置知識之後,咱們來看死迴圈是如何誕生的?

1.1 死迴圈執行流程一

死迴圈是因為併發 HashMap 擴容導致的,併發擴容的第一步,執行緒 T1 和執行緒 T2 要對 HashMap 進行擴容操作,此時 T1 和 T2 指向的是連結串列的頭結點元素 A,而 T1 和 T2 的下一個節點,也就是 T1.next 和 T2.next 指向的是 B 節點,如下圖所示: image.png

1.2 死迴圈執行流程二

死迴圈的第二步操作是,執行緒 T2 時間片用完進入休眠狀態,而執行緒 T1 開始執行擴容操作,一直到執行緒 T1 擴容完成後,執行緒 T2 才被喚醒,擴容之後的場景如下圖所示: image.png 從上圖可知執行緒 T1 執行之後,因為是頭插法,所以 HashMap 的順序已經發生了改變,但執行緒 T2 對於發生的一切是不可知的,所以它的指向元素依然沒變,如上圖展示的那樣,T2 指向的是 A 元素,T2.next 指向的節點是 B 元素。

1.3 死迴圈執行流程三

當執行緒 T1 執行完,而執行緒 T2 恢復執行時,死迴圈就建立了,如下圖所示: image.png 因為 T1 執行完擴容之後 B 節點的下一個節點是 A,而 T2 執行緒指向的首節點是 A,第二個節點是 B,這個順序剛好和 T1 擴完容完之後的節點順序是相反的。T1 執行完之後的順序是 B 到 A,而 T2 的順序是 A 到 B,這樣 A 節點和 B 節點就形成死迴圈了,這就是 HashMap 死迴圈導致的原因。

1.4 解決方案

使用執行緒安全的容器來替代 HashMap,比如 ConcurrentHashMap 或 Hashtable,因為 ConcurrentHashMap 的效能遠高於 Hashtable,因此推薦使用 ConcurrentHashMap 來替代 HashMap。

2.資料覆蓋問題

資料覆蓋問題發生在併發新增元素的場景下,它不止出現在 JDK 1.7 版本中,其他版本中也存在此問題,資料覆蓋產生的流程如下:

  1. 執行緒 T1 進行新增時,判斷某個位置可以插入元素,但還沒有真正的進行插入操作,自己時間片就用完了。
  2. 執行緒 T2 也執行新增操作,並且 T2 產生的雜湊值和 T1 相同,也就是 T2 即將要儲存的位置和 T1 相同,因為此位置尚未插入值(T1 執行緒執行了一半),於是 T2 就把自己的值存入到當前位置了。
  3. T1 恢復執行之後,因為非空判斷已經執行完了,它感知不到此位置已經有值了,於是就把自己的值也插入到了此位置,那麼 T2 的值就被覆蓋了。

具體執行流程如下圖所示。

2.1 資料覆蓋執行流程一

執行緒 T1 準備將資料 k1:v1 插入到 Null 處,但還沒有真正的執行,自己的時間片就用完了,進入休眠狀態了,如下圖所示: image.png

2.2 資料覆蓋執行流程二

執行緒 T2 準備將資料 k2:v2 插入到 Null 處,因為此處現在並未有值,如果此處有值的話,它會使用鏈式法將資料插入到下一個沒值的位置上,但判斷之後發現此處並未有值,那麼就直接進行資料插入了,如下圖所示: image.png

2.3 資料覆蓋執行流程三

執行緒 T2 執行完成之後,執行緒 T1 恢復執行,因為執行緒 T1 之前已經判斷過此位置沒值了,所以會直接插入,此時執行緒 T2 插入的值就被覆蓋了,如下圖所示: image.png

2.4 解決方案

解決方案和第一個解決方案相同,使用 ConcurrentHashMap 來替代 HashMap 就可以解決此問題了。

3.無序性問題

這裡的無序性問題指的是 HashMap 新增和查詢的順序不一致,導致程式執行的結果和程式設計師預期的結果不相符,如以下程式碼所示: java HashMap<String, String> map = new HashMap<>(); // 新增元素 for (int i = 1; i <= 5; i++) { map.put("2022-10-" + i, "Hello,Java:" + i); } // 查詢元素 map.forEach((k, v) -> { System.out.println(k + ":" + v); }); 我們新增的順序: image.png 我們期望查詢的順序和新增的順序是一致的,然而以上程式碼輸出的結果卻是: image.png 執行結果和我們預期結果不相符,這就是 HashMap 的無序性問題。我們期望輸出的結果是 Hello,Java 1、2、3、4、5,而得到的順序卻是 2、1、4、3、5。

解決方案

想要解決 HashMap 無序問題,我們只需要將 HashMap 替換成 LinkedHashMap 就可以了,如下程式碼所示: java LinkedHashMap<String, String> map = new LinkedHashMap<>(); // 新增元素 for (int i = 1; i <= 5; i++) { map.put("2022-10-" + i, "Hello,Java:" + i); } // 查詢元素 map.forEach((k, v) -> { System.out.println(k + ":" + v); }); 以上程式的執行結果如下圖所示: image.png

總結

本文演示了 3 個 HashMap 的經典問題,其中死迴圈和資料覆蓋是發生在併發新增元素時,而無序問題是新增元素的順序和查詢的順序不一致的問題,這些問題本質來說都是對 HashMap 使用不當才會造成的問題,比如在多執行緒情況下就應該使用 ConcurrentHashMap,想要保證插入順序和查詢順序一致就應該使用 LinkedHashMap,但剛開始時我們對 HashMap 不熟悉,所以才會造成這些問題,不過了解了它們之後,就能更好的使用它和更好的應對面試了。 ​

是非審之於己,譭譽聽之於人,得失安之於數。

公眾號:Java面試真題解析

文章合集:https://gitee.com/mydb/interview