回復(fù)“000”獲取大量電子書 寫在前面在面試中,HashMap基本必問,只是問法各有不同而已。曾經(jīng)我也和很多面試官聊過關(guān)于HashMap的話題,使用HashMap就能考察面試者的很多知識點(diǎn)。不幸的是,很大部分人都拜倒在HashMap的石榴裙底下。 HashMap為什么如此受面試官青睞? 我覺得其中有4個原因:
下面就是我給大家準(zhǔn)備的HashMap連環(huán)炮,這個連環(huán)炮就相當(dāng)于高考真題演練一樣,可能沒有完全一樣的,只是問法不同罷了,這個主要得益于咱們漢語博大精深。 下面是HashMap的25連環(huán)炮: 1:說說HashMap 底層數(shù)據(jù)結(jié)構(gòu)是怎樣的? 2:談一下HashMap的特性? 3:使用HashMap時,當(dāng)兩個對象的 hashCode 相同怎么辦? 4:HashMap 的哈希函數(shù)怎么設(shè)計的嗎? 5:HashMap遍歷方法有幾種? 6:為什么采用 hashcode 的高 16 位和低 16 位異或能降低 hash 碰撞?hash 函數(shù)能不能直接用 key 的 hashcode? 7:解決hash沖突的有幾種方法? 8:為什么要用異或運(yùn)算符? 9.:HashMap 的 table 的容量如何確定? 10:請解釋一下HashMap的參數(shù)loadFactor,它的作用是什么 11:說說HashMap中put方法的過程 12:當(dāng)鏈表長度 >= 8時,為什么要將鏈表轉(zhuǎn)換成紅黑樹? 13:new HashMap(18);此時HashMap初始容量為多少? 14:說說resize擴(kuò)容的過程 15:說說hashMap中g(shù)et是如何實(shí)現(xiàn)的? 16:拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹? 17:說說你對紅黑樹的了解 18:JDK8中對HashMap做了哪些改變? 19:HashMap 中的 key 我們可以使用任何類作為 key 嗎? 20:HashMap 的長度為什么是 2 的 N 次方呢? 21:HashMap,LinkedHashMap,TreeMap 有什么區(qū)別? 22:說說什么是 fail-fast? 23:HashMap 和 HashTable 有什么區(qū)別? 24:HashMap 是線程安全的嗎? 25:如何規(guī)避 HashMap 的線程不安全? 26:HashMap 和 ConcurrentHashMap 的區(qū)別? 27:為什么 ConcurrentHashMap 比 HashTable 效率要高? 28:說說 ConcurrentHashMap中 鎖機(jī)制 29:在 JDK 1.8 中,ConcurrentHashMap 為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock? 30:能對ConcurrentHashMap 做個簡單介紹嗎? 31:熟悉ConcurrentHashMap 的并發(fā)度嗎? .... java集合知識總結(jié)(需要思維導(dǎo)圖的,請加我微信tj20120622,免費(fèi)贈予) 下面我們正式開始連環(huán)炮 1、說說HashMap 底層數(shù)據(jù)結(jié)構(gòu)是怎樣的?HashMap 底層是 hash 數(shù)組和單向鏈表實(shí)現(xiàn),jdk8后采用數(shù)組+鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu)。 2、說說HashMap 的工作原理
HashMap 底層是 hash 數(shù)組和單向鏈表實(shí)現(xiàn),JDK8后采用數(shù)組+鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu)。 我們通過put和get存儲和獲取對象。當(dāng)我們給put()方法傳遞鍵和值時,先對鍵做一個hashCode()的計算來得到它在bucket數(shù)組中的位置來存儲Entry對象。當(dāng)獲取對象時,通過get獲取到bucket的位置,再通過鍵對象的equals()方法找到正確的鍵值對,然后在返回值對象。 3、使用HashMap時,當(dāng)兩個對象的 hashCode 相同怎么辦?因?yàn)镠ashCode 相同,不一定就是相等的(equals方法比較),所以兩個對象所在數(shù)組的下標(biāo)相同,"碰撞"就此發(fā)生。又因?yàn)?HashMap 使用鏈表存儲對象,這個 Node 會存儲到鏈表中。 4、HashMap 的哈希函數(shù)怎么設(shè)計的嗎?hash 函數(shù)是先拿到通過 key 的 hashCode ,是 32 位的 int 值,然后讓 hashCode 的高 16 位和低 16 位進(jìn)行異或操作。兩個好處:
5、HashMap遍歷方法有幾種?
6、為什么采用 hashcode 的高 16 位和低 16 位異或能降低 hash 碰撞?因?yàn)?key.hashCode()函數(shù)調(diào)用的是 key 鍵值類型自帶的哈希函數(shù),返回 int 型散列值。int 值范圍為**-2147483648~2147483647**,前后加起來大概 40 億的映射空間。只要哈希函數(shù)映射得比較均勻松散,一般應(yīng)用是很難出現(xiàn)碰撞的。但問題是一個 40 億長度的數(shù)組,內(nèi)存是放不下的。 設(shè)想,如果 HashMap 數(shù)組的初始大小才 16,用之前需要對數(shù)組的長度取模運(yùn)算,得到的余數(shù)才能用來訪問數(shù)組下標(biāo)。 7、解決hash沖突的有幾種方法?
8、為什么要用異或運(yùn)算符?保證了對象的 hashCode 的 32 位值只要有一位發(fā)生改變,整個 hash() 返回值就會改變。盡可能的減少碰撞。 9、HashMap 的 table 的容量如何確定?①、table 數(shù)組大小是由 capacity 這個參數(shù)確定的,默認(rèn)是16,也可以構(gòu)造時傳入,最大限制是1<<30; ②、loadFactor 是裝載因子,主要目的是用來確認(rèn)table 數(shù)組是否需要動態(tài)擴(kuò)展,默認(rèn)值是0.75,比如table 數(shù)組大小為 16,裝載因子為 0.75 時,threshold 就是12,當(dāng) table 的實(shí)際大小超過 12 時,table就需要動態(tài)擴(kuò)容; ③、擴(kuò)容時,調(diào)用 resize() 方法,將 table 長度變?yōu)樵瓉淼膬杀叮ㄗ⒁馐?table 長度,而不是 threshold); ④、如果數(shù)據(jù)很大的情況下,擴(kuò)展時將會帶來性能的損失,在性能要求很高的地方,這種損失很可能很致命。 10、請解釋一下HashMap的參數(shù)loadFactor,它的作用是什么loadFactor表示HashMap的擁擠程度,影響hash操作到同一個數(shù)組位置的概率。 默認(rèn)loadFactor等于0.75,當(dāng)HashMap里面容納的元素已經(jīng)達(dá)到HashMap數(shù)組長度的75%時,表示HashMap太擠了,需要擴(kuò)容,在HashMap的構(gòu)造器中可以定制loadFactor。 11、說說HashMap中put方法的過程由于JDK版本中HashMap設(shè)計上存在差異,這里說說JDK7和JDK8中的區(qū)別: 具體put流程,請參照下圖進(jìn)行回答: 12、當(dāng)鏈表長度 >= 8時,為什么要將鏈表轉(zhuǎn)換成紅黑樹?因?yàn)榧t黑樹的平均查找長度是log(n),長度為8的時候,平均查找長度為3,如果繼續(xù)使用鏈表,平均查找長度為8/2=4,所以,當(dāng)鏈表長度 >= 8時 ,有必要將鏈表轉(zhuǎn)換成紅黑樹。 13、new HashMap(18);此時HashMap初始容量為多少?容量為32。 在HashMap中有個靜態(tài)方法tableSizeFor ,tableSizeFor方法保證函數(shù)返回值是大于等于給定參數(shù)initialCapacity最小的2的冪次方的數(shù)值 。 static final int tableSizeFor(int cap) { 14、說說resize擴(kuò)容的過程創(chuàng)建一個新的數(shù)組,其容量為舊數(shù)組的兩倍,并重新計算舊數(shù)組中結(jié)點(diǎn)的存儲位置。結(jié)點(diǎn)在新數(shù)組中的位置只有兩種,原下標(biāo)位置或原下標(biāo)+舊數(shù)組的大小。 15、說說hashMap中g(shù)et是如何實(shí)現(xiàn)的?對key的hashCode進(jìn)行hash值計算,與運(yùn)算計算下標(biāo)獲取bucket位置,如果在桶的首位上就可以找到就直接返回,否則在樹中找或者鏈表中遍歷找,如果有hash沖突,則利用equals方法去遍歷鏈表查找節(jié)點(diǎn)。 16、拉鏈法導(dǎo)致的鏈表過深問題為什么不用二叉查找樹代替,而選擇紅黑樹?為什么不一直使用紅黑樹?之所以選擇紅黑樹是為了解決二叉查找樹的缺陷,二叉查找樹在特殊情況下會變成一條線性結(jié)構(gòu)(這就跟原來使用鏈表結(jié)構(gòu)一樣了,造成很深的問題),遍歷查找會非常慢。而紅黑樹在插入新數(shù)據(jù)后可能需要通過左旋,右旋、變色這些操作來保持平衡,引入紅黑樹就是為了查找數(shù)據(jù)快,解決鏈表查詢深度的問題,我們知道紅黑樹屬于平衡二叉樹,但是為了保持“平衡”是需要付出代價的,但是該代價所損耗的資源要比遍歷線性鏈表要少,所以當(dāng)長度大于8的時候,會使用紅黑樹,如果鏈表長度很短的話,根本不需要引入紅黑樹,引入反而會慢。 17、說說你對紅黑樹的了解紅黑樹是一種自平衡的二叉查找樹,是一種高效的查找樹。 紅黑樹通過如下的性質(zhì)定義實(shí)現(xiàn)自平衡:
18、JDK8中對HashMap做了哪些改變?1.在java 1.8中,如果鏈表的長度超過了8,那么鏈表將轉(zhuǎn)換為紅黑樹。(桶的數(shù)量必須大于64,小于64的時候只會擴(kuò)容) 2.發(fā)生hash碰撞時,java 1.7 會在鏈表的頭部插入,而java 1.8會在鏈表的尾部插入 3.在java 1.8中,Entry被Node替代(換了一個馬甲)。 19、HashMap 中的 key 我們可以使用任何類作為 key 嗎?平時可能大家使用的最多的就是使用 String 作為 HashMap 的 key,但是現(xiàn)在我們想使用某個自定 義類作為 HashMap 的 key,那就需要注意以下幾點(diǎn):
20、HashMap 的長度為什么是 2 的 N 次方呢?為了能讓 HashMap 存數(shù)據(jù)和取數(shù)據(jù)的效率高,盡可能地減少 hash 值的碰撞,也就是說盡量把數(shù) 據(jù)能均勻的分配,每個鏈表或者紅黑樹長度盡量相等。我們首先可能會想到 % 取模的操作來實(shí)現(xiàn)。下面是回答的重點(diǎn)喲:
這就是為什么 HashMap 的長度需要 2 的 N 次方了。 21、HashMap,LinkedHashMap,TreeMap 有什么區(qū)別?
22、說說什么是 fail-fast?fail-fast 機(jī)制是 Java 集合(Collection)中的一種錯誤機(jī)制。當(dāng)多個線程對同一個集合的內(nèi)容進(jìn)行 操作時,就可能會產(chǎn)生 fail-fast 事件。 例如:當(dāng)某一個線程 A 通過 iterator 去遍歷某集合的過程中,若該集合的內(nèi)容被其他線程所改變 了,那么線程 A 訪問集合時,就會拋出 ConcurrentModificationException 異常,產(chǎn)生 fail-fast 事 件。這里的操作主要是指 add、remove 和 clear,對集合元素個數(shù)進(jìn)行修改。 解決辦法 建議使用“java.util.concurrent 包下的類”去取代“java.util 包下的類”??梢赃@么理解:在遍歷之前,把 modCount 記下來 expectModCount,后面 expectModCount 去 和 modCount 進(jìn)行比較,如果不相等了,證明已并發(fā)了,被修改了,于是拋出 ConcurrentModificationException 異常。 23、HashMap 和 HashTable 有什么區(qū)別?①、HashMap 是線程不安全的,HashTable 是線程安全的; ②、由于線程安全,所以 HashTable 的效率比不上 HashMap; ③、HashMap最多只允許一條記錄的鍵為null,允許多條記錄的值為null,而 HashTable不允許; ④、HashMap 默認(rèn)初始化數(shù)組的大小為16,HashTable 為 11,前者擴(kuò)容時,擴(kuò)大兩倍,后者擴(kuò)大兩倍+1; ⑤、HashMap 需要重新計算 hash 值,而 HashTable 直接使用對象的 hashCode; 24、HashMap 是線程安全的嗎?不是,在多線程環(huán)境下,1.7 會產(chǎn)生死循環(huán)、數(shù)據(jù)丟失、數(shù)據(jù)覆蓋的問題,1.8 中會有數(shù)據(jù)覆蓋的問題,以 1.8 為例,當(dāng) A 線程判斷 index 位置為空后正好掛起,B 線程開始往 index 位置的寫入節(jié)點(diǎn)數(shù)據(jù),這時 A 線程恢復(fù)現(xiàn)場,執(zhí)行賦值操作,就把 A 線程的數(shù)據(jù)給覆蓋了;還有++size 這個地方也會造成多線程同時擴(kuò)容等問題。 25、如何規(guī)避 HashMap 的線程不安全?單線程條件下,為避免出現(xiàn)ConcurrentModificationException,需要保證只通過HashMap本身或者只通過Iterator去修改數(shù)據(jù),不能在Iterator使用結(jié)束之前使用HashMap本身的方法修改數(shù)據(jù)。因?yàn)橥ㄟ^Iterator刪除數(shù)據(jù)時,HashMap的modCount和Iterator的expectedModCount都會自增,不影響二者的相等性。如果是增加數(shù)據(jù),只能通過HashMap本身的方法完成,此時如果要繼續(xù)遍歷數(shù)據(jù),需要重新調(diào)用iterator()方法從而重新構(gòu)造出一個新的Iterator,使得新Iterator的expectedModCount與更新后的HashMap的modCount相等。 多線程條件下,可使用兩種方式:
26、HashMap 和 ConcurrentHashMap 的區(qū)別?
27、為什么 ConcurrentHashMap 比 HashTable 效率要高?HashTable:使用一把鎖(鎖住整個鏈表結(jié)構(gòu))處理并發(fā)問題,多個線程競爭一把鎖,容易阻塞; ConcurrentHashMap:
28、說說 ConcurrentHashMap中 鎖機(jī)制JDK 1.7 中,采用分段鎖的機(jī)制,實(shí)現(xiàn)并發(fā)的更新操作,底層采用數(shù)組+鏈表的存儲結(jié)構(gòu),包括兩個核心靜態(tài)內(nèi)部類 Segment 和 HashEntry。 ①、Segment 繼承 ReentrantLock(重入鎖) 用來充當(dāng)鎖的角色,每個 Segment 對象守護(hù)每個散列映射表的若干個桶; ②、HashEntry 用來封裝映射表的鍵-值對; ③、每個桶是由若干個 HashEntry 對象鏈接起來的鏈表 JDK 1.8 中,采用Node + CAS + Synchronized來保證并發(fā)安全。取消類 Segment,直接用 table 數(shù)組存儲鍵值對;當(dāng) HashEntry 對象組成的鏈表長度超過 TREEIFY_THRESHOLD 時,鏈表轉(zhuǎn)換為紅黑樹,提升性能。底層變更為數(shù)組 + 鏈表 + 紅黑樹。 29、在 JDK 1.8 中,ConcurrentHashMap 為什么要使用內(nèi)置鎖 synchronized 來代替重入鎖 ReentrantLock?①、粒度降低了; ②、JVM 開發(fā)團(tuán)隊沒有放棄 synchronized,而且基于 JVM 的 synchronized 優(yōu)化空間更大,更加自然。 ③、在大量的數(shù)據(jù)操作下,對于 JVM 的內(nèi)存壓力,基于 API 的 ReentrantLock 會開銷更多的內(nèi)存。 30、能對ConcurrentHashMap 做個簡單介紹嗎?①、重要的常量: private transient volatile int sizeCtl; 當(dāng)為負(fù)數(shù)時,-1 表示正在初始化,-N 表示 N - 1 個線程正在進(jìn)行擴(kuò)容; 當(dāng)為 0 時,表示 table 還沒有初始化; 當(dāng)為其他正數(shù)時,表示初始化或者下一次進(jìn)行擴(kuò)容的大小。 ②、數(shù)據(jù)結(jié)構(gòu): Node 是存儲結(jié)構(gòu)的基本單元,繼承 HashMap 中的 Entry,用于存儲數(shù)據(jù); TreeNode 繼承 Node,但是數(shù)據(jù)結(jié)構(gòu)換成了二叉樹結(jié)構(gòu),是紅黑樹的存儲結(jié)構(gòu),用于紅黑樹中存儲數(shù)據(jù); TreeBin 是封裝 TreeNode 的容器,提供轉(zhuǎn)換紅黑樹的一些條件和鎖的控制。 ③、存儲對象時(put() 方法):
④、擴(kuò)容方法 transfer():默認(rèn)容量為 16,擴(kuò)容時,容量變?yōu)樵瓉淼膬杀??! elpTransfer():調(diào)用多個工作線程一起幫助進(jìn)行擴(kuò)容,這樣的效率就會更高。 ⑤、獲取對象時(get()方法):
31、熟悉ConcurrentHashMap 的并發(fā)度嗎?程序運(yùn)行時能夠同時更新 ConccurentHashMap 且不產(chǎn)生鎖競爭的最大線程數(shù)。默認(rèn)為 16,且可以在構(gòu)造函數(shù)中設(shè)置。當(dāng)用戶設(shè)置并發(fā)度時,ConcurrentHashMap 會使用大于等于該值的最小2冪指數(shù)作為實(shí)際并發(fā)度(假如用戶設(shè)置并發(fā)度為17,實(shí)際并發(fā)度則為32)。 參考:http:///gFInl 總結(jié)好了,就寫這么多了,文章中很多已經(jīng)不是HashMap知識點(diǎn)了,但,面試很有可能會問這些知識點(diǎn),多準(zhǔn)備點(diǎn)也算是有備無患。
|
|