背景
看ArrayList源碼時,無意中看到ArrayList的初始化容量大小為10,這就奇怪了!我們都知道ArrayList和HashMap底層都是基于數(shù)組的,但為什么ArrayList不像用HashMap那樣用16作為初始容量大小,而是采用10呢?
于是各方查找資料,求證了這個問題,這篇文章就給大家講講。
為什么HashMap的初始化容量為16?
在聊ArrayList的初始化容量時,要先來回顧一下HashMap的初始化容量。這里以Java 8源碼為例,HashMap中的相關(guān)因素有兩個:初始化容量及裝載因子:
/** * The default initial capacity – MUST be a power of two. */static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16/** * The load factor used when none specified in constructor. */static final float DEFAULT_LOAD_FACTOR = 0.75f;
在HashMap當(dāng)中,數(shù)組的默認(rèn)初始化容量為16,當(dāng)數(shù)據(jù)填充到默認(rèn)容量的0.75時,就會進(jìn)行2倍擴(kuò)容。當(dāng)然,使用者也可以在初始化時傳入指定大小。但需要注意的是,最好是2的n次方的數(shù)值,如果未設(shè)置為2的n次方,HashMap也會將其轉(zhuǎn)化,反而多了一步操作。
關(guān)于HashMap的實(shí)現(xiàn)原理的內(nèi)容,這里就不再贅述,網(wǎng)絡(luò)上已經(jīng)有太多文章講這個了。有一點(diǎn)我們需要知道的是HashMap計(jì)算Key值坐標(biāo)的算法,也就是通過對Key值進(jìn)行Hash,進(jìn)而映射到數(shù)組中的坐標(biāo)。
此時,保證HashMap的容量是2的n次方,那么在hash運(yùn)算時就可以采用位運(yùn)行直接對內(nèi)存進(jìn)行操作,無需轉(zhuǎn)換成十進(jìn)制,效率會更高。
通常,可以認(rèn)為,HashMap之所以采用2的n次方,同時默認(rèn)值為16,有以下方面的考量:
- 減少hash碰撞;
- 提高M(jìn)ap查詢效率;
- 分配過小防止頻繁擴(kuò)容;
- 分配過大浪費(fèi)資源;
總之,HashMap之所以采用16作為默認(rèn)值,是為了減少hash碰撞,同時提升效率。
ArrayList的初始化容量是10嗎?
下面,先來確認(rèn)一下ArrayList的初始化容量是不是10,然后在討論為什么是這個值。
先來看看Java 8中,ArrayList初始化容量的源碼:
/** * Default initial capacity. */private static final int DEFAULT_CAPACITY = 10;
很明顯,默認(rèn)的容器初始化值為10。而且從JDK1.2到JDK1.6,這個值也始終都為10。
從JDK1.7開始,在初始化ArrayList的時候,默認(rèn)值初始化為空數(shù)組:
/** * Shared empty array instance used for default sized empty instances. We * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when * first element is added. */ private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {}; /** * Constructs an empty list with an initial capacity of ten. */ public ArrayList() { this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA; }
此處肯定有朋友說,Java 8中ArrayList默認(rèn)初始化大小為0,不是10。而且還會發(fā)現(xiàn)構(gòu)造方法上的注釋有一些奇怪:構(gòu)造一個初始容量10的空列表。什么鬼?明明是空的啊!
保留疑問,先來看一下ArrayList的add方法:
public boolean add(E e) { ensureCapacityInternal(size + 1); // Increments modCount!! elementData[size++] = e; return true; }
在add方法中調(diào)用了ensureCapacityInternal方法,進(jìn)入該方法一開始是一個空容器所以size=0傳入的minCapacity=1:
private void ensureCapacityInternal(int minCapacity) { ensureExplicitCapacity(calculateCapacity(elementData, minCapacity)); }
上述方法中先通過calculateCapacity來計(jì)算容量:
private static int calculateCapacity(Object[] elementData, int minCapacity) { if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) { return Math.max(DEFAULT_CAPACITY, minCapacity); } return minCapacity; }
會發(fā)現(xiàn)minCapacity被重新賦值為10 (DEFAULT_CAPACITY=10),傳入ensureExplicitCapacity(minCapacity);這minCapacity=10,下面是方法體:
private void ensureExplicitCapacity(int minCapacity) { modCount++; // overflow-conscious code if (minCapacity – elementData.length > 0) grow(minCapacity); } private void grow(int minCapacity) { // overflow-conscious code int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); if (newCapacity – minCapacity 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); }
上述代碼中g(shù)row方法是用來處理擴(kuò)容的,將容量擴(kuò)容為原來的1.5倍。
了解上面的處理流程,我們會發(fā)現(xiàn),本質(zhì)上ArrayList的初始化容量還是10,只不過使用懶加載而已,這是Java 8為了節(jié)省內(nèi)存而進(jìn)行的優(yōu)化而已。所以,自始至終,ArrayList的初始化容量都是10。
這里再多提一下懶加載的好處,當(dāng)有成千上萬的ArrayList存在程序當(dāng)中,10個對象的默認(rèn)大小意味著在創(chuàng)建時為底層數(shù)組分配10個指針(40 或80字節(jié))并用空值填充它們,一個空數(shù)組(用空值填充)占用大量內(nèi)存。如果能夠延遲初始化數(shù)組,那么就能夠節(jié)省大量的內(nèi)存空間。Java 8的改動就是出于上述目的。
為什么ArrayList的初始化容量為10?
最后,我們來探討一下為什么ArrayList的初始化容量為10。其實(shí),可以說沒有為什么,就是“感覺”10挺好的,不大不小,剛剛好,眼緣!
首先,在討論HashMap的時候,我們說到HashMap之所以選擇2的n次方,更多的是考慮到hash算法的性能與碰撞等問題。這個問題對于ArrayList的來說并不存在。ArrayList只是一個簡單的增長陣列,不用考慮算法層面的優(yōu)化。只要超過一定的值,進(jìn)行增長即可。所以,理論上來講ArrayList的容量是任何正值即可。
ArrayList的文檔中并沒有說明為什么選擇10,但很大的可能是出于性能損失與空間損失之間的最佳匹配考量。10,不是很大,也不是很小,不會浪費(fèi)太多的內(nèi)存空間,也不會折損太多性能。
如果非要問當(dāng)初到底為什么選擇10,可能只有問問這段代碼的作者“Josh Bloch”了吧。
如果你仔細(xì)觀察,還會發(fā)現(xiàn)一些其他有意思的初始化容量數(shù)字:
ArrayList-10Vector-10HashSet-16HashMap-16HashTable-11
ArrayList與Vector初始化容量一樣,為10;HashSet、HashMap初始化容量一樣,為16;而HashTable獨(dú)獨(dú)使用11,又是一個很有意思的問題。
小結(jié)
有很多問題是沒有明確原因、明確的答案的。就好像一個女孩兒對你沒感覺,可能是因?yàn)槟悴粔蚝?,也可能是她已?jīng)愛上別人了,但也有很大可能你是不會知道答案。但在尋找原因和答案的過程中,還是能夠?qū)W到很多,成長很多的。沒有對比就沒有傷害,比如HashMap與ArrayList的對比,沒有對比就不知道是否適合,還比如HashMap與ArrayList。當(dāng)然,你還可以試試特立獨(dú)行的HashTable,或許適合你呢。