源碼分析之ArrayList
ArrayList 是我們常用的集合類,是基于數組實現的。不同于數組的是 ArrayList 可以動態擴容。
類結構
ArrayList 是 Java 集合框架 List 接口的一個實現類。提供了一些操作數組元素的方法。
實現 List 接口同時,也實現了 RandomAccess , Cloneable , java.io.Serializable 。
ArrayList 繼承與 AbstractList 。
類成員
elementData
transient Object[] elementData;
elementData 是用于保存數據的數組,是 ArrayList 類的基礎。
elementData 是被關鍵字 transient 修飾的。我們知道被 transient 修飾的變量,是不會參與對象序列化和發序列化操作的。而我們知道 ArrayList 實現了 java.io.Serializable ,這就表明 ArrayList 是可序列化的類,這里貌似出現了矛盾。
ArrayList 在序列化和反序列化的過程中,有兩個值得關注的方法: writeObject 和 readObject :
privatevoidwriteObject(java.io.ObjectOutputStream s)
throws java.io.IOException{
// Write out element count, and any hidden stuff
int expectedModCount = modCount;
s.defaultWriteObject();
// Write out size as capacity for behavioural compatibility with clone()
s.writeInt(size);
// Write out all elements in the proper order.
for (int i=0; i<size; i++) {
s.writeObject(elementData[i]);
}
if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}
privatevoidreadObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
elementData = EMPTY_ELEMENTDATA;
// Read in size, and any hidden stuff
s.defaultReadObject();
// Read in capacity
s.readInt(); // ignored
if (size > 0) {
// be like clone(), allocate array based upon size not capacity
ensureCapacityInternal(size);
Object[] a = elementData;
// Read in all elements in the proper order.
for (int i=0; i<size; i++) {
a[i] = s.readObject();
}
}
}
writeObject 會將 ArrayList 中的 size 和 element 數據寫入 ObjectOutputStream 。 readObject 會從 ObjectInputStream 讀取 size 和 element 數據。
之所以采用這種序列化方式,是出于性能的考量。因為 ArrayList 中 elementData 數組在 add 元素的過程,容量不夠時會動態擴容,這就到可能會有空間沒有存儲元素。采用上述序列化方式,可以保證只序列化有實際值的數組元素,從而節約時間和空間。
size
private int size;
size 是 ArrayList 的大小。
DEFAULT_CAPACITY
/**
* Default initial capacity.
*/
private static final int DEFAULT_CAPACITY = 10;
ArrayList 默認容量是10。
構造函數
ArrayList 提供了2個構造函數 ArrayList(int initialCapacity) 和 ArrayList() 。
使用有參構造函數初始化 ArrayList 需要指定初始容量大小,否則采用默認值10。
add()方法
publicbooleanadd(E e){
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}
在 add 元素之前,會調用 ensureCapacityInternal 方法,來判斷當前數組是否需要擴容。
privatevoidensureCapacityInternal(intminCapacity){
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
// 如果elementData為空數組,指定elementData最少需要多少容量。
// 如果初次add,將取默認值10;
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}
ensureExplicitCapacity(minCapacity);
}
privatevoidensureExplicitCapacity(intminCapacity){
modCount++;
// overflow-conscious code
// elementData容量不足的情況下進行擴容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
privatevoidgrow(intminCapacity){
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
-
從 grow 方法中可以看出, ArrayList 的 elementData 數組如遇到容量不足時,將會把新容量 newCapacity 設置為 oldCapacity + (oldCapacity >> 1) 。二進制位操作 >> 1 等同于 /2 的效果,擴容導致的 newCapacity 也就設置為原先的1.5倍。
-
如果新的容量大于 MAX_ARRAY_SIZE 。將會調用 hugeCapacity 將 int 的最大值賦給 newCapacity 。不過這種情況一般不會用到,很少會用到這么大的 ArrayList 。
在確保有容量的情況下,會將元素添加至 elementData 數組中。
add(int index, E element) 方法
publicvoidadd(intindex, E element){
rangeCheckForAdd(index);
ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}
帶有 index 的 add 方法相對于直接 add 元素方法會略有不同。
- 首先會調用 rangeCheckForAdd 來檢查,要添加的 index 是否存在數組越界問題;
- 同樣會調用 ensureCapacityInternal 來保證容量;
- 調用 System.arraycopy 方法復制數組,空出 elementData[index] 的位置;
- 賦值并增加 size ;
remove(int index) 方法
publicEremove(intindex){
rangeCheck(index);
modCount++;
E oldValue = elementData(index);
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
return oldValue;
}
ArryList 提供了兩個刪除 List 元素的方法,如上所示,就是根據 index 來刪除元素。
- 檢查 index 是否越界;
- 取出原先值的,如果要刪除的值不是數組最后一位,調用 System.arraycopy 方法將待刪除的元素移動至 elementData 最后一位。
- 將 elementData 最后一位賦值為null。
remove(Object o) 方法
publicbooleanremove(Object o){
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}
remove(Object o) 是根據元素刪除的,相對來說就要麻煩一點:
- 當元素 o 為空的時候,遍歷數組刪除空的元素。
- 當元素 o 不為空的時候,遍歷數組找出于 o 元素的 index ,并刪除元素。
- 如果以上兩步都沒有成功刪除元素,返回 false 。
modCount
在 add 、 remove 過程中,經常發現會有 modCount++ 或者 modCount-- 操作。這里來看下 modCount 是個啥玩意。
modCount 變量是在 AbstractList 中定義的。
protected transient int modCount = 0;
modCount 是一個 int 型變量,用來記錄 ArrayList 結構變化的次數。
modCount 起作用的地方是在使用 iterator 的時候。 ArrayList 的 iterator 方法。
publicIterator<E>iterator(){
return new Itr();
}
private classItrimplementsIterator<E>{
int cursor; // index of next element to return
int lastRet = -1; // index of last element returned; -1 if no such
int expectedModCount = modCount;
publicbooleanhasNext(){
return cursor != size;
}
@SuppressWarnings("unchecked")
publicEnext(){
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
}
publicvoidremove(){
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification();
try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
}
@Override
@SuppressWarnings("unchecked")
publicvoidforEachRemaining(Consumer<?superE> consumer){
Objects.requireNonNull(consumer);
final int size = ArrayList.this.size;
int i = cursor;
if (i >= size) {
return;
}
final Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length) {
throw new ConcurrentModificationException();
}
while (i != size && modCount == expectedModCount) {
consumer.accept((E) elementData[i++]);
}
// update once at end of iteration to reduce heap write traffic
cursor = i;
lastRet = i - 1;
checkForComodification();
}
finalvoidcheckForComodification(){
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}
iterator 方法會返回私有內部類 Itr 的一個實例。這里可以看到 Itr 類中很多方法,都會調用 checkForComodification 方法。來檢查 modCount 是夠等于 expectedModCount 。如果發現 modCount != expectedModCount 將會拋出 ConcurrentModificationException 異常。
這里寫一個小例子來驗證體會下 modCount 的作用。簡單介紹一下這個小例子:準備兩個線程 t1 、 t2 ,兩個線程對同一個 ArrayList 進行操作, t1 線程將循環向 ArrayList 中添加元素, t2 線程將把 ArrayList 元素讀出來。
Test 類:
public classTest{
List<String> list = new ArrayList<String>();
publicTest(){
}
publicvoidadd(){
for (int i = 0; i < 10000; i++) {
list.add(String.valueOf(i));
}
}
publicvoidread(){
Iterator iterator = list.iterator();
while (iterator.hasNext()) {
System.out.println(iterator.next());
}
}
t1 線程:
public classTest1ThreadimplementsRunnable{
private Test test;
publicTest1Thread(Test test){
this.test = test;
}
publicvoidrun(){
test.add();
}
t2 線程:
public classTest2ThreadimplementsRunnable{
private Test test;
publicTest2Thread(Test test){
this.test = test;
}
publicvoidrun(){
test.read();
}
}
main 類
publicstaticvoidmain(String[] args)throwsInterruptedException{
Test test = new Test();
Thread t1 = new Thread(new Test1Thread(test));
Thread t2 = new Thread(new Test2Thread(test));
t1.start();
t2.start();
}
執行這個 mian 類就會發現程序將拋出一個 ConcurrentModificationException 異常。
由異常可以發現拋出異常點正處于在調用 next 方法的 checkForComodification 方法出現了異常。這里也就出現上文描述的 modCount != expectedModCount 的情況,原因是 t2 線程在讀數據的時候, t1 線程還在不斷的添加元素。
這里 modCount 的作用也就顯而易見了,用 modCount 來規避多線程中并發的問題。由此也可以看出 ArrayList 是非線程安全的類。
來自:http://lishuo.me/2017/04/12/源碼分析之ArrayList/