Java中的Copy

qspo4662 8年前發布 | 7K 次閱讀 Java開發

來自: http://ifeve.com/java-copy-on-write/#more-10403


什么是CopyOnWrite容器

CopyOnWrite容器即寫時復制的容器。通俗的理解是當我們往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行 Copy,復制出一個新的容器,然后新的容器里添加元素,添加完元素之后,再將原容器的引用指向新的容器。這樣做的好處是我們可以對 CopyOnWrite容器進行并發的讀,而不需要加鎖,因為當前容器不會添加任何元素。所以CopyOnWrite容器也是一種讀寫分離的思想,讀和寫 不同的容器。

CopyOnWriteArrayList的實現原理

在使用CopyOnWriteArrayList之前,我們先閱讀其源碼了解下它是如何實現的。以下代碼是向ArrayList里添加元素,可以發現在添加的時候是需要加鎖的,否則多線程寫的時候會Copy出N個副本出來。

01 public boolean add(T e) {
02     final ReentrantLock lock = this.lock;
03     lock.lock();
04     try {
05
06         Object[] elements = getArray();
07
08         int len = elements.length;
09         // 復制出新數組
10
11         Object[] newElements = Arrays.copyOf(elements, len + 1);
12         // 把新元素添加到新數組里
13
14         newElements[len] = e;
15         // 把原數組引用指向新數組
16
17         setArray(newElements);
18
19         return true;
20
21     } finally {
22
23         lock.unlock();
24
25     }
26
27 }
28
29 final void setArray(Object[] a) {
30     array = a;
31 }

讀的時候不需要加鎖,如果讀的時候有多個線程正在向ArrayList添加數據,讀還是會讀到舊的數據,因為寫的時候不會鎖住舊的ArrayList。

1 public E get(int index) {
2     return get(getArray(), index);
3 }

JDK中并沒有提供CopyOnWriteMap,我們可以參考CopyOnWriteArrayList來實現一個,基本代碼如下:

01 import java.util.Collection;
02 import java.util.Map;
03 import java.util.Set;
04
05 public class CopyOnWriteMap<K, V> implements Map<K, V>, Cloneable {
06     private volatile Map<K, V> internalMap;
07
08     public CopyOnWriteMap() {
09         internalMap = new HashMap<K, V>();
10     }
11
12     public V put(K key, V value) {
13
14         synchronized (this) {
15             Map<K, V> newMap = new HashMap<K, V>(internalMap);
16             V val = newMap.put(key, value);
17             internalMap = newMap;
18             return val;
19         }
20     }
21
22     public V get(Object key) {
23         return internalMap.get(key);
24     }
25
26     public void putAll(Map<? extends K, ? extends V> newData) {
27         synchronized (this) {
28             Map<K, V> newMap = new HashMap<K, V>(internalMap);
29             newMap.putAll(newData);
30             internalMap = newMap;
31         }
32     }
33 }

實現很簡單,只要了解了CopyOnWrite機制,我們可以實現各種CopyOnWrite容器,并且在不同的應用場景中使用。

CopyOnWrite的應用場景

CopyOnWrite并發容器用于讀多寫少的并發場景。比如白名單,黑名單,商品類目的訪問和更新場景,假如我們有一個搜索網站,用戶在這個網站 的搜索框中,輸入關鍵字搜索內容,但是某些關鍵字不允許被搜索。這些不能被搜索的關鍵字會被放在一個黑名單當中,黑名單每天晚上更新一次。當用戶搜索時, 會檢查當前關鍵字在不在黑名單當中,如果在,則提示不能搜索。實現代碼如下:

01 package com.ifeve.book;
02
03 import java.util.Map;
04
05 import com.ifeve.book.forkjoin.CopyOnWriteMap;
06
07 /**
08  * 黑名單服務
09  *
10  * @author fangtengfei
11  *
12  */
13 public class BlackListServiceImpl {
14
15     private static CopyOnWriteMap<String, Boolean> blackListMap = new CopyOnWriteMap<String, Boolean>(
16             1000);
17
18     public static boolean isBlackList(String id) {
19         return blackListMap.get(id) == null ? false : true;
20     }
21
22     public static void addBlackList(String id) {
23         blackListMap.put(id, Boolean.TRUE);
24     }
25
26     /**
27      * 批量添加黑名單
28      *
29      * @param ids
30      */
31     public static void addBlackList(Map<String,Boolean> ids) {
32         blackListMap.putAll(ids);
33     }
34
35 }

代碼很簡單,但是使用CopyOnWriteMap需要注意兩件事情:

1. 減少擴容開銷。根據實際需要,初始化CopyOnWriteMap的大小,避免寫時CopyOnWriteMap擴容的開銷。

2. 使用批量添加。因為每次添加,容器每次都會進行復制,所以減少添加次數,可以減少容器的復制次數。如使用上面代碼里的addBlackList方法。

CopyOnWrite的缺點

CopyOnWrite容器有很多優點,但是同時也存在兩個問題,即內存占用問題和數據一致性問題。所以在開發的時候需要注意一下。

內存占用問題。因為CopyOnWrite的寫時復制機制,所以在進行寫操作的時候,內存里會同時駐扎兩個對象 的內存,舊的對象和新寫入的對象(注意:在復制的時候只是復制容器里的引用,只是在寫的時候會創建新對象添加到新容器里,而舊容器的對象還在使用,所以有 兩份對象內存)。如果這些對象占用的內存比較大,比如說200M左右,那么再寫入100M數據進去,內存就會占用300M,那么這個時候很有可能造成頻繁 的Yong GC和Full GC。之前我們系統中使用了一個服務由于每晚使用CopyOnWrite機制更新大對象,造成了每晚15秒的Full GC,應用響應時間也隨之變長。

針對內存占用問題,可以通過壓縮容器中的元素的方法來減少大對象的內存消耗,比如,如果元素全是10進制的數字,可以考慮把它壓縮成36進制或64進制。或者不使用CopyOnWrite容器,而使用其他的并發容器,如ConcurrentHashMap

數據一致性問題。CopyOnWrite容器只能保證數據的最終一致性,不能保證數據的實時一致性。所以如果你希望寫入的的數據,馬上能讀到,請不要使用CopyOnWrite容器。

關于C++的STL中,曾經也有過Copy-On-Write的玩法,參見陳皓的《C++ STL String類中的Copy-On-Write》,后來,因為有很多線程安全上的事,就被去掉了。

 

 本文由用戶 qspo4662 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!