深入分析 ThreadLocal 內存泄漏問題
前言
ThreadLocal 的作用是提供線程內的局部變量,這種變量在線程的生命周期內起作用,減少同一個線程內多個函數或者組件之間一些公共變量的傳遞的復雜度。但是如果濫用 ThreadLocal ,就可能會導致內存泄漏。下面,我們將圍繞三個方面來分析 ThreadLocal 內存泄漏的問題
-
ThreadLocal 實現原理
-
ThreadLocal 為什么會內存泄漏
-
ThreadLocal 最佳實踐
ThreadLocal 實現原理
ThreadLocal
ThreadLocal 的實現是這樣的:每個 Thread 維護一個 ThreadLocalMap 映射表,這個映射表的 key 是 ThreadLocal 實例本身, value 是真正需要存儲的 Object 。
也就是說 ThreadLocal 本身并不存儲值,它只是作為一個 key 來讓線程從 ThreadLocalMap 獲取 value 。值得注意的是圖中的虛線,表示 ThreadLocalMap 是使用 ThreadLocal 的弱引用作為 Key 的,弱引用的對象在 GC 時會被回收。
ThreadLocal 為什么會內存泄漏
ThreadLocalMap 使用 ThreadLocal 的弱引用作為 key ,如果一個 ThreadLocal 沒有外部強引用來引用它,那么系統 GC 的時候,這個 ThreadLocal 勢必會被回收,這樣一來, ThreadLocalMap 中就會出現 key 為 null 的 Entry ,就沒有辦法訪問這些 key 為 null 的 Entry 的 value ,如果當前線程再遲遲不結束的話,這些 key 為 null 的 Entry 的 value 就會一直存在一條強引用鏈: Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value 永遠無法回收,造成內存泄漏。
其實, ThreadLocalMap 的設計中已經考慮到這種情況,也加上了一些防護措施:在 ThreadLocal 的 get() , set() , remove() 的時候都會清除線程 ThreadLocalMap 里所有 key 為 null 的 value 。
但是這些被動的預防措施并不能保證不會內存泄漏:
-
使用 static 的 ThreadLocal ,延長了 ThreadLocal 的生命周期,可能導致的內存泄漏。
-
分配使用了 ThreadLocal 又不再調用 get() , set() , remove() 方法,那么就會導致內存泄漏。
為什么使用弱引用
從表面上看內存泄漏的根源在于使用了弱引用。網上的文章大多著重分析 ThreadLocal 使用了弱引用會導致內存泄漏,但是另一個問題也同樣值得思考:為什么使用弱引用而不是強引用?
我們先來看看官方文檔的說法:
To help deal with very large and long-lived usages, the hash table entries use WeakReferences for keys.
為了應對非常大和長時間的用途,哈希表使用弱引用的 key。
下面我們分兩種情況討論:
-
key 使用強引用 :引用的 ThreadLocal 的對象被回收了,但是 ThreadLocalMap 還持有 ThreadLocal 的強引用,如果沒有手動刪除, ThreadLocal 不會被回收,導致 Entry 內存泄漏。
-
key 使用弱引用 :引用的 ThreadLocal 的對象被回收了,由于 ThreadLocalMap 持有 ThreadLocal 的弱引用,即使沒有手動刪除, ThreadLocal 也會被回收。 value 在下一次 ThreadLocalMap 調用 set , get , remove 的時候會被清除。
比較兩種情況,我們可以發現:由于 ThreadLocalMap 的生命周期跟 Thread 一樣長,如果都沒有手動刪除對應 key ,都會導致內存泄漏,但是使用弱引用可以多一層保障: 弱引用 ThreadLocal 不會內存泄漏,對應的 value 在下一次 ThreadLocalMap 調用 set , get , remove 的時候會被清除 。
因此, ThreadLocal 內存泄漏的根源是:由于 ThreadLocalMap 的生命周期跟 Thread 一樣長,如果沒有手動刪除對應 key 就會導致內存泄漏,而不是因為弱引用。
ThreadLocal 最佳實踐
綜合上面的分析,我們可以理解 ThreadLocal 內存泄漏的前因后果,那么怎么避免內存泄漏呢?
-
每次使用完 ThreadLocal ,都調用它的 remove() 方法,清除數據。
在使用線程池的情況下,沒有及時清理 ThreadLocal ,不僅是內存泄漏的問題,更嚴重的是可能導致業務邏輯出現問題。所以,使用 ThreadLocal 就跟加鎖完要解鎖一樣,用完就清理。
來自:http://www.importnew.com/22039.html