成為Java GC專家(2)― 如何監控Java垃圾回收機制
本文是成為Java GC專家系列文章的第二篇。在第一篇《深入淺出Java垃圾回收機制》中我們學習了不同GC算法的執行過程,GC是如何工作的,什么是新生代和老年代,你應該了解的JDK7中的5種GC類型,以及這5種類型對于應用性能的影響。
什么是GC監控?
垃圾回收收集監控指的是搞清楚JVM如何執行GC的過程,例如,我們可以查明:
1. 何時一個新生代中的對象被移動到老年代時,所花費的時間。
2. Stop-the-world 何時發生的,持續了多長時間。
GC監控是為了鑒別JVM是否在高效地執行GC,以及是否有必要進行額外的性能調優。基于以上信息,我們可以修改應用程序或者調整GC算法(GC優化)。
如何監控GC
有很多種方法可以監控GC,但其差別僅僅是GC操作通過何種方式展現而已。GC操作是由JVM來完成,而GC監控工具只是將JVM提供的GC信息展現給你,因此,不論你使用何種方式監控GC都將得到相同的結果。所以你也就不必去學習所有的監控GC的方法。但是因為學習每種監控方法不會占用太多時間,了解多一點可以幫助你根據不同的場景選擇最為合適的方式。
下面所列的工具以及JVM參數并不適用于所有的HVM供應商。這是因為并沒有關于GC信息的強制標準。本文我們將使用HotSpot JVM (Oracle JVM)。因為NHN 一直在使用Oracle (Sun) JVM,所以用它作為示例來解釋我們提到的工具和JVM參數更容易些。
首先,GC監控方法根據訪問的接口不同,可以分成CUI 和GUI 兩大類。CUI GC監控方法使用一個獨立的叫做”jstat”的CUI應用,或者在啟動JVM的時候選擇JVM參數”verbosegc”。
GUI GC監控由一個單獨的圖形化應用來完成,其中三個最常用的應用是”jconsole”, “jvisualvm” 和 “Visual GC”。
下面我們來詳細學習每種方法。
jstat
jstat 是HotSpot JVM提供的一個監控工具。其他監控工具還有jps 和jstatd。有些時候,你可能需要同時使用三種工具來監控你的應用。jstat 不僅提供GC操作的信息,還提供類裝載操作的信息以及運行時編譯器操作的信息。本文將只涉及jstat能夠提供的信息中與監控GC操作信息相關的功能。
jstat 被放置在$JDK_HOME/bin。因此只要java 和 javac能執行,jstat 同樣可以執行。
你可以在命令行環境下執行如下語句。
$> jstat –gc $<vmid$> 1000
S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT
3008.0 3072.0 0.0 1511.1 343360.0 46383.0 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588
3008.0 3072.0 0.0 1511.1 343360.0 47530.9 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588
3008.0 3072.0 0.0 1511.1 343360.0 47793.0 699072.0 283690.2 75392.0 41064.3 2540 18.454 4 1.133 19.588
$>
在上圖的例子中,實際的數據會按照如下列輸出:
S0C S1C S0U S1U EC EU OC OU PC
vmid (虛擬機 ID),正如其名字描述的,它是虛擬機的ID,Java應用不論運行在本地還是遠程的機器都會擁有自己獨立的vmid。運行在本地機器上的vmid稱之為lvmid (本地vmid),通常是PID。如果想得到PID的值你可以使用ps命令或者windows任務管理器,但我們推薦使用jps來獲取,因為PID和lvmid有時會不一致。jps 通過Java PS實現,jps命令會返回vmids和main方法的信息,正如ps命令展現PIDS和進程名字那樣。
首先通過jps命令找到你要監控的Java應用的vmid,并把它作為jstat的參數。當幾個WAS實例運行在同一臺設備上時,如果你只使用jps命令,將只能看到啟動(bootstrap)信息。我們建議在這種情況下使用ps -ef | grep java與jps配合使用。
想要得到GC性能相關的數據需要持續不斷地監控,因此在執行jstat時,要規則地輸出GC監控的信息。
例如,執行”jstat –gc 1000″ (或 1s)會每隔一秒展示GC監控數據。”jstat –gc 1000 10″會每隔1秒展現一次,且一共10次。
參數名稱 |
描述 |
gc |
輸出每個堆區域的當前可用空間以及已用空間(伊甸園,幸存者等等),GC執行的總次數,GC操作累計所花費的時間。 |
gccapactiy |
輸出每個堆區域的最小空間限制(ms)/最大空間限制(mx),當前大小,每個區域之上執行GC的次數。(不輸出當前已用空間以及GC執行時間)。 |
gccause |
輸出-gcutil提供的信息以及最后一次執行GC的發生原因和當前所執行的GC的發生原因 |
gcnew |
輸出新生代空間的GC性能數據 |
gcnewcapacity |
輸出新生代空間的大小的統計數據。 |
gcold |
輸出老年代空間的GC性能數據。 |
gcoldcapacity |
輸出老年代空間的大小的統計數據。 |
gcpermcapacity |
輸出持久帶空間的大小的統計數據。 |
gcutil |
輸出每個堆區域使用占比,以及GC執行的總次數和GC操作所花費的事件。 |
你可以只關心那些最常用的命令,你會經常用到 -gcutil (或-gccause), -gc and –gccapacity。
· -gcutil 被用于檢查堆間的使用情況,GC執行的次數以及GC操作所花費的時間。
· -gccapacity以及其他的參數可以用于檢查實際分配內存的大小。
使用-gc 參數你可以看到如下輸出:
S0C S1C … GCT
1248.0 896.0 … 1.246
1248.0 896.0 … 1.246
… … … …
不同的jstat參數輸出不同類型的列,如下表所示,根據你使用的”jstat option”會輸出不同列的信息。
列 | 說明 | Jstat參數 |
S0C | 輸出Survivor0空間的大小。單位KB。 | -gc -gccapacity -gcnew -gcnewcapacity |
S1C | 輸出Survivor1空間的大小。單位KB。 | -gc -gccapacity -gcnew -gcnewcapacity |
S0U | 輸出Survivor0已用空間的大小。單位KB。 | -gc -gcnew |
S1U | 輸出Survivor1已用空間的大小。單位KB。 | -gc -gcnew |
EC | 輸出Eden空間的大小。單位KB。 | -gc -gccapacity -gcnew -gcnewcapacity |
EU | 輸出Eden已用空間的大小。單位KB。 | -gc -gcnew |
OC | 輸出老年代空間的大小。單位KB。 | -gc -gccapacity -gcold -gcoldcapacity |
OU | 輸出老年代已用空間的大小。單位KB。 | -gc -gcold |
PC | 輸出持久代空間的大小。單位KB。 | -gc -gccapacity -gcold -gcoldcapacity -gcpermcapacity |
PU | 輸出持久代已用空間的大小。單位KB。 | -gc -gcold |
YGC | 新生代空間GC時間發生的次數。 | -gc -gccapacity -gcnew -gcnewcapacity -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
YGCT | 新生代GC處理花費的時間。 | -gc -gcnew -gcutil -gccause |
FGC | full GC發生的次數。 | -gc -gccapacity -gcnew -gcnewcapacity -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
FGCT | full GC操作花費的時間 | -gc -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
GCT | GC操作花費的總時間。 | -gc -gcold -gcoldcapacity -gcpermcapacity -gcutil -gccause |
NGCMN | 新生代最小空間容量,單位KB。 | -gccapacity -gcnewcapacity |
NGCMX | 新生代最大空間容量,單位KB。 | -gccapacity -gcnewcapacity |
NGC | 新生代當前空間容量,單位KB。 | -gccapacity -gcnewcapacity |
OGCMN | 老年代最小空間容量,單位KB。 | -gccapacity -gcoldcapacity |
OGCMX | 老年代最大空間容量,單位KB。 | -gccapacity -gcoldcapacity |
OGC | 老年代當前空間容量制,單位KB。 | -gccapacity -gcoldcapacity |
PGCMN | 持久代最小空間容量,單位KB。 | -gccapacity -gcpermcapacity |
PGCMX | 持久代最大空間容量,單位KB。 | -gccapacity -gcpermcapacity |
PGC | 持久代當前空間容量,單位KB。 | -gccapacity -gcpermcapacity |
PC | 持久代當前空間大小,單位KB | -gccapacity -gcpermcapacity |
PU | 持久代當前已用空間大小,單位KB | -gc -gcold |
LGCC | 最后一次GC發生的原因 | -gccause |
GCC | 當前GC發生的原因 | -gccause |
TT | 老年化閾值。被移動到老年代之前,在新生代空存活的次數。 | -gcnew |
MTT | 最大老年化閾值。被移動到老年代之前,在新生代空存活的次數。 | -gcnew |
DSS | 幸存者區所需空間大小,單位KB。 | -gcnew |
jstat 的好處是它可以持續的監控GC操作數據,不論Java應用是運行在本地還是遠程,只要有控制臺的地方就可以使用。當使用–gcutil 會輸出如下信息。在GC優化的時候,你需要特別注意YGC, YGCT, FGC, FGCT 和GCT。
S0 S1 E O P YGC YGCT FGC FGCT GCT
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
這些信息很重要,因為它們展示了GC處理到底花費了多少時間。
在這個例子中,YGC 是217而YGCT 是0.928,這樣在簡單的計算數據平均數后,你可以知道每次新生代的GC大概需要4ms(0.004秒),而full GC的平均時間為33ms。
但是,只看數據平均數經常無法分析出真正的GC問題。這是主要是因為GC操作時間嚴重的偏差(換句話說,假如兩次full GC的時間是 67ms,那么其中的一次full GC可能執行了10ms而另一個可能執行了57ms。)為了更好地檢測每次GC處理時間,最好使用 –verbosegc來替代數據平均數。
-verbosegc
-verbosegc 是在啟動一個Java應用時可以指定的JVM參數之一。而jstat 可以監控任何JVM應用,即便它沒有制定任何參數。 -verbosegc 需要在啟動的時候指定,因此你可能會認為它沒有必要(因為jstat可以替代之)。但是, -verbosegc 會以更淺顯易懂的方式展現GC發生的結果,因此他對于監控監控GC信息十分有用。
jstat | -verbosegc | |
監控對象 | 運行在本機的Java應用可以把日志輸出到終端上,或者借助jstatd命令通過網絡連接遠程的Java應用。 | 只有那些把-verbogc作為啟動參數的JVM。 |
輸出信息 | 堆狀態(已用空間,最大限制,GC執行次數/時間,等等) | 執行GC前后新生代和老年代空間大小,GC執行時間。 |
輸出時間 | Every designated time 每次設定好的時間。 |
每次GC發生的時候。 |
何時有用。 | 當你試圖觀察堆空間變化情況 | 當你試圖了解單次GC產生的效果。 |
下面是-verbosegc 的可用參數
· -XX:+PrintGCDetails
· -XX:+PrintGCTimeStamps
· -XX:+PrintHeapAtGC
· -XX:+PrintGCDateStamps (from JDK 6 update 4)
如果只是用了 -verbosegc 。那么默認會加上 -XX:+PrintGCDetails。 –verbosgc 的附加參數并不是獨立的。而是經常組合起來使用。
使用 –verbosegc后,每次GC發生你都會看到如下格式的結果。
[GC [<collector>: <starting occupancy1> -> <ending occupancy1>, <pause time1> secs] <starting occupancy3> -> <ending occupancy3>, <pause time3> secs]
收集器 | minor gc使用的收集器的名字。 |
starting occupancy1 | GC執行前新生代空間大小。 |
ending occupancy1 | GC執行后新生代空間大小。 |
pause time1 | 因為執行minor GC,Java應用暫停的時間。 |
starting occupancy3 | GC執行前堆區域總大小 |
ending occupancy3 | GC執行后堆區域總大小 |
pause time3 | Java應用由于執行堆空間GC(包括major GC)而停止的時間 |
這是-verbosegc 輸出的minor GC的例子。
S0 S1 E O P YGC YGCT FGC FGCT GCT
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
0.00 66.44 54.12 10.58 86.63 217 0.928 2 0.067 0.995
這是 Full GC發生時的例子
[Full GC [Tenured: 3485K->4095K(4096K), 0.1745373 secs] 61244K->7418K(63104K),
[Perm : 10756K->10756K(12288K)], 0.1762129 secs] [Times: user=0.19 sys=0.00, real=0.19 secs]
如果使用了 CMS collector,那么如下CMS信息也會被輸出。
由于 –verbosegc 參數在每次GC事件發生的時候都會輸出日志,我們可以很輕易地觀察到GC操作對于堆空間的影響。
(Java) VisualVM + Visual GC
Java Visual VM是由Oracle JDK提供的圖形化的匯總和監控工具。
圖1: VisualVM 截圖
除了JDK中自帶的版本,你還可以直接從官網下載Visual VM。出于便利性的考慮,JDK中包含的版本被命名為Java VisualVM (jvisualvm),而官網提供的版本被命名為Visual VM (visualvm)。兩者的功能基本相同,只有一些細小的差別,例如安裝組件的時候。就個人而言,我更喜歡可以從官網下載的Visual VM。
圖 2: Viusal GC 安裝截圖
通過Visual GC,你可以更直觀的看到執行jstatd 所得到的信息。
圖3: Visual GC 執行截圖
HPJMeter
HPJMeter 可以很方便的分析 -verbosegc 輸出的結果,如果Visual GC可以視作jstat的圖形化版本,那么HPJMeter就相當于 –verbosgc的圖形化版本。當然,GC分析只是HPJMeter提供的眾多功能之一,HPJMeter是由惠普開發的性能監控工具,他可以支持HP-UX,Linux以及MS Windows。
起初,一個成為HPTune 被設計用來圖形化的分析-verbosegc.輸出的結果。但是,隨著HPTune的功能被集成到HPJMeter 3.0版本之后,就沒有必要單獨下載HPTune了。但運行一個應用時, -verbosegc 的結果會被輸出到一個獨立的文件中。
你可以用HPJMeter直接打開這個文件,以便更直觀的分析GC性能數據。
圖4: HPJMeter
來源:http://www.importnew.com/2057.html