Java對象的內存模型
眾所周知,函數調用在內存中是通過壓棧,退棧實現的,而Java的方法調用則是在JVM棧中通過棧幀實現的,且所有的Java對象都只在堆上分配內 存.那么一個Java對象在堆內存里到底長啥樣呢?實際上,當一個對象在內存中被創建的時候,它只不過是一串0和1而已.編譯器會維護一張表,這張表用來 存儲對象中的每一個成員變量所在位置的偏移量(offset).這樣,通過查這張表,JVM就能知道每一個成員變量相對于其起始地址所在的位置了.
來看這樣一個例子.我們定義一個名為 Base 的類,它沒有任何的成員方法,只有兩個成員變量x和y.Base 對象的內存模型如下圖所示:
然后我們從Base類派生一個名為 Derived 的子類,則 Derived 對象的內存模型如下:
可以看到,子類的內存模型實際上就是在父類的基礎上添加了子類特有的成員變量而已.這樣設計的好處是,如果有一個 Base 類型的引用指向了 Derived 對象,那么由于 Derived對象的內存模型中包含了其父類 Base,因而 Base 類對于其子類 Derived 是可見的. 這樣一來,任何通過Base引用操作 Derived 對象的調用都是安全的.
啥叫安全呢?例如上面這個例子,編譯器會維護一張保存有成員變量offset的表,這張表是這么寫的:x變量在第1個位置,y變量在第2個位置,z 變量在第3個位置.(當然實際中肯定不是第幾個位置這么簡單,編譯器會根據變量的數據類型確定其offset,如,一個int偏移4字節,一個 double偏移8字節).當我們通過Base引用來引用Derived中的成員時,編譯器就會去找這個對象中的第幾個位置.比如調用derived.x 會去找第一個位置,derived.z,則會去找第三個位置.因為子類Derived中包含了父類的x,y變量,而且次序正好排在x,y之后,所以derived.z可以被成功執行.
按照這個邏輯,方法也可以放在每個對象的起始位置:
不過,這么干是非常低效的.如果一個類有很多的方法,那么就要在起始位置保存大量的數據,并且每個對象都會重復地保存這些函數代碼.這樣對象構造起來就慢,造成空間和時間上的性能浪費.
解決這個問題的一個辦法是,為每一個類創建一個虛表(virtual table),這張表里保存了這個類中所有的方法代碼.而對于這個類的對象,則在其內存的起始位置中保存一個指向此表的指針.這樣一來,多個對象就能共享一份方法代碼了.
英文原文:http://www.programcreek.com/2011/11/what-do-java-objects-look-like-in-memory/