什么是GREENPLUM
轉載原文: http://www.itpub.net/thread-1409964-1-1.html
什么是GREENPLUM?
對于很多IT人來說GREENPLUM是個陌生的名字。簡單的說它就是一個與Oracle、DB2 一樣面向對象的關系型數據庫。我們通過標準的SQL可以對GP中的數據進行訪問存取。
GREENPLUM與其它普通的關系型數據庫的區別?
本質上講GREENPLUM是一個關系型數據庫集群. 它實際上是由數個獨立的數據庫服務組合成的邏輯數據庫。與RAC不同,這種數據庫集群采取的是MPP架構。如下圖所示
它的組件分成三個部分MASTER/SEGMENT以及MASTER與SEGMENT之間的高效互聯技術GNET。其中MASTER和SEGMENT本身就是獨立的數據庫SERVER。不同之處在于,MASTER只負責應用的連接,生成并拆分執行計劃,把執行計劃分配給SEGMENT節點,以及返回最終結果給應用,它只存儲一些數據庫的元數據,不負責運算,因此不會成為系統性能的瓶頸。這也是GREENPLUM與傳統MPP架構數據庫的一個重要區別。 SEGMENT節點存儲用戶的業務數據,并根據得到執行計劃,負責處理業務數據。也就是用戶關系表的數據會打散分布到每個SEGMENGT節點。當進行數據訪問時,首先所有SEGMENT并行處理與自己有關的數據,如果需要segment可以通過進行innterconnect進行彼此的數據交互。 segment節點越多,數據就會打的越散,處理速度就越快。因此與SHARE ALL數據庫集群不同,通過增加SEGMENT節點服務器的數量,GREENPLUM的性能會成線性增長。
GREENPLUM適用場景?
GREENPLUM雖然是關系型數據庫產品,它的特點主要就是查詢速度快,數據裝載速度快,批量DML處理快。而且性能可以隨著硬件的添加,呈線性增加,擁有非常良好的可擴展性。因此,它主要適用于面向分析的應用。比如構建企業級ODS/EDW,或者數據集市等等。
GREENPLUM運行的平臺?
GREENPLUM運行在X86架構的硬件平臺上,目前支持的操作系統包括32/64位的 LINUX(REDHAT/SUSE)/SOLARIS/MAC OS
GREENPLUM的前景?
GREENPLUM 誕生于2003年硅谷,2010/07 EMC收購了GREENPLUM,并把GREENPLUM作為EMC面向分析云的戰略核心產品,加以大力發展。該產品不僅在國際市場發展很快,在國內市場發展也很快。最著名的案例就是阿里巴巴集團,經過多種產品的精心選型,最終選擇GREENPLUM作為它們的數據倉庫平臺存放數百TB的業務數據去高效支持各種分析應用。
如何學習GREENPLUM?
正是由于產品發展速度很快,但是在相關人才上存在很大缺口。因此,我個人認為對于各位有興趣的技術人員來說,是一個很好的職業發展機會。以個人經驗來說,只要有其它關系型數據庫的基礎,尤其是POSTGRESQL或者INFORMIX基礎的(因為GREENPLUM是在POSTGRESQL基礎上開發出來的),很容就可以上手學習并掌握GREENPLUM。
GREENPLUM的手冊寫的非常好,完全可以作為入門的教材使用。其軟件本身也是軟性LICENSE,用于學習研究完全免費,而且與生產環境并無不同,這與ORACLE完全一樣。
如何下載GREENPLUM的資料?
官方途徑可以從網站 http ://www.greenplum.org 上下載手冊和軟件。但國內由于網絡問題,可能不太好用。希望論壇或者哪位同志能提供一個好用的網盤,我愿意與大家分享相關軟件和資料。
聲明:云棲社區站內文章,未經作者本人允許或特別聲明,嚴禁轉載,但歡迎分享。
</div>