李元佳:漫談 Greenplum 開源背后的動機

jopen 9年前發布 | 9K 次閱讀 Greenplum

作者:李元佳  
轉載自:Postgres

這幾天最大的消息莫過于 Greenplum 的開源,年初開始 Pivotal 就宣布了 greenplum 的開源,經過大半年的翹首等待,終于在十月底在歐洲的 Postgres 大會宣布開源,并兌現在 Github 上開放代碼(https://github.com/greenplum-db/gpdb ),社區的官網為 http://greenplum.org/, 其官方博客也有提到相關事項。代碼是采用 Apache 許可,今天已經有社區的朋友嘗鮮從社區取下代碼,在 Greenplum 上測試了 tpch 的性能,雖然測試比較粗糙但是結果基本和商業版的一樣,印證了之前 greenplum 將走向全開源的消息。雖然里面關鍵的新一代優化器 orca 還沒有看到代碼,但據消息這部分后續也會開出來,估計這個是其對這個最核心資產的一個謹慎的操作。

總體的印象來看,其采取開放的 Apache 許可,代碼基本上無保留開源,這次的開源更大程度是公司層面的戰略行為,而不是簡單的市場推廣的戰術行為。

Greenplum 的開源,在我看來有幾個驅動力。

首先是受其 cloud foundry 開源戰略成功的驅動。pivotal 在整個emc聯邦的定位來說是偏中間件這一層,emc是存儲,vmware是虛擬化,pivotal要搞定的是PaaS。而pivotal的業務上來說,要把云和大數據這兩個支柱搞定,才能把emc聯邦的疆域穩定下來。云這一層來說vmware已經是私有云的霸主,而剩下的上層PaaS這一層如果落入他人之手對其來說也是一個大威脅,所以PaaS這一層也是志在必得。鑒于當時已經在市場有很多對手,2011年的時候cloudfoundry啟動是以開源的模式來去做,把IBM和HP拉上。這個戰略取得了出人意料的巨大成功,現在CF幾乎要變成了PaaS的事實標準,IBM也推出了基于CF的bluemix 產品,而pivotal在今年發布的2014年的財報,極為惹眼的標題:破紀錄的2014年,史上最快的開源產品銷售增長( http://finance.yahoo.com/news/pivotal-cloud-foundry-reports-record-160000128.html )在短短的一年里,就獲得4千萬美金的軟件銷售收入,另外也獲得了財富500強中的100個客戶!這對于基礎軟件來說,基本是神話。說了這么多,無外乎就是給大家強調一下,整個pivotal在cloudfoudry的巨大成功下,對于開源的認識已經到了商業戰略的層次,已經不需要去討論要不要開源,開源已經成為殺手級的武器!在此背景下我們來去理解greenplum的開源才更容易理解。

其次,Pivotal 的大數據戰場,需要新的戰略調整。上面提到,除了云以外,Pivotal的戰略重心是大數據,Pivotal除了有自己的hadoop發行版以外還有greenplum作為大數據最重要的資產。但是大數據整個市場都不是太理想,Hadoop發行版除了有Cloudera,Hortonworks,MapR這三個第三方發行版以外,還有 Pivotal,IBM,Intel這些廠商本身的發行版,市場最突出的問題是碎片化(fragmented),Hadoop的門檻低,廠商林立,同質化嚴重,不僅僅難以溢價出售,傳統大廠商靠溢價銷售基礎軟件獲取超額利益的路子開始行不通;更為重要的是越來越多的客戶傾向于使用第三方獨立的發行版,道理不難理解,用戶更希望的是Linux生態里面有Redhat和SuSe這樣的發行廠商,而不希望類似AIX或者是Windows Server這種由廠商控制的生態,這個更加加劇了廠商面臨的困境。Intel由于其發行版的糟糕市場表現,開始陸續解散自己的Hadoop團隊,國內的星環就是在這個背景下誕生,2014年Intel重金投資Cloudera 7.4億美金取得18%的股權,Dell也投入Cloudera的陣營,HP、微軟、Teradata則傾向于直接使用Hortonworks的發行版,HP還投資了Hortonworks。但是Cloudera的優勢明顯,營收是Hortonworks的將近一倍,Cloudera儼然有成為 Hadoop生態的新的霸主的陣勢,市場格局開始慢慢固化,Intel有可能是這場戰役的贏家。在這樣的市場格局里面,Pivotal的困境可想而知,HD的發行版肯定需要重新調整策略,所以Pivotal聯合IBM、GE等15個弱勢玩家, 在今年3月宣告成立ODP(Open Data Platform)組織,本質上是希望通過支持Hortonworks抗衡Cloudera,取得平衡。但是這個賭注的勝算并不明顯,Cloudera的 CEO甚至公開嘲諷ODP,說其出現本身就是Cloudera的一個勝利( https://gigaom.com/2015/03/03/cloudera-ceo-declares-victory-over-big-data-competition/   ),Greenplum的開源正是作為ODP的砝碼而出現,Pivotal決定把HD發行版、Gemfire、HAWQ還有Greenplum開源,所以從這個角度我們看到,Greenplum的開源本身,就是Pivotal希望贏回這場戰役的一個砝碼,對其而言,越多人用越好,沒有必要隱藏任何功能。

其實在 Greenplum 開源之前,MPP 數據庫的日子也并不好過,也是市場碎片化,每個廠家也就區區幾千萬美金的營收,市場難以有大的突破,傳統豐厚的 DW 市場也難以打入,Hadoop 生態又是以開源為主,甚至很多類似 Impala 這樣的產品也在做其類似的功能,傳統的打不開,新市場又難以全面打開,而且競爭重重,進退兩難。而Greenplum十多年來的架構也無力進行大的調整。正是在這樣的背景下,倒不如開源,盤活大局。下面這篇文章稱其舉動為 open sourcing code is the modern graceful way to retire an unprofitable product line (http://skylandtech.net/2015/02/24/thinking-about-the-pivotal-announcements/ )

Greenplum 的開源應該是相對比較激進和帶有攻擊性(aggressive)一著棋,成敗難料,但對于整個生態會有比較大的影響。

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!