阿里云觀察2014

jopen 10年前發布 | 31K 次閱讀 阿里云

阿里云觀察2014

        文/劉江

        引言:在阿里巴巴集團的上市招股書中,Cloud 一詞出現達 80 多次,云計算儼然成為集團戰略的重要組成部分。阿里云這一年有很多重要的突破和轉折點,飛天 5K 項目的成功是阿里云乃至阿里巴巴歷史上重要的里程碑。阿里成為世界上屈指可數的具備這一能力的公司之一,中國在前沿性的關鍵技術上少有地站到了世界領獎臺 上。從 IT(信息技術)進入到 DT(數據技術)時代,互聯網+數據取代了計算機+軟件,云計算是將更多行業乃至全社會數據化的平臺和前提。由于阿里等互聯網公司積極向各行業滲透,加上 國內許多公司的 IT 系統并不成熟,全社會又具有改革慣性,中國的云計算發展有可能超越美國,這既是阿里云及其同行的機遇,也是重重的責任。

        —————————正文————————

        2011 年和 2012 年,我先后兩次對話阿里云的負責人王堅博士,先后在《凌云》雜志發表了《追尋凌云夢》和《阿里云觀察》兩篇文章,記錄了阿里云和王堅本人不同發展階段的酸 甜苦辣。在后一篇文章的結尾,我這樣寫道:“全球范圍內,Amazon 云計算對整個新興產業的發展無疑舉足輕重。對于中國來說,阿里云的成敗也有類似的份量。”

阿里云觀察2014

        我沒有想到的是,此后一年多,國內外云計算的形勢很快就發生了較大變化。

        最引人矚目的故事,是 Amazon 在 2013 年 3 月獲得美國中情局 6 億美元的大單,強力攻入企業級市場的核心地帶――政府。更有戲劇性的是,IBM 為此不惜把中情局告上法庭,仍然未能挽回局面。

        而在總體格局上,微軟和 Google 先后放棄只做 PaaS 的戰略,開始在 IaaS 市場發力,引發一系列連鎖反應。2012 年 6 月 6 日,微軟首次公開自己的 IaaS 服務的時候,還用混合云的名義來遮掩。而同月 Google 在I/O大會上發布 IaaS 平臺 GCE(Google Compute Engine)則高調多了,劍鋒毫不客氣地直指 AWS。等兩家 IaaS 正式上線開放服務,已經到了差不多一年后 2013 年的 4 月和 5 月。總體上,它們比 Amazon 要晚上 5 年以上。以至于去年 8 月 Gartner 的數據估計,AWS 的計算容量是后面 14 家競爭對手總和的 5 倍。

        但是,兩大巨頭畢竟實力雄厚(技術實力毋庸置疑,又握有數以百億計美元的現金),只要公司頂層下了決心(解決了我所說的“一把手工程”問題), 無論產品還是市場上都追得很猛。2014 年 1 月,Google 負責基礎設施的高級副總裁烏爾斯·霍澤爾(Urs H?lzle)給全公司發送了一份令人震驚的備忘錄,表示自己的團隊將對公司內部包括搜索和 Gmail 這樣的“客戶”減少關注,將大部分精力轉向公司以外的新客戶,大力打造公共云計算。2014 年 2 月,微軟原來負責云業務的 Satya Nadella 成為新的 CEO,他很自然地將云定為公司的兩大核心戰略,Azure 無論在產品還是市場力度上陡然加大。

        巨頭競爭最大的利器,是大把在固定資產上投錢(每年投入在數十億美元),然后展開血肉橫飛的價格戰。2014 年 3 月,Google 首先發起一輪大規模的降價,各項服務降幅達 32% ~85% ,Amazon 第二天就馬上跟進,微軟的降價通知也不過再等了幾天,但降幅比 Google 都要小一些。價格戰的直接結果是“神仙打架,百姓遭殃”,RackSpace 這樣的獨立云廠商首先撐不下去了:他們拒絕跟進降價,繼而在一片收購和私有化傳聞中,幾個月內的股價跌去一半,不得不在今年 5 月宣布退出純 IaaS 市場,主推綁定服務的托管云。即使是 Amazon 也開始感到吃力,第二季度的財報發布時,他們的 CFO 公開承認價格戰影響了公司的財務表現,股價也應聲而落。

        到 7 月份,一些國外的分析機構和媒體已經在討論:如果把 SaaS 加進來,到年底微軟的云業務收入會不會超過 Amazon?

        形勢現在很清楚了,在美國,公共云計算市場已經成為巨頭的角斗場所。只有既有資源,又有技術實力的公司才能繼續生存。Amazon 雖然一開始戰略對頭,選對了從 IaaS 開始,成為長期的領跑者,至今仍然有較大優勢,但 Google 和微軟一旦發力,這場長途征戰,鹿死誰手,還很難預料。三巨頭之外,還有哪些公司能拿到所剩無幾的船票?Apple、IBM、非死book、 Oracle、Intel、Cisco、EMC/VMware……候選人的名單很長,但勝出的概率卻很小了。

阿里云觀察2014

        國內的情況呢?從某些方面看,與前幾年的美國 Amazon 一馬當先,微軟和 Google 還在猶豫,但 AWS 之上的云生態已經方興未艾的確非常類似。中國市場上,阿里云的行業領導地位已經基本確立,騰訊云雖然也有比較完整的產品線,但對外似乎并不急于發力,百度 云更是一直戰略方向都沒有定下來,電信運營商和其他較大的 IT 公司也同樣心不在焉。

        而各類創業公司則一派欣欣向榮的景象。某種程度上,正是在阿里云不斷地通過雙十一、余額寶和去 IOE 等大動作震撼業界、教育市場的東風下,中國云計算生態的確有了很大起色。越來越多的移動游戲、互聯網、電商、金融、在線教育、企業軟件服務規模性轉向云計 算。與之相對應的,從 2013 年 1 月開始,國內連續出現多起云計算領域投資案例,一掃之前的陰郁,包括 IaaS 層面的七牛、又拍、QingCloud、UCloud、UnitedStack、道里云、群核、監控寶、云杉網絡、多備份、VisualOps、華云數 據、刻通云、巨杉等,SaaS 層面的 Tower、Worktile、明道、紛享、Teambition……以至于常參與討論的云計算行業微信群里,在我的持續觀察之下,除我之外的其他人在一 年多的時間里幾乎都拿到投資,成了土豪。有些 IaaS 公司融資高達數千萬美元,意味著他們的收入很可能可以達到數千萬乃至過億人民幣的水平。

        在《阿里云觀察》一文中,我曾經說過:“阿里云在國內目前沒有真正的對手,2013 年將繼續享受較長時間的機遇窗口。”事實上,阿里云的確很好地抓住了這個機遇,打了好幾個漂亮仗,幾乎一直主導著云計算方面的業界話題。

        2013 年 5 月 17 日,阿里集團最后一臺 IBM 小機在支付寶下線,7 月 10 日,淘寶最后一個 Oracle 數據庫在廣告系統中下線,“去 IOE”取得關鍵性成功。與此同時,“去 IOE”也引起 IT 界熱議和思考,技術重新選型蔚然成風。

        2013 年 6 月 13 日,余額寶在阿里云的支撐下推出,一年后用戶過億,規模達到近 6 千億,使背后原本默默無聞的天弘基金成為業界領導者,震撼了中國基金業乃至整個金融業,互聯網金融成為社會熱點。

        2013 年 11 月 11 日,雙十一再創紀錄,單日成交額達到 362 億,而建構在阿里云之上的聚石塔處理了 75 % 的訂單量,無一故障。而雙十一巨大的成交量,讓零售業感受到了前所未有的變革壓力。

        2013 年 11 月 27 日,代號“聚寶盆”的金融云服務推出,阿里云成為金融行業 IT 架構的一個新選擇。次年 5 月媒體報道,使用阿里云服務的金融機構超過 100 家。

        2014 年 2 月 27 日,阿里與海南簽訂規劃總投資 50 億元的“未來城市”計劃。此后,阿里云在政務與民生領域的新聞不斷地見諸報端:中國氣象局、廣西、貴州、寧夏、河南、河北……

        2014 年 3 月 4 日從 CDN 正式商用起,新的產品和服務也在密集推出,僅在6、7 月就連續開放大數據處理服務 ODPS、日志服務 SLS、搜索 OpenSearch、BI 服務 DPC(采云間)和可用區。

        2014 年 3 月 31 日,聯合高德等推出代號“聚無線”的移動云平臺。

        2014 年 4 月 29 日,北京數據中心開放。5 月和 9 月香港和深圳數據中心又陸續開放,節點總數達到 5 個。

        2014 年 7 月 15 日,開始免費試用四款入門產品的活動。

        2014 年 8 月 19 日,發布“云合計劃”,要以2:8 分成的政策招募 1 萬家云服務商,與之前成立的云棲小鎮聯盟,組成完整的生態系統。

        ……

        2014 年 5 月,阿里巴巴集團的上市招股書中,Cloud 一詞出現達 80 多次,顯示云計算成為集團非常重要的組成部分。另外,業界也從中得知,阿里云計算等互聯網基礎設施收入 2013 年超過 1 億美元。雖然量級與美國仍有差距,但也打破了云計算的泡沫之論。而近百萬用戶數量,更是令人鼓舞。

        而對阿里而言,這一年多最重要的突破和轉折點,卻是不太為外界注意的飛天 5K 項目的成功。

        飛天是阿里云的核心系統,它本來的設計目的就是將成千上萬臺服務器組成一臺超級計算機,對外提供通用計算服務。早在 2012 年初,王堅就表示過,“從戰略上來說,他們(阿里云)想做的事情實際上可以解讀為 Amazon + Google 并有所超越”。將單一集群做到數千乃至更高,技術上是國家和企業競爭力的標志。阿里云必須攻克這道難關。只不過,從 2009 年才起步的飛天,一直沒有機會沖擊這一目標。

        2013 年,這個機會來了。一季度做預算的時候,大家發現,阿里集團內部數據處理的兩套系統――基于 Hadoop 的云梯 1 和基于飛天的 ODPS(云梯2)隨著單集群規模不斷擴大,都到了幾千,面臨 5000 集群規模和跨機房的門檻。如果分別繼續投入、重復建設,開發和維護成本很高,浪費巨大,必須舍棄一個。怎么辦?

        當時技術團隊內部的爭論非常厲害,甚至當著馬云的面也不掩飾。Hadoop 作為大數據的標志性開源項目,本身更加成熟,在技術人員心目中地位很高,感情很深,而且 Hadoop 集群的規模本身更大。但是可控性、安全性的問題可能更會在長期成為過不去的坎兒。阿里技術保障部負責人劉振飛的一句話透出了這場爭論背后的本 質:“Hadoop 的定位就是陪太子讀書,而太子就是 ODPS。”飛天 5K 項目因此啟動,另一方面 ODPS 往 5K 規模升級,一方面 Hadoop 不再發展,處理負荷向 ODPS 遷移。

        以唐洪為首的飛天核心研發團隊歷經 4 個月艱苦努力,對盤古、伏羲等組件進行了深入優化,并全新開發了自動故障處理模塊華佗(細節可以參考本期相應的文章)。到 2013 年 8 月 15 日,這個任務勝利完成,新的基于飛天 5K 的 ODPS 生產集群規模達到 5000,而且實現了跨機房,并經受了整機房斷電的嚴苛考驗。平臺計算 100TB 排序只需 30 分鐘,遠超 Yahoo ! 在 7 月剛剛創造的 71 分鐘世界紀錄。阿里成為世界上屈指可數的具備這一能力的公司之一,也是第一個對外提供這種能力的公司。多年來,中國在前沿性的關鍵技術上少有地站到了世界 領獎臺上。

        從各方面看,飛天 5K 都是阿里云乃至阿里巴巴歷史上重要的里程碑。到今天,支付寶的所有數據處理、淘寶的數據倉庫、阿里小貸的貸款業務等越來越多的集團關鍵應用,都已經由 ODPS 和飛天 5K 支撐。據劉振飛透露,阿里云終于借此在集團內部證明了自己。在此之后,阿里內部關于做不做云計算、到底用 Hadoop 還是用 ODPS、甚至王堅和阿里云靠譜不靠譜的爭論都結束了。飛天 5K 項目為此劃上了一個休止符。此后,阿里云作為集團的統一技術平臺,已經成為上上下下的共識。最近,幾千臺的 HBase 集群也在往 OTS 上遷移。淘寶、天貓、支付寶的負責人,現在已經主動提出,要將核心系統遷移到阿里云提上日程。

        在這背后,集團副總裁王文彬(花名菲青)在 2014 年初接任阿里云總裁,他原在淘寶天貓負責開放平臺與商家業務,技術和生態建設背景均很資深,而且他領軍的聚石塔是之前淘寶系基于阿里云所做的最重要的項目 之一,對阿里云也有比較深的了解。同時,以集團副總裁章文嵩、傳奇技術專家蔡景現(花名多隆的他剛剛成為阿里集團的合伙人)等為代表的許多原淘寶系技術精 英也進入阿里云,負責主要產品的研發,大大增強了阿里云的技術實力。2014 年 9 月原 Oracle 全球副總裁喻思成加盟,以集團副總裁出任阿里云技術業務總經理。再加上以劉振飛為首的猛將如云的阿里技術保障部在基礎設施和運維的全力支持(參見本期文章 《阿里技術保障部:阿里云的幕后英雄》)。至此,阿里云的陣容空前強大。

        2013 年 9 月,在王堅卸任阿里云總裁的消息發布之后,媒體有各種不明內情的解讀。10 月阿里云開發者大會,在會場附近的綠地上,我和其他云棲小鎮聯盟的成員一起見證了飛天 5K 紀念碑的揭幕儀式,王堅非常動情地張羅著眾多還在阿里云或者已經離開的同事一起與刻著大家名字的紀念碑合影。我知道,這個紀念碑其實主要是王堅自己與小伙 伴們幾年在云計算核心技術自主研發上篳路藍縷的階段性總結,他的云計算之路遠沒有結束。此后,由于有了更多強有力的幫手,他得以從具體業務抽身,更多地將 精力轉到云計算和大數據戰略思考、客戶溝通與布道上,在更大的范圍內發揮自己的影響

        事實上,王堅自己一直認為,阿里自己的業務用不用阿里云,對阿里云而言并不是最重要的事情。阿里云要成為全社會的通用計算平臺,這個難度無論從 技術還是服務上,比支撐阿里內部要大得多。只不過阿里云如果做得好,阿里內部也會用,這是一個附帶的成果。這一年來,他與各種類型的客戶交流,感觸很深。 他說,無論是政府、金融還是中小企業,一旦轉到云計算,所能釋放出來的創新能力,遠遠超出了他的想象,經常令他心潮澎湃。而客戶對云計算的態度很大程度上 已經轉變,越來越多人對云計算是樂于接受的。反過來,云平臺的挑戰也越來越大。這么多客戶要用,你的能力夠不夠,你接不接得住?就拿鐵道部網站的問題來 說,這其實不完全是政府相關部門的問題,更多地是圍繞鐵道部的那些企業的問題。很多事情解決不好,中國的企業不能老是賴政府,企業也有自己的責任。云計算 企業要盡快提升自己的能力,否則很多客戶會不得不去做一些不正確的事情,比如大規模地自行建設數據中心,用非常傳統的技術架構。“最怕的事情是,五年后專 家們不斷呼吁要扶持國產云計算。”王堅說自己經常有時不我待的緊迫感。

        與此呼應,王文彬在介紹阿里云工作重點時說,今年的主要目標是在提升既有產品穩定性和體驗、推出更為豐富的新產品的基礎上,擴大阿里云的影響和 市場份額,提升阿里云的口碑。產品和服務都是重中之重。他希望與更多合作伙伴一起提升用戶體驗。云計算本身似乎存在一個悖論,就是為了競爭和擴大規模,必 須不斷降價,而這又會最后使平臺自身無利可圖。Amazon 最近的財務表現似乎證明了這一點。微軟的云負責人在闡明自己優勢時,說的是除了云平臺本身的收入之外,微軟還有其他軟件授權收入,言下之意也是云計算本身 不太掙錢。這也是許多其他巨頭尤其是主營業務利潤率比較高對此看不清楚,而遲遲沒有真正投入的重要原因之一。

        對此王堅表示,現在關于云計算還是有很多似是而非的認識。一方面,阿里、淘寶平臺還有公共電力行業的發展歷史,都證明了平臺本身最后能夠成為大 生意,而且并不困難。由于杰文斯效應(Jevons effect),技術的進步會增加對技術的消費量,只要到了一定的規模,盈利是遲早的事情。另一方面,我們實際上已經從 IT(信息技術)進入到 DT(數據技術)時代,互聯網 + 數據取代了計算機 + 軟件,云計算是將更多行業乃至全社會數據化的平臺和前提,它的價值不只是平臺本身的盈利,而更在于作為基礎設施,將數據的價值釋放出來。這個意義要大得 多。最近的幾次談話中,他舉了非常多讓自己感動和驚訝的云計算用戶案例。“用戶用阿里云在做的事情,才是阿里云的價值所在。”他舉例說,美國電力科學研究 院(EPRI)的數據表明,一部 iPad 如果每天完全充電一次,一年所耗費的電費只有 1.5 美元,而用戶拿它去干的事情則不知道會多么偉大。王文彬也非常強調阿里云上推出 ODPS 這種大數據服務的意義,這也是阿里云目前的重要特色之一。

        從很多方面來看,中國的云計算發展有可能超越美國。由于阿里等互聯網公司積極向各行業滲透,具有比美國同行更大的影響力,加上國內許多公司的 IT 系統并不成熟,全社會又具有改革慣性,完全有可能直接跨越一個階段,基于云計算平臺構建新的核心 IT 系統。這既是阿里云及其同行的機遇,也是重重的責任。

                    <span id="shareA4" class="fl">                            
                        </span> 

</div>

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!