大數據時代 微軟被迫接受開源
微軟于2012年春季啟動了永久VM特性的一個社區技術預覽(Community Technology Preview, CTP)測試構建(test-build)。微軟自己已經為支持永久VM,特別是在上面支持Linux,作好了準備。微軟將允許用戶在Azure上建立永 久VM這一事件來得并不意外。 雖然Azure擁有永久存儲能力,但其無法保持一個永久VM的缺陷已惹惱了許多人,而且他們不光是Linux服務器管理員。 還有部分SharePoint和SQl Server管理員,他們曾為此缺陷而有意避開Azure。其實也有辦法彌補Azure無法保持永久VM的缺陷,但它們都不簡單。
在過年幾年的時間里,從SUSE Linux開始,微軟已經在其Hyper-V 虛擬機平臺上對Linux提供了支持。今天,微軟還支持上了Red Hat Enterprise Linux (RHEL) 和CentOS。此外,還有傳言稱去年夏天,微軟打算在Hyper-V上支持Debian 和Ubuntu,但后來就不了不之了。微軟當時沒支持Linux 是因為它太愛Linux 了;它當時支持它,是因為它的顧客需要Linux服務器支持;現在,顧客更是更進一步地推動微軟去支持Linux,不過此時已經是在云端。
而今,微軟的業務顧客正要求在云端有同樣的VM支持,而微軟則不得不提供這一支持。正如發言人Foley 報道的,“在Azure上運行Linux已經成了一個大得驚人的業務顧客需求”。亞馬遜彈性計算云(EC2)上操作系統的云市場分析表明,相比1,120 個Windows實例,有6,556個Linux實例在云上運行。幾乎6:1的比例。
大數據的泡沫在毫無止境的膨脹,它給IT企業帶來了顛覆性的改革。 Hortonworks的CEO Eric Baldeschwieler表示,目前企業中80%的數據是非結構化數據。更為雷人的是這些數據在以60%的速度呈現指數級增長,到2020年,全球數 據使用量預計將暴增44倍,達到35.2ZB(1ZB=10億TB)。大數據的急劇蔓延使得企業在存儲架構方面逐漸面臨著史無前例的考驗,由此引發了數據 倉庫、數據挖掘、商業智能、云計算等應用的一連串連鎖反應。
各大企業巨頭紛紛有所行動,雅虎、AOL、谷歌、非死book等早期采用并使用Hadoop來存儲和分析PB級別的非結構化數據。IBM也在 SmartCloud 平臺上新增基于 Apache Hadoop 的服務 InfoSphere BigInsights 分析軟件。Oracle的Big Data機采用了NoSQL數據庫和Hadoop框架。EMC也推出了世界上第一個定制的、高性能的Hadoop專用數據協同處理設備—— Greenplum HD數據計算設備。Google 的網絡搜索引擎在得益于算法發揮作用的同時,Hadoop的核心MapReduce 在后臺發揮了極大的作用。億貝的Hadoop系統能夠很好地處理大規模非結構化數據,高效處理用戶郵件數據。
Microsoft已經將Hadoop作為自身大數據戰略的核心。Microsoft此舉的理由就是看中了Hadoop的潛力,在大數據領域 Hadoop已經成為分布式數據處理的標準。通過集成Hadoop技術,Microsoft允許客戶訪問快速增長的Hadoop生態系統。同時隨著越來越 多善于在Hadoop平臺進行開發的人才涌出,這對Hadoop發展極其有利。
Microsoft的目標不僅僅是將Hadoop集成到Windows系統之中,Microsoft有意向Apache Hadoop社區貢獻代碼,并希望得到社區的采納。最終使任何人都可以在Windows上運行純粹開源的Hadoop。
Microsoft的Hadoop版本目前發展到“客戶技術預覽版”的階段。這意味著Microsoft在接受客戶群體的評價,預計正式版會在 2012年中期推出。Microsoft的Hadoop基于Windows Server平臺或Microsoft云平臺Azure之上。在將要推出的1.0版本之中,產品核心包括MapReduce、HDFS、以及Hadoop 組件Pig和Hive。
Microsoft的目標是兼容所有的Hadoop組件。Hadoop生態系統中的Zookeeper、HBase、HCatalog和 Mahout等組件也會被附加到Microsoft的Hadoop版本之中。在后端,Microsoft對Hadoop進行了其他的改 善,Microsoft將整合Active Directory方便訪問控制。同時集成System Center用于管理人員管理。
Microsoft官方計劃在即將于6月舉行的TechED大會上公布有關WAAD(Windows Azure Active Directory)的更多細節。這與Microsoft在Windows Server系統上的Active Directory的概念如出一轍。未來使用ACS(Access Control Service)與現有的Active Directory部署時可保證良好的互操作性。
歷史回眸
1984年,Richard Stallman 發起GNU和Free SoftwareFoundation,至今,開源已經有28年的歷史。從最底層的操作系統到高級桌面應用,都有開源的足跡。而其中尤以開源操作系統 Linux爭議引人注目,也受到許多的商業攻擊。很多人喜歡把開源和商業放到一起去比,以指責開源是如何的“不正規”、“耗費精力”、“不穩定”等等,其 中尤以微軟為甚。
對付開源微軟公司最擅長的莫過于專利,十幾年前只有200件專利,而現在的專利數就達到了每年3000件。紅帽公司的法律顧問韋布力克(Mark Webbink)認為微軟此舉的目的正是出于保護商業利益和限制競爭對手的考慮。 據悉,由于在查詢專利侵權方面成本很高(每查詢一次專利就耗費5000美元),很多Linux的客戶或開發人員在專利問題上投入的精力不多。一旦遭到侵權 指控,他們將處于弱勢地位。
微軟對Linux有很多殺招,比如通過訪問與Linux相關的網站和新聞組,甚至直接與開源軟件的投資人電話交談,充分了解Linux的運作情況, 以便最終摧毀Linux。雇傭大量的Linux開發人員,其中包括前IBM的Linux技術負責人,對大約20種開源軟件進行測試、研究,找出其弱點進行 攻擊。(這就是微軟雇傭Linux開發人員的真相)
微軟還資助約13個有關Linux與其自己的產品進行比較的研究,發動"真相運動",攻擊Linux的成本優勢。在Linux潛在用戶中制造不確定 性,動搖其使用Linux的決心。為此資助SCO繼續與Linux的主要支持者IBM進行法律訴訟。獲得與Linux相關的專利,聲稱要起訴侵犯其專利的 企業。采用靈活的價格策略,阻止用戶遷移到Linux上。針對Linux的中間銷售商,進行所謂的"深度談心",要他們同時銷售其產品。
新聞來源:51CTO