Cassandra 這款數據庫曾被非死book拋棄 現正幫蘋果壯大

jopen 10年前發布 | 7K 次閱讀 數據庫

這款數據庫曾被非死book拋棄 現正幫蘋果壯大

        8 月 7 日,據《連線》雜志報道,開源分布式 NoSQL 數據庫系統 Cassandra 最初由 非死book 開發,后又被其 HBase 數據庫取代而遭拋棄。可是現在,Cassandra 已經成為諸多網絡巨頭關鍵的網絡基礎之一,正幫助蘋果等公司發展壯大。

        順勢而起

        馬特·法伊爾(Matt Pfeil)開車從奧斯汀前往圣安東尼奧的一路上,腦子里只想著一件事:阻止喬納森·埃利斯(Jonathan Ellis)從云計算公司 Rackspace 辭職。此前,埃利斯曾給包括法伊爾在內的同事發郵件,宣稱他將離開 Rackspace,創建一家以 Cassandra 為核心的新公司。

        Cassandra 是一套開源分布式 NoSQL 數據庫系統,最初由社交網站 非死book 開發,幫助應付后者產生的大量數字信息。法伊爾曾在 Rackspace 公司接觸過 Cassandra,因此他知道這套系統的價值。但法伊爾不希望 Rackspace 失去埃利斯。在不寫代碼時,法伊爾還幫助公司招募志同道合之人,因此他非常不想看到埃利斯離開。

        法伊爾與埃利斯在圣安東尼奧的泰國小餐館見面吃午餐,他提出埃利斯不應該辭職的一大串理由。但很快,他此來的初衷就被改變。當法伊爾指出,埃利 斯還沒有找到可以運營初創企業業務的人才時,埃利斯立刻邀請他加入新公司。法伊爾回憶說:“當埃利斯邀請我時,我開始思考自己想要什么樣的生活。我才 20 多歲,還沒有組建家庭,這正是創業的最佳時機。盡管但是我沒有立即答應,但心中已埋下種子。”

        不久后,甚至就連 Rackspace 也加入進來。這家公司不僅為法伊爾和埃利斯新的冒險發出祝福,甚至還為他們提供啟動資金。Rackspace 已經初見 Cassandra 展示出的強大威力,因為至少其 2 名重要員工對其信心十足。Rackspace 也知道,隨著網絡數據數量的日益龐大,處理起來將越來越困難復雜,而 Cassandra 的作用將逐漸顯現出來。4 年以后,埃利斯等人的冒險終于獲得豐厚回報。

        回報豐厚

        今天,埃利斯與法伊爾的初創企業 DataStax 已經成了眾多重塑數百萬數據庫市場的眾多公司之一,軟件業巨頭甲骨文也正逐漸放松對這個市場的控制。與甲骨文的傳統數據庫不同,Cassandra 等數據庫系統專被設計用于在機器集群中運行,可同時處理大量數據,而這正是現代世界所需要的。

        盡管 非死book 已經全部放棄 Cassandra,但這種技術已經成為諸多網絡巨頭最關鍵的網絡基礎之一,比如 推ter、Netflix,甚至包括蘋果公司。DataStax 也為其他各種行業建立了不同版本的 Cassandra 工具。DataStax 已經籌資 8400 萬美元,目前有員工 300 多人,正準備 IPO。埃利斯稱,他們已經有 500 多家客戶,包括“財富 100 強”中的 25 家大公司。

        誕生之旅

        非死book 工程師阿維納什·拉克希曼(Avinash Lakshman)與普拉杉特·馬利克(Prashant Malik)是 Cassandra 的最早建立者,其目的是幫助用戶在社交網絡上搜尋你的收件箱。如同其他的 NoSQL 數據庫一樣,Cassandra 廢除了傳統關系模型(即將數據在單臺機器上整齊地排成行與列),其主要特點就是它不再是一個數據庫,而是由一堆數據庫節點共同構成的一個分布式網絡服務。 對于日益擴大的 非死book 來說,這種功能非常重要。

        拉克斯曼曾為亞馬遜研究分布式數據儲存系統 Dynamo,但是他與馬利克也從谷歌 2006 年出版的書中獲得靈感,這本書專門介紹谷歌的網絡數據庫 BigTable。非死book 及其創始人馬克·扎克伯格(Mark Zuckerberg)決定于 2008 年夏為 Cassandra 開源,與 CouchDB 和 MongoDB 等其他數據庫一起,拉開了當前宏大的 NoSQL 運動序幕。

        就在這一年,Rackspace 雇傭了埃利斯,請其對下一代數據庫進行評估。當時,埃利斯幾乎測試了所有可以找到的 NoSQL 數據庫,他稱 Cassandra 表現最棒。埃利斯說:“非死book 為 Cassandra 開源,但沒有繼續推動它向前發展,可是其技術基礎依舊領先于任何人。”

        非死book 沒有圍繞 Cassandra 建立一個用戶群體,Cassandra 既代表著責任,也代表著機遇。埃利斯可以整合開源計劃以滿足 Rackspace 的需要,即建立和引導用戶群。但是直到 2010 年,埃利斯才有了創建自己的 Cassandra 公司的想法。Cassandra 已經獲得 非死book 和 Rackspace 之外的關注,當另一家公司的一名工程師告訴埃利斯,該公司已經決定利用 NoSQL 數據庫,因為一家初創企業將會提供軟件技術支持,埃利斯知道他必須行動起來。

        堅持前進

        即使 Cassandra 在默默成長,但最初的熱情也在消退。今天,已經有許多 NoSQL 數據庫與其競爭。當 非死book 決定利用 Hbase 取代 Cassandra 時,后者的榮光再受重創。即使 NoSQL 的激情消退, 但 Cassandra 依然堅持前進,并繼續沿途尋找新的用戶。據奧地利咨詢公司 Solid IT 匯編的數據顯示, Cassandra 是世界上第二受歡迎的 NoSQL 數據庫,僅次于 MongoDB,也是世界上增長速度第三快的數據庫系統。

        DataStax 在此過程中貢獻良多,包括為 Cassandra 提供名為 DataStax Enterprise 的專有服務和支持。埃利斯說:“許多公司的時間比資金更充裕,因此它們可以利用開源 Cassandra,并提供反饋。但是其他公司更希望選擇以金錢換時間,它們付錢購買企業版本的數據庫。就我個人而言,盡管銷售團隊會有歧義,但我很高興 與來自其他陣營的人合作。”

        隨著 Cassandra 用戶群的持續擴大,越來越多的公司開始支持其開發。蘋果現在已經是這一項目的第二大貢獻者,盡管其對于如何使用這種數據依然庫閉口不言。埃利斯沒有證實蘋 果是否是 DataStax 的客戶,但 3 名蘋果工程師正準備參加 9 月份一年一度的 Cassandra 峰會。Cassandra 甚至已經找到回歸 非死book 的路,這要感謝后者并購了 Instagram,Instagram 是 Cassandra 的忠實用戶。

        角逐未來

        科技界的發展已經達到了一個瓶頸,一家公司開發的數據庫產品將不可能再主導整個市場。現在,有許多儲存和處理數據的方法。但從 2008 年以來,大數據的前景始終在進化。谷歌公布諸多新工具,比如 Dremel(可以極速速度查詢數據)、Spanner(受 Cassandra 啟發開發的數據庫)。

        開源客戶群體正試圖保持這些優勢。MapR2012 年開始建造 Dremel 的復制版本 Drill,名為 Databricks 的初創企業已開發一款分析系統 Spark,雅虎正在使用。近來,一群前谷歌工程師開始建造 Spanner 的克隆版 CockroachDB。

        埃利斯說,對于 Cassandra 和 DataStax 來說,當前的戰略是確保其技術能與其他新技術兼容。比如,DataStax 近來為 Spark 推出一款連接器,能讓軟件設計師更輕松地使用 Spark 去分析儲存在 Cassandra 數據庫中的數據。埃利斯說:“我們正嘗試打造可驅動應用程序進化的數據庫,而非沒有必要的分析性數據庫。”

來自: 騰訊科技
                    <span id="shareA4" class="fl">                            
                        </span> 

</div>

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!