斯坦福大學開發 RAMCloud 或成傳統硬盤終結者
科技網站 arstechnica.com 日前發表文章稱,斯坦福大學計算機系的一個研究小組正在創建一種名為 RAMCloud(內存云)的系統,試圖以 DRAM(動態隨機存儲器)取代傳統硬盤。以下是原文主要內容:
用閃存取代傳統硬盤,已經成了 IT 業界的發展趨勢。但是斯坦福大學的一個研究小組進一步提出:DRAM 才是傳統硬盤的“終結者”。
為了實現這一目標,這個研究小組正在開展一項名為“RAMCloud”(內存云)的項目,它能夠聚合上千臺服務器的內存,從而極大地提高數據訪問速度。由于 DRAM 一旦斷電就會丟失數據,硬盤(或許還有閃存)仍可用于數據備份。但在日常運行中,所有信息應用訪問都直接來自 DRAM。
對于 RAMCloud 所面臨的潛在障礙,項目負責人、斯坦福大學計算機系教授約翰·歐斯特霍特(John Ousterhout)也并不避諱。他表示,障礙之一是超低延遲網絡的發展——現有網絡性能需在未來三五年內取得極大進步,RAMCloud 才能有用武之地。
但是 RAMCloud 一旦成功,也將帶來巨大的收益。DRAM 價格昂貴,但是它的速度比閃存快5-10倍,比傳統硬盤快100-1000倍。而企業使用傳統機械硬盤時,很少會把硬盤的存儲容量塞滿,但卻在數據訪問速度上備受限制。所以盡管 DRAM 每字節的存儲成本比硬盤貴50-100倍,但歐斯特霍特教授認為,DRAM 的每次讀寫操作成本依然低于硬盤。
一些廠商已經認識到 DRAM 的性能優勢,其實 VoltDB 等數據公司已經建立了內存型數據庫,主要用于某些交易繁多的專業應用。歐斯特霍特相信,隨著技術發展和價格下降,DRAM 未來將有更廣泛的用途。
RAMCloud:數據新家園
2009年12月和2011年10月發表的兩篇論文,描述了 RAMCloud 在數千臺服務器和數百 TB 數據上的應用。 2009 年的論文中寫道:“所有信息一直保存在 DRAM 中,DRAM 是數據的永久家園,而磁盤僅用于備份。”此外,RAMCloud 必須自動形成一定規模,從而支持數以千計的存儲服務器;應用程序所看到的只有存儲系統,而與存儲服務器的數量無關。該論文稱,裝有 RAMCloud 的網絡每秒鐘可處理 100 萬次服務請求。
現在,歐斯特霍特和和他的研究團隊已經做出了由80臺各裝有24GB DRAM 的服務器組成的2TB 原型系統,雖然離目標還有一定差距,但是它一旦遇到系統崩潰,僅需5微秒就能恢復基本的讀取操作。研究團隊從一年半以前開始為該系統編寫代碼,但是該系統的“1.0版”仍需6到12個月才能投入商業使用。
歐斯特霍特認為 RAMCloud 系統的首批用戶,會是那些在創建前沿互聯網應用程序時受到存儲系統局限的團隊——對于他們而言,傳統數據庫不能保障數據的實時訪問。例如 非死book 這樣的網站,就很可能從 RAMCloud 中受益,歐斯特霍特表示他已經和 非死book 的高管進行過相關討論。普通用戶或許感覺不出什么區別,但 非死book 網頁上生成的顯示內容,的確受到了數據訪問速度的限制。“他們現在受到很大局限,因為他們沒有足夠快的存儲系統。”
但是,就算技術已經成熟,非死book 也不可能在一夜之間將其存儲系統全部換成 RAMCloud。不過歐斯特霍特表示,他們團隊的研究工作已經吸引了一些閃存設備廠商和存儲系統公司。歐斯特霍特認為,從長遠來看,RAMCloud 有望被用于亞馬遜 Elastic Compute Cloud 或者 Windows Azure 等云網絡,甚至被用于企業數據中心。
磁盤將被取代
研究機構 Enterprise Strategy Group(企業戰略集團)的創始人兼高級分析師史蒂夫·杜普雷西(Steve Duplessie)認為,未來存儲系統終將拋棄機械硬盤,但這一淘汰過程需要多長時間,還是一個未知數。“與其說這是一個技術問題,不如說這是一個經濟學問題。這取決于我們何時能降低成本、讓它變得更實用。
SSD(固態硬盤)產業近年來方興未艾。雖然將全部傳統磁盤替換成固態硬盤的花費過于高昂,但是在分級系統中將傳統硬盤與閃存聯用,再利用數據壓縮與重復刪除技術,是一種既有效又可行的方法。杜普雷西表示:“雖然才剛剛開始,但是這是世界性的發展趨勢。”
RAMCloud 是一種大膽創新,不過最近被戴爾收購的 RNA Network 公司也曾經提出過類似的構想——RNA Network 曾試圖匯聚所有服務器的 DRAM,創建一個每臺服務器都能訪問或被訪問的超大虛擬 DRAM。但是,這一構想目前還沒有實現商業化。
雖然 DRAM 價格昂貴,但是杜普雷西指出,現在的數據中心 DRAM 利用率很低,很多 DRAM 都被閑置。他表示:“既然已經買了它(DRAM),就該好好利用起來。”
歐斯特霍特表示,幾年之內,RAMCloud 所適用的服務器將擁有多達256GB 的 DRAM。他相信 RAMcloud 不是那種停留在論文和簡易原型階段的“典型研究項目”:“我們做的東西是供他人使用的。它們是開源的。如果這一系統真的有用,我們希望它能得到廣泛的應用。”