MapD GPU數據庫開源了

jopen 7年前發布 | 32K 次閱讀 MapD GPU

MapD GPU數據庫開源了

近日,據美聯社官網報道,MapD Technologies 將 MapD Core 數據庫發布到了開源社區。MapD 是使用圖形處理單元(GPU)以毫秒為單位分析數十億行數據的先驅,比傳統的基于 CPU 的數據庫快幾個數量級。MapD Core 數據庫及其可視化庫開源讓每個人都可以使用這個世界上最快的分析平臺。

Todd 是 MapD Technologies 創始人兼首席執行官,據其博客介紹,他們在 5 年前開始 MapD 項目時就一直希望將其開源,當時沒有那么做,是因為他們希望等代碼庫成熟。現在,他們注意到,整個 GPU ML 和深度學習技術棧都是開源的,但卻沒有一個開源的數據處理引擎。開源 MapD Core 數據庫就是為了填補這項空白。開源讓他們可以和生態系統的其他部分整合。同時,他們還宣布,和 Continuum AnalyticsH2O.ai 成立了 GPU Open Analytics Initiative(GOAI),并公布了第一個項目 GPU Data Frame(GDF)。該項目可以實現數據在 GPU 進程之間的高效交換,而且避免了復制數據的開銷。

此次開源包含如下內容:

  • MapD Core 開源數據庫——MapD Core 數據庫源代碼遵循 Apache 2 許可協議,提供了 SQL 查詢多 GPU 加速所需要的一切;
  • MapD 可視化庫——MapD 提供了開源的 JavaScript 庫,讓用戶可以構建基于 MapD Core 數據庫的定制化 Web 可視化應用。該庫包含生成圖表、交叉篩選數據及管理 MapD Core 數據庫連接的功能。其中,圖表和交叉篩選庫基于流行的 Dimensional Charting 項目(DC.js )。

同時,他們還公布了 MapD 分析平臺企業版,其中包括 MapD Core 數據庫、MapD Core GPU 渲染引擎及 MapD Immerse 可視化分析客戶端。它還提供了開源版本不具備的分布式擴展、高可用(HA)、LDAP 及 ODBC 特性。他們的路線圖上還有其他后續會增加到企業版的特性,尤其是在安全方面。

此外,MapD 還發布了一個社區版本,供非商業開發和學術使用。MapD 社區版遵循非商業性的學術許可,包含 MapD Core 數據庫、GPU 渲染引擎及 MapD Immerse 可視化分析客戶端。

這一消息引起了廣泛的反響。New Enterprise Associates 投資合伙人 Greg Papadopoulos 表示:

一個開源的 GPU 數據庫將會讓全新的應用程序成為可能,尤其是在機器學習方面,GPU 在這方面的影響是如此之大。和 MapD 合作,我們非常自豪,因為它邁出了關鍵的一步。

加州大學教授 John Owens 則表示:

我的研究小組主要是針對并行計算設備,尤其是 GPU,開發更快的算法。一段時間以來,MapD 正在做的工作給我們留下了深刻的印象,只是希望我們可以在研究中把它作為真實世界的測試平臺。現在,他們開源了自己的數據庫產品,我們的團隊很高興將其作為研究平臺,并向其代碼庫做貢獻。

DGX Systems NVIDIA 總經理 Jim McHugh 認為,MapD 開源 Core 數據庫的決定意義重大,它進一步激勵了本來就已經很活躍的 GPU 分析社區。

要了解更多信息,請點擊這里。感興趣的讀者也可以加入官方論壇

來自: InfoQ

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!