Apache Spark 1.6 預覽版:更簡便的搜索
日前,Databricks公司發布了一個Apache Spark主要版本的可用性。除了可用性、可移植性等幾個新的特性外,本次發布還提供了對尚未發布的Apache Spark 1.6預覽。 Databricks用戶有機會在官方發布之前試用Spark 1.6的特性,包括在Databricks集成空間內輕松搜索Spark文檔、點擊幾個按 鈕便能在不同Databricks實例間共享Databricks的notebooks。在本博文中,將對這些令人興奮的新特性提供一個簡短的介紹。
Apache Spark 1.6預覽
Patrick Wendell宣布了Spark 1.6 預覽版。我們很高興該預覽可用,以使我們的用戶在快速發展的開源項目上能夠占據優勢。在Databricks公司網站上可以試用該Spark 1.6預覽。
要 從Databricks網站上獲取該預覽版,Databrick用戶只需要通過Databricks集群管理器用戶界面選擇 Version 1.6.0 (Preview),然后再運行該預覽包即可。 創建Spark 1.6集群時可以同時保留更早版本的Spark集群,也可 以將老版本的Spark應用程序代碼運行在Spark 1.6集群當中以便測試1.6版的性能改進,目前的Databricks支持的Spark老版本包 括1.3、1.4和1.5。由于Databricks支持運行多個Spark版本,用戶在保證原有生產環境穩定的同時也能夠試用新版本提供的新特性。
Patrick將在12月1日開展關于Spark 1.6的網絡講座,現在注冊可以獲取具體細節。
Databricks Notebooks可移植性的改進
之前,我們公布了一個新特性, 該特性允許用戶把notebooks導出為HTML格式。我們對該功能進行了擴展,擴展后支持將先前導出的HTML格式的notebook導入到任何 Databricks實例中。這樣的話用戶在共享notebook和協作時具備更多的選擇,包括跨越不同Databricks實例的協作。
更簡易的Spark文檔搜索
Databricks集成搜索特性為用戶提供了更簡便的查找相關信息的方式。通過該發布版,用戶也可以輕松地在Spark官方文檔中搜索,以查找最新的信息。
展望
作為一個SaaS平臺,Databricks通過快速迭代持續不斷地提升用戶體驗。如果你已經有Databricks賬戶,我們歡迎你嘗試下這些新特征,并提供使用反饋意見。如果你有興趣對Databricks先行試用一番,可以和我們任一個方案架構師聯系,或者直接到官網注冊試驗。
原文鏈接:New Databricks release: Preview of Apache Spark 1.6, easier search, and more(譯者/牛亞真 審校/朱正貴 責編/仲浩)
譯者簡介:牛亞真,中科院計算機信息處理專業碩士研究生,關注大數據技術和數據挖掘方向。