高性能分析數據庫 Impala 升級為 Apache 頂級項目
Apache 軟件基金會宣布 Apache Impala 孵化成功,升級為頂級項目。
Impala 是一個高性能分析數據庫,可針對存儲在 Apache Hadoop 集群中的 PB 級數據進行閃電般快速的分布式 SQL 查詢。Impala 還是一個現代化,大規模分布式,大規模并行的 C ++ 查詢引擎,可以分析,轉換和合并來自各種數據源的數據。大規模并行處理(MPP) SQL 查詢引擎允許通過 SQL 或商業智能工具對存儲在本地(在 HDFS 或 Apache Kudu 中)或在云對象存儲中存儲的數據進行分析查詢,而無需將數據集遷移到專用系統或專有格式。
Impala 提供:
-
在 Apache Hadoop 中查詢大量數據(大數據)的能力;
-
集群環境中的分布式查詢;
-
在不同組件之間共享數據文件的能力,無需復制或導出/導入步驟;
-
用于大數據處理和分析的單一系統。
Impala 的靈感來自 Google 將查詢處理與存儲管理分離開來的 F1 數據庫,最初于2012年發布,并于2015年12月進入 Apache 孵化。
Impala 項目創始人 Marcel Kornacker 表示:“2011年,我們開始開發 Impala ,以便為用戶提供最先進的開源 SQL 分析。 Apache 頂級項目的畢業典禮是對這個項目背后的優秀開發者社區的肯定。”
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!