Pentaho開源部分大數據產品,移植Kettle項目到Apache 2.0許可
Pentaho 開發商近日開源了部分數據集成軟件,并將整個 Kettle 數據集成平臺移植到 Apache 2.0 許可證下,以便從目前蓬勃發展的 Hadoop 和 NoSQL 業務中得到更多的份額,從而奠定其在大數據市場的地位。
Pentaho 是目前世界上最流行的開源商務智能(Business Intelligence,BI)解決方案。它是一個基于 Java 平臺的 BI 套件,包括一個 Web Server 平臺和幾個工具軟件:報表、分析、圖表、數據集成、數據挖掘等工具,可以說包括了商業智能的方方面面。Pentaho BI 提供了社區套件和企業套件兩個版本,社區版完全免費。
Kettle 是 Pentaho 的一個重要組成部分,是一個 ETL(Extraction-Transformation-Loading,數據提取、轉換和加載)工具,允許用戶管理來自不同數據庫的數據,通過提 供一個圖形化的環境來描述你想做什么,而不是你想怎么做。
據 Pentaho 稱,此次 Kettle 項目中被開源的軟件的大數據功能包括“可以對以下 Hadoop 和 NoSQL 數據庫中的數據進行輸入、輸出、處理和報告操作:Cassandra、Hadoop HDFS、Hadoop MapReduce、Hadapt、HBase, Hive、HPCC Systems 和 MongoDB”。與這些功能相比,傳統的關系型數據庫和相關工具的大數據集處理能力明顯不足。
Pentaho 稱,此次基于 Apache 許可證開源數據集成產品,將會顯著提升開發者、分析師和數據科學家的效率,并促使他們成功。
Pentaho 大數據社區主頁:http://wiki.pentaho.com/display/BAD/Pentaho+Big+Data+Community+Home
Via Zdnet
來自: www.iteye.com