大數據領域的頂級開源工具大集合
如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大數據和運行預測分析。本文介紹了一些大數據方面的頂級開源工具,分為四個領域:數據存儲,開發平臺,開發工具和集成,分析和報告工具。
隨著大數據與預測分析的成熟,開源作為底層技術授權解決方案的最大貢獻者的優勢越來越明顯。
如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大數據和運行預測分析。借助開源與云計算技術,新興公司甚至在很多方面都可以與大廠商抗衡。
以下是一些大數據方面的頂級開源工具,分為四個領域:數據存儲、開發平臺、開發工具和集成、分析和報告工具。
數據存儲:
- Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
- NoSql 數據庫 – MongoDB, Cassandra, Hbase
- SQL 數據庫 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB
開發平臺:
- Apache Hadoop平臺 – Impala(開源大數據分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(開源大數據應用程序開發框架)
- Apache Lucene和 Solr平臺
- OpenStack(構建私有云和公有云)
- Red Hat (搭載 Hadoop 服務器的標準 Linux 發行版)
- REEF(微軟的Hadoop開發者平臺)
- Storm(集成了各種排隊系統和數據庫系統)
開發工具和集成:
- Apache Mahout(機器學習的編程語言)
- Python 和 R(預測分析編程語言)
分析和報告工具:
- Jaspersoft(報告和分析服務器)
- Pentaho(數據集成和業務分析)
- Splunk(IT分析平臺)
- Talend(大數據集成,數據管理和應用集成)
以上就是我們總結的大數據方面不錯的工具,希望對您有所幫助。
英文原文: blackducksoftware
</div> 來自:http://code.csdn.net/news/2819321
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!