Java 機器學習 工具 & 庫
下面是25個Java機器學習的工具&&庫列表:
1. Weka 是一個數據挖掘任務機器學習算法的集合。這些算法可以直接應用于數據集或者在你自己的Java代碼中調用。Weka 包含 數據預處理、分類、回歸、聚類、關聯規則、可視化 等工具。
2. Massive Online Analysis (MOA) 是一個非常流行的數據挖掘方面的開源框架,它有一個非常活躍的社區。它包括一組機器學習算法(分類、回歸、聚類、異常檢測、概念漂移檢測和推薦系統)和評估工具。同 WEKA 項目一樣,MOA 也是用Java編寫的,但卻擴展的更高。
3. MEKA 項目提供了多標記學習和評價方法的一個開源實現。在多標記分類中,我們要為每個輸入實例預測多個輸出變量。這不同于僅涉及單個目標變量的“標準”的情況。 MEKA是基于WEKA機器學習工具包。
4. Advanced Data mining And Machine learning System (ADAMS) 是一種新型的,靈活的工作引擎,旨在快速構建和維護現實世界,復雜的知識流程,基于GPLv3發布。
5. Environment for Developing KDD-Applications Supported by Index-Structure (ELKI) 是用Java編寫的開源的(AGPLv3) 數據挖掘軟件。ELKI 的重點是研究unsupervised methods in cluster analysis and outlier detection算法。
6. Mallet 是一個Java文本文檔的機器學習工具包。Mallet 支持最大熵、naive bayes以及決策樹分類算法。
7. Encog 是一種先進的機器學習框架,支持 Support Vector Machines,人工神經網絡,遺傳編程,貝葉斯網絡,Hidden Markov Models,遺傳編程和遺傳算法。
8. Datumbox 是一個用Java編寫的開源機器學習框架,允許快速開發機器學習和統計應用。該框架的主要重點是,包括大量的機器學習算法和統計測試,并能夠處理中等規模的數據集。
9. Deeplearning4j 是第一個使用Java和Scala編寫的商業級的、開源的、分布式深度學習庫。它的目的是在商業環境中使用,而不是作為一種研究工具。
10. Mahout 是一個帶有內置算法的機器學習框架,Mahout-Samsara 幫助人們創建自己的數學,同時提供一些現成的算法實現。
11. Rapid Miner 是由德國的多特蒙德大學開發的。它為用戶創建自己的應用提供了圖形用戶界面和Java API。它提供了數據處理,可視化和機器學習算法建模。
12. Apache SAMOA 是一個機器學習框架。包含了一個分布式流媒體編程抽象ML算法,使開發新的ML算法不用直接處理復雜的底層分布式流處理引擎(DSPEe, 如 Apache Storm, Apache S4, 和 Apache Samza)。它的用戶可以一次開發分布式流媒體ML算法,并執行多個DSPEs。
13. Neuroph 通過提供支持創建、培訓并保存神經網絡的Java神經網絡簡化了神經網絡的發展。
14. Oryx 2 是一個建立在Apache Spark 和 Apache Kafka之上,但專業化的實時大規模機器學習的 lambda 架構。它是一個創建應用的框架,但同時提供了包,以及協同過濾、分類、回歸和聚類的終端到終端的應用程序。
15. Stanford Classifier 是一個機器學習工具,得到數據并把它們分成 K 類。這個軟件是一個Java實現的最大熵分類器。
16. Cortical.io 是一個快速、精確、像大腦一樣的Retina API 。
17. JSAT 是一個機器學習快速入門的庫。它是我業余時間開發的,可以在GPL 3下使用。庫的一部分是自我教育,因此,所有的代碼是自包含的。JSAT是純Java的,沒有外部的依賴。
18. N-Dimensional Arrays for Java (ND4J) 是一個 JVM 的科學計算庫。它們是用來在生產環境中使用的,這意味著程序的設計是以最小的內存需求來運行的。
19. Java Machine Learning Library 是一組機器學習算法的參考實現。這些算法都是有記錄的,包括源代碼,都記錄在文檔網站。它主要是用Java編寫的。
20. Java-ML 是一個Java API,是一個Java實現的機器學習算法的集合。它只提供了一個標準的算法接口。
21. MLlib (Spark) 是一個 Apache Spark 擴展的機器學習庫。雖然是Java,但該庫提供Java, Scala 以及 Python 綁定。庫是新的,并且算法的列表很長。
22. H2O 是一個智能應用的機器學習 API。它擴展了統計、機器學習以及大數據的運算。H2O 是可擴展的。
23. WalnutiQ 是一個理論上與部分人腦有共同學習算法的面向對象的模型(工作目標是一個簡單的帶有情感的人工智能模型)。
24. RankLib 是一個排序學習算法庫。目前已經實現了八種流行的算法。
25. htm.java (Hierarchical Temporal Memory implementation in Java) 是智能學習平臺 Numenta 的一個Java端口。
via: demnag ,本文由Specs 翻譯整理,發布在Coder資源網,轉載請注明來源。