Scala 機器學習庫

jopen 10年前發布 | 51K 次閱讀 機器學習

自然語言處理

ScalaNLP—機器學習和數值計算庫的套裝


Breeze —Scala用的數值處理庫


Chalk—自然語言處理庫。


FACTORIE—可部署的概率建模工具包,用Scala實現的軟件庫。為用戶提供簡潔的語言來創建關系因素圖,評估參數并進行推斷。


數據分析/數據可視化

MLlib in Apache Spark—Spark下的分布式機器學習庫


Scalding —CAscading的Scala接口


Summing Bird—用Scalding 和 Storm進行Streaming MapReduce


Algebird —Scala的抽象代數工具


xerial —Scala的數據管理工具


simmer —化簡你的數據,進行代數聚合的unix過濾器


PredictionIO —供軟件開發者和數據工程師用的機器學習服務器。


BIDMat—支持大規模探索性數據分析的CPU和GPU加速矩陣庫。


通用機器學習

Conjecture—Scalding下可擴展的機器學習框架


brushfire—scalding下的決策樹工具。


ganitha —基于scalding的機器學習程序庫


adam—使用Apache Avro, Apache Spark 和 Parquet的基因組處理引擎,有專用的文件格式,Apache 2軟件許可。


bioscala —Scala語言可用的生物信息學程序庫


BIDMach—機器學習CPU和GPU加速庫。


Figaro - 一個構造概率性模型的Scala庫


       英文原文鏈接:Scala機器學習

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!