人工智能和機器學習領域開源項目
英文:Quora
譯文:CSDN CODE
鏈接:http://code.csdn.net/news/2822818
GraphLab
GraphLab是一種新的面向機器學習的并行框架。GraphLab提供了一個完整的平臺,讓機構可以使用可擴展的機器學習系統建立大數據以分析產品,該公司客戶包括Zillow、Adobe、Zynga、Pandora、Bosch、ExxonMobil等,它們從別的應用程序或者服務中抓取數據,通過推薦系統、欺詐監測系統、情感及社交網絡分析系統等系統模式將大數據理念轉換為生產環境下可以使用的預測應用程序。
項目主頁: http://graphlab.org/
Vowpal Wabbit
Vowpal Wabbit(Fast Online Learning)最初是由雅虎研究院建設的一個機器學習平臺,目前該項目在微軟研究院。它是由John Langford啟動并主導的項目。
項目地址: http://hunch.net/~vw/
scikits.learn
scikit-learn是一個開源的、構建在SciPy之上用于機器學習的 Python 模塊。它包括簡單而高效的工具,可用于數據挖掘和數據分析,適合于任何人,可在各種情況下重復使用、構建在 NumPy、SciPy和 matplotlib 之上,遵循BSD 協議。
項目地址: http://scikit-learn.org/stable
Theano
Theano是一個python庫,用來定義、優化和模擬數學表達式計算,用于高效的解決多維數組的計算問題。它使得寫深度學習模型更加容易,同時也給出了一些關于在GPU上訓練它們的選項。
項目地址: http://deeplearning.net/software/theano/
Mahout
Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。Mahout包含許多實現,包括聚類、分類、推薦過濾、頻繁子項挖掘。此外,通過使用 Apache Hadoop 庫,Mahout 可以有效地擴展到云中。
項目主頁: http://mahout.apache.org/
pybrain
pybrain是Python的一個機器學習模塊,它的目標是為機器學習任務提供靈活、易應、強大的機器學習算法。pybrain包括神經網絡、強化學習(及二者結合)、無監督學習、進化算法。以神經網絡為核心,所有的訓練方法都以神經網絡為一個實例。
項目主頁: http://pybrain.org/
OpenCV
OpenCV是一個基于(開源)發行的跨平臺計算機視覺庫,可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成,同時提供了Python、Ruby、MATLAB等語言的接口,實現了圖像處理和計算機視覺方面的很多通用算法。
項目主頁: http://opencv.org/
Orange
Orange 是一個基于組件的數據挖掘和機器學習軟件套裝,它的功能即友好,又很強大,快速而又多功能的可視化編程前端,以便瀏覽數據分析和可視化,基綁定了 Python以進行腳本開發。它包含了完整的一系列的組件以進行數據預處理,并提供了數據帳目,過渡,建模,模式評估和勘探的功能。
項目主頁: http://orange.biolab.si/
NLTK
NLTK(natural language toolkit)是python的自然語言處理工具包。2001年推出,至今發展非常活躍。它的主要作用是為了教學,至今已經在20多個國家60多所高校使用,里面包括了大量的詞料庫,以及自然語言處理方面的算法實現:分詞, 詞根計算, 分類, 語義分析等。
項目主頁: http://nltk.org/
Nupic
Nupic是一個開源的人工智能平臺。該項目由Grok(原名 Numenta)公司開發,其中包括了公司的算法和軟件架構。 NuPIC 的運作接近于人腦,“當模式變化的時候,它會忘掉舊模式,記憶新模式”。如人腦一樣,CLA 算法能夠適應新的變化。
項目主頁: http://numenta.org/nupic.html