面向 Python 語言的三大頂級機器學習庫

vmvc6627 8年前發布 | 12K 次閱讀 數據挖掘 Python Python開發

事實證明,無需掌握艱深的數據科學,我們同樣能夠在機器學習的世界中徜徉。當然,這段旅程不可避免地需要借助各類大數據、人工智能、深度學習與規模化統計與分析工具的幫助。

在今天的文章中,我們將共同了解三款最具人氣的Python機器學習庫,相信能夠幫助大家帶來更為順利的數據科學探索體驗。

1、 Theano

約十年前誕生的機器學習方案Theano,是目前機器學習領域使用范圍最廣的CPU與GPU數學編譯器之一。

在《Theano:用于快速實現數學表達計算的Python框架》這篇論文當中,作者對這套庫進行了全面的概述。“Theano包含多款軟件包,用以強化自身功能。能提供高水平用戶界面,足以處理多種特定目標,”論文解釋稱:“其中的Lasagne與Keras能夠有效簡化深度學習模型以及作為數學表達式的訓練算法的架構表達。事實上,概率編程框架PyMC3就在利用Theano以自動生成表達式并快速執行所生成的C代碼。(Keras與Lasagne同時運行在TensorFLow與Theano之上。)。”

Theano目前在GitHub上擁有超過2萬5千項提交成果以及近300名貢獻者,fork次數將接近2千次。

2、 TensorFlow

TensorFlow是一套利用數據流圖形進行數值計算的開源庫。盡管只是開源領域的一名新兵,但這一由谷歌公司牽頭的項目已經擁有近1萬5千條提交成果以及超過600名GitHub貢獻者,模型庫的星評更是逼近1萬2千顆。

在第一份《開源年鑒》當中,TensorFlow被選為2016年最值得fork項目。而在最新的《開源年鑒》內,TensorFlow同樣多次亮相。基于TensorFlow的Magenta項目甚至在嘗試將機器智能同藝術領域加以聯系,探索如何利用它來實現音樂與藝術創作,并由此建立起以藝術家、程序員以及機器學習研究者的混合型社區。另外,Tensorflow支持多種前端語言,但對Python的支持是最好的,Python還被列入2017年熱門編程趨勢排行。

TensorFlow 1.0于今年2月中旬推出。谷歌在其開發者博客中寫道:“盡管剛剛誕生一年,但TensorFlow已經切實幫助研究人員、工程師、藝術家、學生以及其他各類用戶完成各類工作,它范疇涵蓋語言翻譯、皮膚癌早期診斷乃至糖尿病患者并發性失明預防等領域等”。

3、 scikit-learn

這套方案立足于NumPy、SciPy以及Matplotlib,并被Spotfiy公司的工程師們用于進行音樂推薦。而在OkCupid公司,是負責對匹配系統進行評估與改進。在Birchbox公司,工作人員正在摸索如何利用scikit-learn支持新產品的開發。

 

 

來自:http://mp.weixin.qq.com/s/m5rrFy_tPFGECjTRDldv_w

 

 本文由用戶 vmvc6627 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!