看看數據科學家們都在用什么:Github上的十大深度學習項目

jopen 8年前發布 | 59K 次閱讀 深度學習 Github

本文作者Matthew May是一位正在進行并行式機器學習算法研究的計算機碩士研究生,同時Matthew也是一位數據挖掘研習者,數據發燒友,熱忱的機器學習科學家。開源工具在數據科學工作流中起到了愈發重要的作用。Github十大深度學習項目,其中包含了大量的代碼庫,框架以及學習資料。看看Github上的人們都在使用哪些工具,都在從哪些資源那里進行學習。

最新KDnuggets軟件調查結果表明,在過去12個月,73%的數據科學家都會使用免費的數據科學工具。不言而喻,Python和R語言(兩者皆為開源)以及各自的生態系統,是這些免費的數據科學工具中,數據科學家們運用的最突出、最必不可少的。

看看數據科學家們都在用什么:Github上的十大深度學習項目

Github已成為名副其實的開源軟件交流中心,其上寄存了幾乎所有想得到的項目類型。深度學習在學術、研究和興趣方面的普及程度越來越高,并在數據科學方面越來越重要,我們將探索一下Github里出類拔萃的深度學習項目。

需要注意的是,大部分人認為屬于深度學習的一些重要項目并沒有出現在該名單上,原因在于在Github搜索「深度學習」時并沒有涉及到這些項目。

1. Caffe

看看數據科學家們都在用什么:Github上的十大深度學習項目

Caffe是利用Python和MATLAB兩者結合創建的深度學習程序庫。由伯克利大學的伯克利視覺與學習中心創辦,如果人們僅把Caffe當做計算機視覺應用是情有可原的;事實上,這是一個通用的深度學習程序庫,能夠開發卷積網絡,并創建其他視覺、語音等應用。

2. Data Science IPython Notebooks

看看數據科學家們都在用什么:Github上的十大深度學習項目

這是由Donne Martin策劃收集的IPython筆記本。話題涵蓋大數據、Hadoop、scikit-learn和科學Python堆棧以及很多其他方面的內容。至于深度學習,像是TensorFlow、Theano和Caffe之類的框架也均被涵蓋其中,當然還有相關的特定構架和概念等。

3. ConvNetJS

由斯坦福博士生Andrej Karpathy寫就,他也一直維持著博客更新。ConvNetJS是一個由Javascript實現的神經網絡及其通用模塊,并且包括大量的基于瀏覽器的實例。這些文檔和實例數不勝數,且非常完整。不要讓javascript和神經網絡結合在一起的想法把你嚇跑了,這可是個非常受歡迎而且非常有用的項目。

4. Keras

Keras也是一種Python深度學習程序庫,但它利用了TensorFlow和Theano,這也意味著它可以在目前已知最受歡迎的2個深度學習研發庫中的任一個上運行。也是那些越來越多的被形容為非常高級的庫之一,而所有這些高等級庫都非常相似:抽象化底層的深度學習引擎,使使用者可以更快、更便捷以及更靈活地部署神經網絡。Keras支持主流深度學習架構,自帶30秒的快速入門指南,并有著完善的文檔。

5. MXNet

作為一個深度學習框架,MXNet旨在靈活和高效,并且通過允許混合使用指令式編程及符號式編程的技巧來提高代碼生產力。這個項目可以和多種語言綁定,如Python, R, 以及 Julia。同時MXNet還附帶了一系列神經網絡指南和藍本。另外值得注意的是,一個相關項目用JavaScript在瀏覽器環境中實現MXNet,有興趣的朋友可以通過 該鏈接 對一個圖形分類模型進行測試。

6. Qix

這是一個各種計算和編程主題有關資源(包括Node.Js, GoLang和深度學習)的Github版本庫。之所以說「似乎(appears)」,是因為Github版本庫都是用中文寫的,谷歌提供的翻譯甚至會帶來更多不解。不過,有許多鏈接,所以如果你能說中文或看得懂中文,或許這里有些有價值的東西。

7. Deeplearning4j

看看數據科學家們都在用什么:Github上的十大深度學習項目

Deeplearning4j是為Java 和Scala打造的一款具有工業強度的深度學習框架。作為唯一值得研究的JVM深度學習解決方案之一,它在這個領域有著明顯的優勢。不僅可以很好地與Hadoop 以及Spark的結合,它還可以使用GPU。他的文檔和指南也非常可靠。

8. Machine Learning Tutorials

這是一張機器學習和深度學習教程,文章和資源的名單。這張列表根據通過主題進行組織,包括了許多與深度學習有關的類別,包括計算機視覺,加強學習以及各種架構。由于內容廣泛,幾個月來,已經在社交媒體上小有名氣,你也可以 點擊此處 做些貢獻。

9. DeepLearnToolbox

看看數據科學家們都在用什么:Github上的十大深度學習項目

DeepLeanToolBox是一個供MATLAB和Octave使用的深度學習工具箱。很遺憾,這個項目現在已被廢棄并停止維護。其Github版本庫也指向了在修習深度學習方面頗具價值的其他選擇:Theano和TensorFlow。

如果說這個已經廢棄的云端版本庫還有點什么價值,那就是 這個鏈接 了, 這本由Yoshua Bengio撰寫的教程被包含在了這個版本庫中以作為學習人工智能所使用的深度學習架構的學習資源。

10. LISA Lab Deep Learning Tutorials

這個Github版本庫匯總了加拿大蒙特利爾大學的LISA實驗室深度學習課程的練習材料。其介紹文檔摘取如下:

這套練習材料將介紹你們了解一些最重要的深度學習算法,以及展示如何使用Theano運行這些算法。

Theano是一個使撰寫深度學習模型變得簡單,并允許用戶選擇GPU對他們進行訓練的python庫。

點擊 這里 在線查看課程材料原文鏈接

本文選自 kdnuggets ,作者: Matthew Mayo ,機器之心編譯出品,編譯:柒柒、微胖、之乎。

來自: http://www.almosthuman.cn/2016/01/19/zvpjt/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!