【機器學習快訊】20150124第一篇機器學習快訊
快訊動機
現在每天真的是變化太快,太多的資訊信息鋪天蓋地而來,要想把每天遇到的大量的優質資訊信息進行學習吸收又非常的困難,所以特此做一個機器學習快訊專題,把平日遇到的優質文章整理羅列出來,等有時間或者遇到類似的問題的時候再看也是有益處的。
機器學習技術
- 12個用好樸素貝葉斯算法的小提示
- 使用隨機森林:Use Random Forest: Testing 179 Classifiers on 121 Datasets在很多場景下,可以先用隨機森林或高斯SVM試試,因為它們在121個數據集上的179多種算法測試中平均精度占優;小心準備數據;最終確定前用抽查的方法對比多種算法
- 《Tutorials and Winners' Interviews: Learning from the best》摘取了一些Kaggle競賽獲勝者的經驗:特征工程往往最重要、越簡單可能越好用、和積分榜過擬合是個大問題、模型組合是王道、預測目標要選對、還有一些個人建議,都比較有價值,值得參考
- 《Machine Learning Tutorial: The Max Entropy Text Classifier》關于最大熵文本分類器的介紹
- 《Supervised Machine Learning: A Review of Classification Techniques 》關于分類模型的綜述文章,可以作為引入學習的一篇導論
深度學習
- 《A Deep Learning Tutorial: From Perceptrons to Deep Networks》深度學習教程——從感知器到深度網絡,相當不錯!
- 《What is deep learning, and why should you care?》探討了深度學習的概念、訓練和意義
- 《Neural Networks and Deep Learning》免費在線書,神經網絡與深度學習。目前提供了前四章的草稿,第一章通過手寫數字識別的例子介紹NN,第二章講反向傳播算法,第三章講反向傳播算法的優化,第四章講NN為什么能擬合任意函數。大量python代碼例子和交互動畫,生動有趣,推薦!
學習建議
- 《4 Self-Study Machine Learning Projects》機器學習的學習實踐策略:學習一個機器學習工具、學習一個機器學習數據庫、學習一個機器學習算法、 實現以額機器學習算法
- 《A Few Useful Things to Know about Machine Learning》總結了12條機器學習的經驗,包括:學習=表示+評價+優化、泛化是關鍵、僅有數據是不夠的、不止一面的過擬合、特征往往是關鍵、數據多勝過算法妙、多訓練幾個模型試試、簡單不意味著準確、可表示不代表可訓練等,推薦!
- 《Level-Up Your Machine Learning》機器學習進階之路,介紹了新手、學徒、熟練工、大師、超級大師五個階段的成長特點和路徑,其根本還是多讀書多實踐
- 重點推薦《The Full List In One Page Of Data Science Resource》一個數據科學網絡資源的列表,號稱Full List,確實比較全
有關Python和機器學習
- 《The Top Mistakes Developers Make When Using Python for Big Data Analytics》用Python做大數據分析時最常犯的錯誤,主要包括:重復造輪子、性能沒調優、時間時區沒用對、手動集成其他重型技術或腳本、沒持續跟蹤數據類型和結構、沒跟蹤數據來源、缺少(回歸)測試等
- Learn Data Science - Open content for self-directed learning in data science數據科學Python自學系列,通過一系列IPython Notebooks,向你介紹Linear Regression、Logistic Regression、Random Forests、K-Means Clustering等,簡單清楚
- scrapyrt——Scrapy realtimepython下著名的爬蟲框架Scrapy的擴展版本,以HTTP服務形式提供API調用接口以使用爬蟲服務
- 《Machine learning for facial recognition》基于機器學習的人臉識別,用python實現基本的人臉識別算法
大數據工具
- Real-Time Analytics with Apache Storm -- The "Hadoop of Real-Time"Udacity上的免費新課,介紹Apache Storm上如何進行實時數據分析
轉載請注明作者Jason Ding及其出處
Github博客主頁(http://jasonding1354.github.io/)
CSDN博客(http://blog.csdn.net/jasonding1354)
簡書主頁(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!