[從0到1]關于深度學習,這里比你想的還要全
作為目前計算機科學領域最前沿和最具神秘色彩的學科,自 2006 年以來,人工智能領域隨著云計算對大數據的并行處理能力的支持,其算法也取得突破性進展,這個算法就是深度學習(Deep Learning)的相關理論。
特斯拉自動駕駛、Face++人臉識別、Apple Siri、谷歌翻譯……這些我們所耳熟能詳的創舉,其實皆為深度學習的成功應用場景。
大數據的積累、算法的改進、硬件的提升,使得人工智能 已經在很多細分的領域成為專家,輔助人類甚至超過人類。那么,如何掌握深度學習,你又是否真的了解深度學習呢?
接觸一個新的領域,第一步是盡快 了解全貌并且搭建出相應的知識體系 , 接下來就讓我們詳細地看一下深度學習的知識提綱,在本文中將先對深度學習的開發技能、開源框架等做一詳解:
【深度學習開發語言】
深度學習開源項目中,基本是用 python和C++兩大類基礎開發語言完成的 ,從部署成本看,眾多機器學習的框架都支持Python API。Python已經成為機器學習的第一語言,至于為什么,知乎(https://www.zhihu.com/question/30105838?sort=created)中有非常不錯的解釋。
要做更深入的開發,那么C++開發就是必要的技能。微軟的CNTK則是依據其C++開發環境完成的開源項目,目前看也是性能最好的開源平臺,同時GPU相關的基礎開發架構CUDA類庫也是需要C++的技術。
此外R語言和matlab是更容易學習上手的專業數學分析的工具語言。 R語言是開源項目,較適合個人研究者;matlab則是功能強大的商業應用系統,部署成本較高。
【并行計算為你加速】
矢量化編程技術是提高算法速度的一種有效方法,神經網絡等數學模型中有大量矩陣計算,利用GPU的眾核體系結構包含數千個流處理器,可將矩陣運算并行化執行,大幅縮短計算時間。 隨著NVIDIA、AMD等公司不斷推進其GPU的大規模并行架構支持,面向通用計算的GPU已成為加速并行應用程序的重要手段。NVIDIA公司的并行架構平臺CUDA開發是進階掌握的技能。
這里附上一份英偉達的CUDA官方開發指南:
http://www.nvidia.cn/object/cuda_education_cn_old.html
云計算的發展推動了大數據和人工智能的應用,涉及到超大規模數據的深度學習應用,計算集群Spark等相關架構技術則應該是必備的技能。
Spark的官方api文檔,支持java,scala,R,python四種語言,供參考:
http://spark.apache.org/docs/latest/api.html。
【深度學習開源框架】
深度學習的開源框架有TensorFlow、CNTK、Torch、Caffe、Theano、Mxnet等。
TensorFlow和CNTK由于有谷歌和微軟的后續技術支持,可以作為研究學習的開發工具平臺。
zer0n和bamos在GitHub上發表了一篇文章,對Caffe、CNTK、TensorFlow、Theano和Torch等深度學習工具從網絡、模型能力、接口、部署、性能、架構、生態系統、跨平臺等方面做了比較。
如下是翻譯的相關內容,可以初步了解各框架的優劣:
http://www.infoq.com/cn/news/2016/01/evaluation-comparison-deep-learn?utm_campaign=infoq_content&
附上tesorFlow的官方學習教程,供參考:
https://www.tensorflow.org/versions/master/tutorials/index.html
另外還有Github上微軟CNTK的資源和學習資料:
https://github.com/microsoft/cntk
Torch、Caffe、Theano也是業內常用的人工智能的開源框架,基于這些框架可以很容易搭建機器學習的平臺。至于相關開源架構的學習資料,Github上面有一份非常詳盡的學習路徑:(https://github.com/JustFollowUs/Machine-Learning)
【深度學習的廣闊應用前景】
互聯網與物聯網大數據的產生與分析促進了AI的方法發展完善和應用的實現;云計算服務為AI提供可靠的、超大規模的計算能力,并使AI計算開始成為服務輸出。
現在以深度學習為代表的人工智能已經跳出學術界的研究框架, 深度學習在圖像/語音識別、自然語言處理、數據挖據等基礎應用領域與產業結合的業務中取得了很大的突破。
深度學習在金融行業領域也取得了很多成功的應用,在 市場預測、量化投資分析、研報解析、輿情分析、風險評估、智能客服等等都可以應用到深度學習相關方法。
我們要理解深度學習模型適用的業務數據場景,將深度學習的回歸預測、分類和聚類以及關聯規則等基本應用方法同金融業務的需求相結合起來,針對金融行業的各細分應用業務場景,采用相應的AI模型解決問題。
投資者從金融市場中獲取到的數據差別越來越小,能否從中挖掘到機會,取決于是否擁有足夠好的模型和算法。從科技前沿技術中獲取先進的方法和思路,是量化投資者獲取靈感的重要手段。
人工智能與傳統行業相結合造成了前所未有的裂變,將顛覆社會經濟和生活,AI也被稱為第四次工業革命的基石。在未來5-10年之內,專業領域的定向智能化將是AI主要的應用發展方向。
后續如果仿生的人腦芯片等硬件架構能有所突破,運算能力有極大提高,則專用智能將逐步進化成為跨場景跨上下游應用的通用智能。在這過程中,深度學習和神經網絡將扮演重要的角色。
如果說機器是人類手的延伸,交通工具是人類腿的延伸,那么人工智能就是人類大腦的延伸,而正是這些黑科技在一點一點重塑我們的生活。
來自:http://rdcqii.hundsun.com/portal/article/668.html