深度學習“最強大腦”,浪潮版開源Caffe發布!
提要:
在日前舉行的全球最知名GPU技術大會GTC 2015上,來自中國的浪潮公司發布了首款高性能MPI集群版的Caffe深度學習計算框架,并開源公布所有代碼,為深度學習的用戶提供了更便捷、更高效的應用手段。
CNN:最接近人腦思維的算法
深度學習(Deep Learning)是近年來機器學習領域的熱點。有分析認為,深度學習將成為未來計算機發展的必然趨勢,而從谷歌大腦計劃所引申出的眾多“腦計劃”也說明深度學習已經成為目前許多互聯網企業在語音識別、圖像識別等領域取得突破性進展的方向之一。
深度學習的表現方式是通過構建深層神經網絡,來模擬人類大腦的工作原理,進而實現類似人腦思維方式的計算形式。我們都知道大腦的復雜程度是不言而喻的,因此深度學習所構建的神經網絡也相當龐大,運行過程中需要海量的計算能力,這也為高性能計算提供了全新用武之地。
CNN算法是深度學習領域所普遍采用的一項神經網絡的構建模型,通過將特定的數據池如 ImageNet導入該模型進行層層訓練,才能使機器達到人類要求的某項能力。
ImageNet是目前最常用的視覺數據池,它由斯坦福計算機科學家李飛飛(Fei-Fei Li)建設,里面包含了 1400 萬經過標簽分類的材料,囊括五花八門的圖像。
然而通過傳統的CNN模型訓練ImageNet非常耗時,大概需要幾十天的時間才能完成訓練。Caffe是目前最快的CNN架構,它最早由UC伯 克利實驗室完成單機單卡的開發,針對深度卷積神經網絡(Deep Convolutional Neural Networks,CNN)訓練所設計。然而隨著訓練模型越來越復雜,單機單卡已經不能滿足用戶的需求。
首發集群caffe,讓CNN奔跑起來
本次浪潮發布的集群版Caffe計算框架正是切中當下深度學習的迫切需求,它采用高性能計算行業成熟的MPI技術對Caffe版本進行數據并行的優化,該并行caffe計算框架基于伯克利的caffe架構進行開發,完全保留了原始caffe架構的特性。
即:純粹的C++/CUDA架構,支持命令行、Python和MATLAB接口等多種編程方式,具備上手快、速度快、模塊化、開放性等眾多特性,為用戶提供了最佳的應用體驗。
浪潮開發的集群并行Caffe計算框架已經在某超級計算機上進行部署并測試,測試結果顯示,在保證正確率相同的情況下,浪潮Caffe在8節點上并行計算效率上提升10.7倍,大大提升了計算速度,加速業務的快速進行。
浪潮已經將其開發的集群并行版Caffe軟件代碼開源發布在Github, 這將有助于讓更多的用戶方便了解和應用這款軟件,加速深度學習的應用發展。