百度組建深度機器學習開源平臺 研發“蟲洞”項目

jopen 9年前發布 | 25K 次閱讀 百度

5月21日消息,由百度牽頭的分布式深度機器學習開源平臺日前正式面向公眾開放,該平臺隸屬于名為“深盟”的開源組織,該組織核心開發者來自百度深度學習研究院(IDL),微軟亞洲研究院、華盛頓大學、紐約大學、香港科技大學,卡耐基·梅隴大學等知名公司和高校。

據透露,“深盟”目前的重點開發項目被命名為“蟲洞”,其將成為所有深盟項目的統一入口。蟲洞將自動構建深盟所有項目,為對所有組件提供一致的數據流支持,無論數據是以何種格式存在網絡共享磁盤,HDFS,還是Amazon S3。

此 外,它還提供統一腳本來編譯和運行所有組件,使得用戶即可以在方便的本地集群運行任何一個分布式組件,又可以將任務提交到任何一個包括Amazon EC2,Microsfot Azure, Google Compute Engine在內的云計算平臺,并提供自動的容災管理。

截止目前,“深盟”分布式深度機器學習開源平臺的已有組件已成功覆蓋三類最常用的機器學習算法,包括被廣泛用于排序的決策樹模型(GBDT),用于點擊預測的稀疏線性模型(如Sparse Logistic Regression),以及目前的研究熱點深度學習。

未來“深盟”將致力于將實現和測試更多常用的機器學習算法,并通過更好的融合當前各類組件,將提供更為一致性的用戶體驗。

資料顯示,機器學習是人工智能研究領域中的重要方向,而深度學習則是近年機器學習領域的一個重大突破, 作為目前最接近人腦的智能學習方法,深度學習可以完成需要高度抽象特征的人工智能任務,如語音識別、圖像識別和檢索、自然語言理解等,有著廣泛的應用前景。

在 深度學習的研發上,百度一直在布局,早在2013年,其便組建了百度IDL(深度學習研究院),面向全球延攬一流學術人才,并嘗試將深度學習應用于語音識 別和圖像識別、檢索,以及廣告CTR預估(Click-Through-Rate Prediction,pCTR)等領域。

2014 年,百度又將Andrew Ng招致麾下,Andrew Ng是斯坦福大學人工智能實驗室主任,入選過《時代》雜志年度全球最有影響力100人。百度稱,到目前為止,已有8項深度學習技術在百度產品上線,在用 GPU提升計算效率,處理海量訓練數據,語音識別,OCR識別,人臉識別,圖像搜索等領域均有突破。

百度稱,通過深度機器學習開源平臺,世界各地的開發者們可免費獲更優質和更容易使用的分布式機器學習算法源碼,從而降低開發和部署分布式機器學習系統及相關應用的門檻,包括今日頭條、汽車之家等在內的多家公司已通過該開放平臺受益。

深盟項目負責人之一、百度深度學習研究院李沐介紹稱,此次百度推出的深度機器學習開源平臺,和其他開源軟件一樣沒任何使用限制,個人和機構均可自由使用。其最大優勢在于達工業級應用標準。

李沐指出,目前業內流行的分布式平臺例如Spark都基于JAVA語言,開發難度雖然較低,但通常在性能上有所缺陷。而此次“深盟”推出的深度機器學習開源平臺,其核心則完全采用C++語言,性能成熟穩定,能滿足各種工業界需求。

本文轉載自: 騰訊科技

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!