繼谷歌和臉書之后 百度宣布開源人工智能代碼
北京時間 1 月 15 日上午消息,百度本周宣布開源人工智能代碼,從而在人工智能技術的標準發展中掌握一定的主動權。此前,谷歌和 非死book 也宣布將開源相關技術。
百度硅谷實驗室已經向 GitHub 上傳了 Warp-CTC C 代碼庫。與此同時,百度在一篇博客文章中鼓勵開發者試用這些代碼。
CTC 結合了多個不同的神經網絡設計,以處理不完美的數據集。換句話說,這一系統能利用更復雜的數據模式。這一方法在語音識別應用中已經得到了證明。
百度研究院在 CTC 的基礎上開發了自己的系統,優化語音識別產品。語音識別在中國非常重要,因為中國各地有著不同的口音,而中文的書寫也不便于數字化。
百度表示,Warp-CTC 所需的存儲空間較小,比普通 CTC 速度快數百倍。
關于為何決定開源這一軟件,百度表示,該公司希望使“端到端的深度學習變得更簡單、速度更快,加快研究者的進度”,而“此前的代碼在訓練端到端網絡時速度太慢”。百度還表示,將向機器學習社區貢獻該公司開發的一塊重要代碼。
不過業內人士認為,百度這樣做的真正原因在于,谷歌于去年 11 月開源了 TensorFlow 軟件,而 非死book 也于去年 12 月公開了 Big Sur 人工智能硬件架構。百度擔心,如果開發者開始學習競爭對手的技術,那么該公司將會落后。
人工智能已成為互聯網的重要一部分,能給相關公司帶來明顯優勢。然而,人工智能很復雜,能否取得成功取決于軟件和硬件的結合。而如果沒有向第三方開發者開放代碼,那么就有可能被邊緣化。
https://github.com/baidu-research/warp-ctc
來自: 新浪科技