相比芯片,我們更該在意深度學習框架的中國化

jopen 6年前發布 | 16K 次閱讀 深度學習

相比芯片,我們更該在意深度學習框架的中國化

這兩天美國宣布對中興進行封鎖,可謂在科技圈掀起了從上到下的一股龍卷風。

4 月 16 日美國商務部發布命令,禁止美國企業向中興通訊銷售元器件,時間長達 7 年。假如這一紙禁令真正生效,意味著中興通訊旗下全產業鏈所依靠的芯片等核心元件失去獲取渠道,基本意味著龐大的中興通訊將面臨無法繼續經營的最壞可能。

中興通訊股價隨之快速下跌,已相當于兩個跌停板,其美國供應商的股價在“禁令”發布后也遭遇不同程度的下跌。

19 日,中國商務部新聞發言人高峰在新聞發布會上表示,美方行徑引起了市場對于美國貿易和投資環境的普遍擔憂。

隨著中美貿易戰延伸到科技領域,似乎一夜間我們又回憶起了缺失核心研發能力的恐懼。“缺芯之痛”轉瞬彌漫在輿論氛圍里,甚至關于“中國科技到底行不行”的討論又一次塵囂直上。

當然了,出問題就無限夸大其實并沒有太大意義。客觀來說,美國的芯片禁令無法持久,畢竟這背后涉及的美國本土產業鏈、利益群落與工作崗位非常龐大。一旦接連失去中國大客戶,美國引以為傲的科技產業本身就會撐不住。

另外我們需要認清的是,半導體行業今天的國際格局并不是幾個月,甚至幾年內造成的。而是整個半導體工業時代發展和遺留下來的產物。中國以及全世界更多市場的計算機、工業、通用電子系統上本土芯片占有率都是零。

事實上,中興這樣的中國企業,在技術上的銳意進取是有目共睹的。但芯片研發制造能力的國際壟斷,是幾十年積累下來的產業現實,是大量的科技因素與市場封鎖、貿易規則制定綜合得出的結論。是一兩家公司,甚至是集合整個科技集群都難以改變的。

換句話說,中國科技公司面臨可能出現的困境,除了加強研發投入也沒有什么別的辦法。過去我們無法改寫,但今天我們能改變的東西,叫做未來。

就像幾十年前的半導體技術是核心中的核心。今天提起能改變未來世界的技術,AI 絕對是當仁不讓。尤其值得注意的是,這個剛剛興起、充滿變化的技術領域里,中美之間的價值突圍和技術博弈其實更加激烈。

AI 的國家戰略重要性是母庸質疑的,而針對產業鏈上游核心技術的爭奪正在逐步呈現白熱化。假如我們希望若干年后整個產業界,甚至整個國家不會再因為一紙封鎖領而恐慌,那么 AI 這個戰場的基礎設施,才是真的不容有失。

或許對于大部分人來說,AI 的底層之爭在今天還有些陌生,但它確實很可能像曾經的半導體一樣,產生新時代的世界科技格局壟斷效應。比如說每個 AI 開發者都會用到,所有 AI 應用產生的基礎——深度學習開發框架。

在這個普通人很陌生的領域,中國科技公司和萬千開發者,正在一點點刷新著中國科技的存在感。

被忽略的深度學習框架

芯片為什么重要?原因在于它是一切運算的基礎,是最后端的的東西,沒有它一切硬件都玩不轉。所以當壟斷形成,就能對其他經濟體的科技發展形成底層制約。

同樣的道理,在 AI 時代也體現在開發框架這件事上。我們知道,AI 開發者不能每開發一個模型就從最底層重新來過,所以想要進行算法訓練、模型開發、應用部署,都必須在一定的開發平臺上來完成。AI 發展到今天,這個平臺的角色主要依靠大學和企業提供的深度學習框架來扮演。

在中國,深度學習框架相對來說是一個科研和開發領域的事情,但在美國,產業界圍繞開發框架的爭奪戰早已經火星四溢。

比如說,很多美國媒體都認為,谷歌今天在云計算、硬件、語音助手、AI 教學等業務中,全都展現出“TensorFlow First”的特點,用盡各種辦法將開發者引導至自己的開發平臺上,并且堅決不兼容其他開發框架。

而 非死book、微軟則對 TensorFlow 的封閉深惡痛絕,形成了以 caffe、Python 結盟形式的“反谷歌聯盟”,希望以兼容性和社群開放等優勢,打破谷歌一騎絕塵的戰略格局。

對開發框架的重視,隱藏著科技企業和背后國家經濟體對 AI 未來的押注。試想無數應用都在自己的平臺上進行開發,那么所有數據、算法創新和模型訓練過程就都留在了平臺當中。企業和平臺收獲的,是作為地基的產業地位。而國家經濟收獲的,是可以從源頭上控制其他經濟體 AI 應用的“上游效應”。

幸運的是,已經吃夠了“下游之苦”的中國,在深度學習框架這件事上并沒有落后。

為了解決當時主流開發框架僅支持但 GPU 應用,無法進行大規模數據處理的問題。百度從 2013 年就開始研發自己的深度學習框架 PaddlePaddle,經過長期內部應用后,在 2016 年正式將其進行開源。

這也讓百度成為繼谷歌、非死book、IBM 之后,全球第四家、中國第一家開源深度學習開發框架的科技公司,之后 BAT 相繼推出深度學習開發框架,在這場基礎設施爭奪中,中國產業壁壘的高度已和過去不再相同。

可能出現的中美 AI 對決中,開發框架或是軸心武器

就目前中國 AI 的整體行業氛圍而言,似乎普遍更關注 AI“用”的一面,容易忽略在應用之前的開發與創新,以及為創新提供的基礎設施,是整個 AI 商業想象力的原點。

事實上,假如我們將中美兩國看做處于競比關系的兩個 AI 技術群落,那么深度學習框架的質量和接受度,很可能會影響到整個產業競賽的進程甚至結果。

或許可以從三個角度,來看為什么中國一定要有自己的深度學習框架,以及中國開發者為何更應該支持“國貨”。

1、 中國 AI 無法離開中文:我們知道,AI 的一個重要領域是語言與對話的交互。那么未來在中國市場應用的,必然是基于中文的 AI 開發。但在 NLP 與語音交互、神經網絡翻譯等技術上,國外主流開發框架很少有中文數據集,也缺乏在中文領域的技術探索。如今來看,開發者想要開展這方面的工作,幾乎必須依賴 PaddlePaddle 這樣的國產框架所提供的開發基礎和數據集、文檔。

2、 產業鏈的安全風險:去年,谷歌的 TensorFlow 曾經被爆出重大安全漏洞。雖然沒有造成實質影響,但當時專家評估,類似的漏洞完全可以影響甚至摧毀所有基于該平臺開發出的 AI 模型。要知道 AI 大量涉及安防、識別、城市交通、公共服務等國家事務核心領域應用,這些應用如果在國外框架中開發運行,那么安全風險不言而喻。

3、 產業應用需求不同:相比于美國,中國對 AI 開發這件事的需求其實有很大不同。比如說傳統企業多、開發者的應用需求大、商業期待迫切、開發人才處在發展階段。那么相比于前沿探索類的開發,中國開發者更需要在開發框架提供高效、靈活的開發方案,以及快速部署、彈性學習的能力。這些因素當然是遠在天邊的歐美開發平臺不會考慮的。只有深諳中國開發者需求和中國 AI 市場生態環境的企業,才可能進行針對性價值提供。

不難看出,基于應用性、安全性和中文開發的必然性,中國的深度學習開發框架之爭都是注定要發生的。

別是一風景

在科技領域,“理性支持國貨”顯得尤為重要。畢竟不能為一些大局層面的考慮,犧牲貨真價實的成本與效率。 好在“國框”其實在很多層面上已經足可與歐美一較高下,比如 Caffe 創始人賈楊清在評價百度的 PaddlePaddle 時,也認同其在簡潔、靈活、快速等領域功力不俗,并且解決了 Caffe 早期的不少遺留問題。

相比芯片,我們更該在意深度學習框架的中國化

今天的“國框”已經不能說是為了愛國而愛國的強硬選擇。在很多層面上,AI 開發的自主、自有、自生態,已經可以在中國這個世界第二大 AI 技術實體與市場獨立完成。

或許對于中美貿易戰,以及可能的科技禁運等情況,我們還是有些過于敏感了。

誠然,硬件和底層技術有差距,是必須要承認的事實;但在新的領域,在爭奪未來的原點上,中國科技工作者、開發者以及無數企業,一直都沒有停止奔跑。中美之間的差距,今天也在以肉眼可見的速度縮小。

對待中美科技之爭,更合理的方式或許是承認差距的同時,認清很多關鍵領域的國家自信。

更多核心領域達成技術突破;開發者、資本和平臺有效組織產業聚合;營造更好的創新土壤,那么中國終有一天不會再被人牽著鼻子走。

星河流轉之后,或許別是一風景。

來自: 鈦媒體

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!