阿里和谷歌自研AI芯片商用,科技巨頭與芯片巨頭關系生變

五嘎子 5年前發布 | 1K 次閱讀 AI芯片

  2019 年杭州云棲大會上,阿里首款 AI 芯片含光 800 雖然只有短短幾分鐘的介紹,卻成了外界最為關注的消息。互聯網巨頭進入自研芯片領域早已不是新聞,但每次他們自研芯片的正式推出和商用的宣布,依舊會吸引了無數的關注。

  不少人應該也會疑問,這是不是芯片巨頭們要被替代的開始?

  互聯網巨頭造芯的初衷

  在互聯網企業造芯的路上,谷歌跑在了最前面。早在 2006 年,谷歌就開始考慮在其數據中心部署 GPU 或者 FPGA,或專用集成電路(ASIC),當時的結論是,能在專門的硬件上運行的應用并不多,使用谷歌大型數據中心的富余計算能力即可。

  情況在 2013 年發生了轉變,當時谷歌用戶每天使用語音識別 DNN 語音搜索三分鐘,使得谷歌數據中心的計算需求增加了一倍,而如果使用傳統的 CPU 將非常昂貴。因此,谷歌啟動了一項優先級別非常高的項目,快速生產一款定制芯片(ASIC)用于推理,并購買現成的 GPU 用于訓練。

  谷歌的目標是將性價比提高 10 倍,為了完成這項任務,谷歌在其數據中心設計、驗證、構建并部署了 TPU(張量處理器,Tensor Processing Unit),這一過程用了 15 個月。

  2016 年,谷歌I/O開發者大會上,谷歌正式發布了首代 TPU。不過,TPU 剛開始只僅限谷歌內部使用,直到 2018 年 2 月,谷歌才在其云平臺博客上宣布 TPU 服務開放的消息,價格大約為每云 TPU 每小時 6.50 美元,而且數量有限。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  也就是說,2018 年,谷歌才開啟了 TPU 的商業化。同年的I/O大會上,TPU 3.0 宣布推出,計算性能相比 TPU 2.0 提升八倍,可達 100PFlops (每秒 1000 萬億次浮點計算)。

  可以明確,谷歌 TPU 的推出,主要還是因為市場上沒有滿足其需求的芯片,使得他們進入了自研芯片領域,并且,TPU 作為云端推理芯片并不對外出售,而是通過谷歌云對外提供算力。

  阿里的自研芯片之路與谷歌類似。1999 年以淘寶起家的阿里,如今的業務早已橫跨電商、金融、物流、云計算、大數據、全球化等場景。不同的場景就有不同的計算需求,比如淘寶里的拍立淘商品庫每天新增 10 億商品圖片,使用傳統 GPU 算力識別需要 1 小時。除了需要花費 1 小時的時間,這個時間里 GPU 的耗電量也非常巨大。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  雷鋒網此前報道,數據統計顯示,2017 年中國有 40 個中小型數據中心,這些中小數據中心 2017 年消耗電量比三峽大壩的發電量還多,等量的碳排放量兩倍于民航的碳排放量。對于阿里和谷歌這樣擁有大型數據中心的科技公司,電量消耗也帶來了巨大的成本。

  如果谷歌和阿里想要通過購買算力更強的最新款英偉達 GPU 來提升效率,GPU 高昂的售價也是科技巨頭們無法忽視的問題。

  因此阿里也開啟了自研芯片之路。2017 年的云棲大會上,阿里宣布成立達摩院,由全球建設的自主研究中心、高校聯合實驗室,全球開放研究計劃三大部分組成,涵蓋量子計算、機器學習、基礎算法、網絡安全、視覺計算、自然語言處理、下一代人機交互、芯片技術、傳感器技術、嵌入式系統等,涵蓋機器智能、智聯網、金融科技等多個產業領域。

  2018 年云棲大會,阿里又宣布成立獨立芯片企業“平頭哥半導體有限公司”,由中天微與達摩院芯片團隊整合而成。

  還是云棲大會宣布者還是張建鋒,2019 年阿里首款 AI 云端推理芯片含光 800 正式推出。在業界標準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比目前業界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。

  性能提升帶來的效果顯而易見,繼續用上面的拍立淘舉例,阿里表示,采用含光 800 后,每天新增 10 億商品圖片的識別時間可以從 GPU 識別的 1 小時,可縮減至 5 分鐘。另外,根據云棲大會的現場演示,在城市大腦中實時處理杭州主城區交通視頻,需要 40 顆傳統 GPU,延時為 300ms,使用含光 800 僅需 4 顆,延時降至 150ms。

  由此做一個簡單的換算,那就是 1 個含光 800 的算力等于 10 個 GPU。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  相比谷歌遲遲沒有商用 TPU,阿里在發布含光 800 之時表示這款產品已經已經實現了大規模應用,應用于阿里巴巴集團內多個場景,例如視頻圖像識別/分類/搜索、城市大腦等,并且宣布基于含光 800 的 AI 云服務也正式上線。

  顯然,阿里自研 AI 芯片最核心的目標同樣是為了獲得更低的經濟成本。

  科技巨頭與芯片巨頭不再只是合作

  由此看來,目前阿里和谷歌商用的自研 AI 芯片都是云端推理芯片,對于傳統芯片巨頭英特爾和英偉達而言,這并不會帶來巨大的改變,但雙方的關系會從此前緊密合作變為競合關系。

  如何理解?雖然有了面向視覺場景的含光 800 推理芯片,但是這是一款 ASIC 芯片,其定位也是 CNN 類模型推理加速為主,通用可擴展到其它 DNN 模型。但對于更多的深度學習算法,含光 800 這款 ASIC 可以在一定支持,但無法體現出性能和能效最優化。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  所以,無論是阿里還是谷歌,他們依舊需要英特爾的 CPU 提供通用的計算能力,也需要 FPGA 進行 AI 的加速。另外,阿里性能強大的神龍架構服務器,也需要英偉達 GPU 提供算力。

  這種競合關系不僅會局限在云端。2018 年 7 月,谷歌推出 Edge TPU 芯片,從命名上就可以看出這是此前推出的云 TPU 的簡化版本,是專門設計的加速器芯片,用于在邊緣運行 TensorFlow Lite 機器學習模型。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  英雄所見略同,阿里也有端云一體的戰略。在含光 800 云端 AI 芯片發布之前的 7 月和 8 月,阿里接連發布了高性能 RISC-V 架構處理器玄鐵 910 以及 SoC 芯片平臺“無劍”。也就是說,阿里的C-Sky 系列、玄鐵系列 AIoT 終端芯片 IP,一站式芯片設計平臺無劍,以及最新發布的云端 AI 芯片構建了阿里端云一體的芯片生態,平頭哥端云一體全棧芯片產品家族雛形已現。

  另外,2019 云棲大會期間還有一個芯片的重磅宣布,阿里人工智能實驗室和平頭哥共同定制開發的智能語音芯片 TG6100N,會在即將推出的音箱產品中使用。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  科技巨頭們的自研 AI 芯片要涵蓋云端和終端其實也很容易理解,無論是芯片巨頭還是科技巨頭,他們都認為未來數據將像石油一樣具有價值。因此,巨頭們需要端云一體的戰略挖掘數據的價值,在數據的時代保持領先,而這個戰略非常重要的支撐就是云端和終端的 AI 芯片。

阿里和谷歌自研 AI 芯片商用,科技巨頭與芯片巨頭關系生變

  此時科技巨頭和芯片巨頭都會有云端和終端的 AI 芯片,競爭就難以避免。雷鋒網(公眾號:雷鋒網)認為,競爭激烈的程度更多會取決于科技巨頭,由于他們對自己的業務和數據有更深的理解,他們定制化的 ASIC 芯片更容易達到性能和能效的最優。即便自研的 AI 處理器性能弱于芯片巨頭的產品,如果科技巨頭出于自主可控的考慮,用自身的業務和場景去支撐自研芯片的迭代和優化,為此付出一些代價,最終也能研發出在特定領域非常具有競爭優勢的芯片。

  注意,科技巨頭們會在與自己業務和生態相關的領域自主研發 AI 芯片。但如果想要替代現有的成熟芯片,比如英特爾的至強 CPU 和英偉達 GPU,既沒有價值也面臨巨大的風險。歸根結底,科技巨頭們自研 AI 芯片的初衷是為了獲得更大的經濟效益,通過自主研發的芯片保持其技術和生態的領先性。同樣,他們的自研芯片也更多的會服務于自己的業務和生態,而非搶食芯片巨頭們的市場。

  雷鋒網小結

  AI 時代,科技巨頭們與芯片巨頭們不再只是緊密的合作伙伴,也會在特定領域成為競爭對手。也就是說,對于芯片巨頭們而言,想要在科技巨頭擁有自研芯片的領域獲得訂單,需要付出更多的努力。

  反過來,芯片作為一個技術、資本、人才都密集的行業,其長周期的特點也與互聯網和移動互聯網快速迭代的模式不同,如何找到軟硬之間的最佳平衡點,以及如何與芯片巨頭們多年在芯片領域積累的優勢競爭,也都是科技巨頭自主研發芯片面臨的挑戰。

 本文由用戶 五嘎子 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
  轉載自:https://www.leiphone.com/news/201909/U4jgVJxyv4J9vAJv.html