?阿里云發布適用于AI的異構計算解決方案, FPGA會成為標配嗎?

jopen 7年前發布 | 12K 次閱讀 阿里云

?阿里云發布適用于AI的異構計算解決方案, FPGA會成為標配嗎?

隨著機器學習、深度學習等 AI 技術日益廣泛的應用,圖片、視頻、語音等非結構化數據的挖掘、識別、處理等,都對高效率、低延遲的實時計算提出了更高的要求。“異構計算”的作用日益凸顯。

根據阿里云官方消息,1 月 21 日,阿里云發布異構計算解決方案,包括彈性 GPU 實力和 FPGA 解決方案,適合人工智能領域的應用。

其中,彈性 GPU 方案,適合視頻、渲染和人工智能應用等場景,自 2016 年底開放邀測,可以提供 2048 到 8192 個并行處理核心,搭配 32GB 的 DDR5 顯存,最高提供 15.08TFOPS 單精度和 1TFLOPS 雙精度浮點性能,并支持多種開放的渲染與計算加速協議和軟件框架。同時配備了實例存儲功能,可以獲得與 SSD 云盤相比十數倍性能提升的前提下,讀寫延遲可穩定在 200us 左右。官方同時表示,該產品支持包月、包年的預付費支付模式,同時也支持按小時付費的使用模型。根據阿里云提供的資料,2016 年下半年,Zerolight 基于云計算技術開發了實時汽車三維展示軟件,軟件性能提升 15~20%。

FPGA 解決方案方面,阿里云采用了多家 FPGA 方案。官方表示,以 Arria 10 FPGA 為例,可以做到單位能耗計算能力達 45 GFLOPS/W,深度學習每瓦性能是 Intel E5-2699 v3 CPU 的 4 倍。在語音識別的業務應用方面,單塊 FPGA 的方案可以做到 64 個 2.5Ghz broadwell CPU 物理核的性能,但延遲只有 CPU 的一半。智能安防廠商瑞為技術就是其客戶之一,官方稱單臺 FPGA 服務器一秒就能實現 3000 萬次人臉比對,將 IPC 的接入能力提升 5 倍以上,且服務端建設費用大幅下降。

自智能移動終端興起以來,包括嵌入式電子產品在內,都面臨高性能與低功耗之間的矛盾。除了在二者之間找平衡,也使得異構計算成為新的趨勢,讓每一個任務匹配更合適的功能單元,降低晶體管的浪費,提升整體效率。而到了人工智能時代,不管是模型訓練還是模型應用的過程中,都對算力有了更高的要求,GPU 的作用凸顯,FPGA 也開始日益受到重視。阿里云這次發布的異構計算解決方案,也是選了這兩個方向。

兩個方案之中,FPGA 的解決方案或許更值得關注。2016 年, Ignite 大會上,微軟 CEO Satya Nadella 就與 Catapult 項目的老大 Doug Burger  一起做了 FPGA 加速機器翻譯的演示,當時的演示效果是每秒 1 Exa-op (10^18) 的機器翻譯運算能力。而在此前,微軟已經開始使用 FPGA 加速 Bing 搜索、 Azure 云計算了。

而在實際的應用端,已經搶下公有云云計算市場半壁江山的 AWS 也于2016 年發布了相關的產品,名為 F1,采用的是 FPGA + PCIe Fabric + SSD 結合的高計算方案。當時,F1 提供了不同價位的加速卡,最多的套件包含 8 個 FPGA 芯片(16nm Xilinx UltraScale Plus FPGA),其中每個 FPGA 有 250 萬個邏輯單元和 6800 個 DSP 引擎,套件包括有 ECC 保護的 64GiB DDR4 內存和 PCIe X16 接口,同時為了方便使用,還會免費提供 FPGA 開發環境 AMI 及硬件開發包 HDK,開發者可以按小時付費,無限次燒寫。

云 +AI 正成為趨勢,這套 FPGA 方案的推出,對于對算力要求高的 AI 行業來說,可以節省不少開發的時間與費用。對于那些本來數據就在云端的 AI 應用開發者來說,更是如此。 

來自: 36kr.com

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!