3大芯片廠高性能計算戰火升級:爭相加速全球最快超算、推動HPC上云
2019 年尾聲將至,高性能計算領域硝煙又起。近日,英偉達、英特爾、AMD 等芯片廠商在高性能計算(HPC)上新動作連連,再次升級市場競爭。
對于幾家芯片大廠來說,HPC 的市場可能沒有數據中心的市場那么大,但是隨著人工智能時代的到來和數據科學的爆發,它的增長趨勢將不容忽視。
本周舉辦 2019 國際超級計算大會(SC19)上,芯片巨頭們便展開了正面交鋒。
來源:英偉達
英偉達宣布幾項重要動作,以推進其在 HPC 上的布局:包括發布一款參考設計平臺,將 CUDA 加速帶入到 Arm 架構當中,幫助企業能夠快速構建 GPU 加速的 Arm 服務器;和微軟合作構建搭載在 Microsoft Azure 云上的新型 GPU 加速超級計算機,將超快的計算能力帶到了 Azure 系統;推出軟件套件 Magnum IO,專為解決存儲和輸入/輸出(I/O)遇到瓶頸這一問題進行了優化,可以更好地幫助數據科學家和 AI 研究人員解決數據瓶頸問題。
據介紹,此次發布的全新 NDv2 實例是 Azure 上規模最大的一次部署,該產品專為處理要求苛刻的 AI 和高性能計算應用而設計,是全球速度最快的超級計算機之一,可在一個 Mellanox InfiniBand 后端網絡上提供多達 800 個互聯的 NVIDIA V100 Tensor Core GPU。
另外,對于用戶來說,他們將可以在自己的桌面中租用整臺 AI 超級計算機,其性能與那些需要數月時間才能完成部署的大型本地超級計算機相匹配。
英偉達副總裁兼加速計算總經理 Ian Buck 表示:“此前,只有一些全球性的大型企業和機構才能使用超級計算機進行 AI 和高性能計算。而這款在 Microsoft Azure 上推出的新產品實現了 AI 的大眾化,使更多人能夠獲得基礎工具,來解決一些全球最大的挑戰。”
來源:英偉達
而和 Arm 在服務器上的進一步合作,豐富了現有的高性能計算架構業態。對此,英偉達 CEO 黃仁勛稱:“高性能計算正在崛起。機器學習和 AI 領域的突破正在重新定義科學研究方法,并且可能帶來激動人心的新架構。從超大規模云到百萬兆級超級計算,英偉達 GPU 與 ARM 的組合讓創新者們能夠為不斷增加的新應用創建系統。”
值得一提的是,同樣在 SC19 的場合上,英特爾也高調宣布其推出的首款為高性能計算設計的 GPU。
來源:英特爾
據介紹,英特爾推出的“Ponte Vecchio”,是一款專為高性能計算建模、模擬工作任務和人工智能訓練而設計的 GPU,將基于英特爾新一代 7 納米工藝進行制造。此前,英特爾首席執行官 Bob Swan 曾在 10 月的財報電話會議上提到其將進軍獨立 GPU 的計劃。與英偉達的 CUDA 接口類似,英特爾還推出了面向開發者的 ONEAPI 編程接口,以幫助開發者實現跨不同計算體系結構的軟件開發。
Ponte Vecchio 有望整合到美國能源部(DOE)計劃于 2021 交付的下一代百億億次超級計算機 Aurora 中。據稱 Aurora 配備了兩個 Intel Xeon Sapphire Rapids 處理器和六個 Intel Xe Ponte Vecchio 圖形卡。
盡管英特爾是生產超級計算機的微處理器的領導者,并能在其芯片組中提供 GPU 功能,但獨立 GPU 對英特爾來說是一個相對較新的領域,而這一領域一直由英偉達和 AMD 主導。
今年以來,AMD 在高性能計算領域也吸引了一些新客戶,包括將負責打造世界最強超級計算機之一 Frontier(同樣于 2021 年交付),以及亞馬遜 AWS 正在擴大 AMD Epyc 處理器使用規模。在 SC19 上,AMD 同樣宣布將超算能力帶到云上,將推出兩個新的 Amazon Elastic Compute Cloud(Amazon EC2)計算優化實例。
如今,GPU 在這些大型計算機中越來越重要,正在成為完成大型計算任務的必需品。近日發布的最新一期全球超級計算機榜單 top 500 也顯示,有越來越多的超級計算機系統都配備了圖形處理加速芯片。
最新一期 TOP 500 榜單,整體來看中國在數量上的領先優勢進一步擴大,但美國超算的整體性能仍是第一(來源:TOP 500)
盡管前 10 的超算排名并無變化,但入榜門檻從上半年的 1.022 petaflops 提高到 1.14 petaflops,500 臺超算中 470 臺使用英特爾 CPU,IBM 有 14 臺,AMD 有 3 臺。這次榜單中,AMD EPYC 處理器上榜成為一大亮點,這也是 AMD 平臺時隔多年首次重返頂級超算行列。
目前,全球排在前 4 位的超算為:橡樹嶺國家實驗室的 IBM 超算 Summit 運算速度 148.6 petaflops;勞倫斯利物莫國家實驗室的 IBM 超算 Sierra 運算速度 94.6 petaflops,中國的神威太湖之光第三運算速度 93 petaflops;天河二號 A 以 61.4 petaflops 排名第四。
Wells Fargo 分析師在一份報告中寫道:“隨著核心增速的放緩,2019 年 11 月的排行榜再次凸顯了 GPU 在保持計算機性能增長方面日益重要的作用,行業可以通過增加加速器的使用來保持計算機性能提升,目前加速器占所有部署核心的 27%,而 2018 年 11 月這一比例為 24%。”