OpenBLAS 0.2.14 發布,高性能多核 BLAS 庫
OpenBLAS 0.2.14 版本主要更新如下:
-
支持AMD Streamroller
-
增加ARM Cortex-A9和Cortex-A15目標
-
增加 openblas_get_num_threads 和 openblas_get_num_procs 函數接口
-
增加 ATLAS擴展風格的 ?geadd函數接
-
改進ger和gemv對于小規模矩陣性能
-
改進OpenBLASConfig.cmake配置
-
修正c/zsyr在incx為負數時的錯誤
-
修正清理CPU affinity設置時的race condition bug
更多內容請看這里:https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.14。
OpenBLAS 是一個優化的 BLAS 庫,基于 GotoBLAS2 1.13 BSD 版本。
BLAS(Basic Linear Algebra Subprograms 基礎線性代數程序集)是一個應用程序接口(API)標準,用以規范發布基礎線性代數操作的數值庫(如矢量或矩陣乘法)。該程序集最初發布于1979年,并用于建立更大的數值程序包(如LAPACK)。在高性能計算領域,BLAS被廣泛使用。例如,LINPACK的運算成績則很大程度上取決于BLAS中子程序DGEMM的表現。為提高性能,各軟硬件廠商則針對其產品對BLAS接口實現進行高度優化。
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!