OpenBLAS 0.2.14 發布,高性能多核 BLAS 庫

jopen 9年前發布 | 7K 次閱讀 OpenBLAS

OpenBLAS 0.2.14 版本主要更新如下:

  • 支持AMD Streamroller

  • 增加ARM Cortex-A9和Cortex-A15目標

  • 增加 openblas_get_num_threads 和 openblas_get_num_procs 函數接口

  • 增加 ATLAS擴展風格的 ?geadd函數接

  • 改進ger和gemv對于小規模矩陣性能

  • 改進OpenBLASConfig.cmake配置

  • 修正c/zsyr在incx為負數時的錯誤

  • 修正清理CPU affinity設置時的race condition bug

更多內容請看這里:https://github.com/xianyi/OpenBLAS/releases/tag/v0.2.14

OpenBLAS 是一個優化的 BLAS 庫,基于 GotoBLAS2 1.13 BSD 版本。

BLAS(Basic Linear Algebra Subprograms 基礎線性代數程序集)是一個應用程序接口(API)標準,用以規范發布基礎線性代數操作的數值庫(如矢量或矩陣乘法)。該程序集最初發布于1979年,并用于建立更大的數值程序包(如LAPACK)。在高性能計算領域,BLAS被廣泛使用。例如,LINPACK的運算成績則很大程度上取決于BLAS中子程序DGEMM的表現。為提高性能,各軟硬件廠商則針對其產品對BLAS接口實現進行高度優化。

具體內容請參考項目主頁Changelog

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!