日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > linux >内容正文

linux

Linux下Linpack测试GPU和CPU性能

發布時間:2023/12/20 linux 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Linux下Linpack测试GPU和CPU性能 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

前面的文章已經介紹了如何搭建Linpack環境:https://blog.csdn.net/liu_feng_zi_/article/details/107429720?

接下來說明如何使用

一、編寫運行腳本:

新建文件:run_linpack.sh,內容如下:

export HPL_DIR =/root/LHC/Linpack/hpl-2.0_FERMI_v15 export MKL_NUM_THREADS=6 export OMP_NUM_THREADS=6 export MKL_DYNAMIC=FALSE export CUDA_DGEMM_SPLIT=0.836 export CUDA_DTRSM_SPLIT=0.806 export LD_LIBRARY_PATH= $HPL_DIR/src/cuda:$LD_LIBRARY_PATH $HPL_DIR/bin/CUDA/xhpl

1、MKL_NUM_THREADS:每個進程使用的CPU核的數量

2、OMP_NUM_THREADS:每個GPU使用的CPU核的數量

例如:2個GPU和8個CPU,則OMP_NUM_THREADS=4

3、CUDA_DGEMM_SPLIT:發送給GPU的DGEMM占總的百分比,大致等于(GPU GFLOPS)/(GPU GFLOPS + CPU GFLOPS),或者( 350 ) /?( 350 + 每個GPU的CPU數量 * 4 * CPU基本頻率 )

4、CUDA_DTRSM_SPLIT:發送給GPU的DTRSM占總的百分比,通常比DGEMM低0.05-0.10

5、HPL_DIR:文件的路徑

二、HPL.dat參數設置:

之前的文章寫過:https://blog.csdn.net/liu_feng_zi_/article/details/107416291

三、執行文件:

單節點執行:

./run_linpack.sh

多節點執行(沒有測試過,僅供參考):

mpirun -np N ./run_linpack.sh #N為節點數

?

總結

以上是生活随笔為你收集整理的Linux下Linpack测试GPU和CPU性能的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。