日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

cude的__ldg使用

發布時間:2024/8/23 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 cude的__ldg使用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?一般使用__ldg是更好的選擇。通過constant緩存存儲的數據必須相對較小而且必須獲取同一個地址以便獲取最佳性能,相反,只讀緩存則可以存放較大的數據,且不必地址一致。

__global__ void transpose2(const real* A, real* B, const int N) {const int nx = blockIdx.x * blockDim.x + threadIdx.x;const int ny = blockIdx.y * blockDim.y + threadIdx.y;if (nx < N && ny < N){B[ny * N + nx] = A[nx * N + ny];} }__global__ void transpose3(const real* A, real* B, const int N) {const int nx = blockIdx.x * blockDim.x + threadIdx.x;const int ny = blockIdx.y * blockDim.y + threadIdx.y;if (nx < N && ny < N){B[ny * N + nx] = __ldg(&A[nx * N + ny]);} }

運行速度對比:

很顯然const momery 通過__ldg修飾可以提高訪問效率

總結

以上是生活随笔為你收集整理的cude的__ldg使用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。