當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

cuda随记

發布時間：2024/1/17 编程问答 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 cuda随记小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一個warp的線程數為32個，每個線程的寄存器數量為4-128個，調用kernel函數的block數，thread數根據gpu卡的硬件參數確定。

half_warp的大小為16個線程，bank（存儲塊）的大小為32位，為了避免發生bank conflict，線程并發訪問內存大小為32的整數倍。

__global__函數限定符，從主機端調用，設備端執行

__device__函數限定符，從設備端調用，設備端執行

__host__函數限定符，主機端調用，主機端執行

__device__變量限定符，gpu內存全局變量

__shared__變量限定符，gpu共享變量，一個block內線程可訪問

__constant__變量限定符，gpu常量全局變量，用cudaMemcpyToSymbol函數賦值

texture紋理內存，特殊的聲明和賦值方法

一個SM相當于一個多線程的cpu核

轉載于:https://www.cnblogs.com/huyanglin/p/4807255.html

以上是生活随笔為你收集整理的cuda随记的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。