日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CUDA编程中内存管理机制

發(fā)布時間:2024/1/17 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CUDA编程中内存管理机制 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

GPU設(shè)備端存儲器的主要分類和特點:

大小:

???全局(Global)和紋理(Texture)內(nèi)存:大小受RAM大小的限制。

???本地(local)內(nèi)存:每個線程限制在16KB

???共享內(nèi)存:最大16kB

???常量內(nèi)存:總共64KB

???每個SM共有8192或者16384個32位寄存器

速度:

???Global,local,texture << constant << shared,register

數(shù)據(jù)對齊:

???設(shè)備可以在一次操作中從全局內(nèi)存讀取4-byte,8-byte或者16-byte內(nèi)容到寄存器中,讀取不對齊的8-byte或者16-byte內(nèi)容的可能產(chǎn)生錯誤的結(jié)果。

如何利用合并訪問提高訪存效率:

???1、使用數(shù)組結(jié)構(gòu)體(structure of arrays:SOA)代替結(jié)構(gòu)體數(shù)組(array of structures:AOS):


2、使用共享內(nèi)存來實現(xiàn)合并訪問。

?

內(nèi)存襯底(memory padding):

通常的訪問模式:二維數(shù)組

???當(dāng)一個索引為(tx,ty)的線程去訪問一個寬度為N且基地址為BaseAddress的二維數(shù)組時,使用的是下面的地址:BaseAddress + N*ty + tx。在這種情況下,我們?nèi)绾蝸肀WC合并訪問呢:

???blockDim.x = 16x 并且 N= 16x。

我們可以控制blockDim.x,但是數(shù)組寬度并不總是16x。內(nèi)存襯底就是創(chuàng)建一個寬度為16x的數(shù)組,然后將未使用部分填充0。這里介紹一個概念:數(shù)組A的主要尺寸(leading dimension)——pitch,簡稱Ida。因為c/c++是行主導(dǎo)的,所以主要尺寸為行寬(即一行里面的元素個數(shù))。cuda提供了相應(yīng)的API,cudaMallocPitch()來分配2D數(shù)組。類似的函數(shù)同樣存在于3D的情況。



轉(zhuǎn)載于:https://www.cnblogs.com/quincy-qiu/archive/2013/04/15/4014372.html

總結(jié)

以上是生活随笔為你收集整理的CUDA编程中内存管理机制的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。