日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

详解CUDA核函数及运行时参数

發(fā)布時(shí)間:2025/3/15 编程问答 43 豆豆
生活随笔 收集整理的這篇文章主要介紹了 详解CUDA核函数及运行时参数 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

詳解CUDA核函數(shù)及運(yùn)行時(shí)參數(shù)


核函數(shù)是GPU每個(gè)thread上運(yùn)行的程序。必須通過(guò)__gloabl__函數(shù)類(lèi)型限定符定義。形式如下:

? ? ? ? ? ? ? ? __global__ void kernel(param list){ ?}

核函數(shù)只能在主機(jī)端調(diào)用,調(diào)用時(shí)必須申明執(zhí)行參數(shù)。調(diào)用形式如下:

? ? ? ? ? ? ? ??Kernel<<<Dg,Db, Ns, S>>>(param list);

<<<>>>運(yùn)算符內(nèi)是核函數(shù)的執(zhí)行參數(shù),告訴編譯器運(yùn)行時(shí)如何啟動(dòng)核函數(shù),用于說(shuō)明內(nèi)核函數(shù)中的線程數(shù)量,以及線程是如何組織的。

<<<>>>運(yùn)算符對(duì)kernel函數(shù)完整的執(zhí)行配置參數(shù)形式是<<<Dg, Db, Ns, S>>>

  • 參數(shù)Dg用于定義整個(gè)grid的維度和尺寸,即一個(gè)grid有多少個(gè)block。為dim3類(lèi)型。Dim3 Dg(Dg.x, Dg.y, 1)表示grid中每行有Dg.x個(gè)block,每列有Dg.y個(gè)block,第三維恒為1(目前一個(gè)核函數(shù)只有一個(gè)grid)。整個(gè)grid中共有Dg.x*Dg.y個(gè)block,其中Dg.x和Dg.y最大值為65535。
  • 參數(shù)Db用于定義一個(gè)block的維度和尺寸,即一個(gè)block有多少個(gè)thread。為dim3類(lèi)型。Dim3 Db(Db.x, Db.y, Db.z)表示整個(gè)block中每行有Db.x個(gè)thread,每列有Db.y個(gè)thread,高度為Db.z。Db.x和Db.y最大值為512,Db.z最大值為62。 一個(gè)block中共有Db.x*Db.y*Db.z個(gè)thread。計(jì)算能力為1.0,1.1的硬件該乘積的最大值為768,計(jì)算能力為1.2,1.3的硬件支持的最大值為1024。
  • 參數(shù)Ns是一個(gè)可選參數(shù),用于設(shè)置每個(gè)block除了靜態(tài)分配的shared Memory以外,最多能動(dòng)態(tài)分配的shared memory大小,單位為byte。不需要?jiǎng)討B(tài)分配時(shí)該值為0或省略不寫(xiě)。
  • 參數(shù)S是一個(gè)cudaStream_t類(lèi)型的可選參數(shù),初始值為零,表示該核函數(shù)處在哪個(gè)流之中。

總結(jié)

以上是生活随笔為你收集整理的详解CUDA核函数及运行时参数的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。