日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

最简示例 简介洗牌函数 之 __shfl_up_sync() cuda 之 shuffle

發(fā)布時(shí)間:2023/12/18 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 最简示例 简介洗牌函数 之 __shfl_up_sync() cuda 之 shuffle 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

__shfl_up_sync()

up 是指 從取值的線程對(duì)齊。

#include <cuda_runtime.h> #include <stdio.h> #define warpSize 32__global__ void scan4(float* a, float* b) {int laneId = threadIdx.x & 0x1f;float value;value = a[laneId];value = __shfl_up_sync(0xffffffff, value, 4);b[laneId] = value; }void printVector(char* desc, float* ptr_vec, unsigned int n){printf("%s =\n", desc);for(int i=0; i<n; i++){printf(" %5.2f ",ptr_vec[i]);}printf("\n"); }int main() {float* a_h = NULL;float* a_d = NULL;float* b_h = NULL;float* b_d = NULL;a_h = (float*)malloc(warpSize*sizeof(float));b_h = (float*)malloc(warpSize*sizeof(float));for(int i=0; i<warpSize; i++){a_h[i] = i+100.0;}//memset(b_h, 15, warpSize*sizeof(float));for(int i=0; i<warpSize; i++){b_h[i] = i+100.0;}printVector("a_h",a_h, warpSize);printVector("b_h",b_h, warpSize);cudaMalloc((void**)&a_d, warpSize*sizeof(float));cudaMalloc((void**)&b_d, warpSize*sizeof(float));cudaMemcpy(a_d, a_h, warpSize*sizeof(float), cudaMemcpyHostToDevice); cudaMemcpy(b_d, b_h, warpSize*sizeof(float), cudaMemcpyHostToDevice); scan4<<< 1, warpSize >>>(a_d, b_d);cudaDeviceSynchronize();cudaMemcpy(b_h, b_d, warpSize*sizeof(float), cudaMemcpyDeviceToHost);printVector("b_d", b_h, warpSize);cudaFree(a_d);cudaFree(b_d);return 0; }

?

總結(jié)

以上是生活随笔為你收集整理的最简示例 简介洗牌函数 之 __shfl_up_sync() cuda 之 shuffle的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。