日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

GPU中的SM和warp的关系

發布時間:2023/12/29 编程问答 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 GPU中的SM和warp的关系 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

介紹

我們在cpu上做好了準備工作,然后將指令發送給GPU, 在這里我們看到grid為10,block為128,也就說有10個block,每一block有128個thread,

如何分配這些block?
原則

  • 在GPU中一個block是不能拆分到兩個SM中
  • 一個SM中的block要滿足SM的條件限制

    SM有哪些限制?
    簡單有這些,當然還有其他的沒有展示,這里數值都是我瞎編的,具體的可以去官網文檔查看參數:

    一個block需要哪些資源?
    一個SM能給的資源如上,那么一個block需要哪些資源呢?簡單如下:

    分配結果如下:
    可以看到還有4個block沒地方擱,不用擔心,中間的調度器會一直輪詢所有SM的,只要有空閑的位置就會將還沒安排的block安排上去。

    block里面所有線程都是同時執行嗎?
    在SM中,block繼續分割為warp.一個warp為32個thread,共用一套指令,至于為啥是32,這和硬件有關系,比如人家卡里就32個cuda core,那可不是一次就只能執行1個warp(32個線程)。

    warp如何執行?
    好了,到現在為止warp也切割好了,具體執行方式如下:

    這個就不詳細解釋了,跟CPU調度類似,就是你io耽誤了,其他的任務上,你IO結束了,你在繼續占有計算資源。

總結

以上是生活随笔為你收集整理的GPU中的SM和warp的关系的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。