日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal

發布時間:2024/4/18 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我在使用torch多卡并行時出現了這個兩個問題。

##問題一:AssertionError: Invalid device id,即無效的設備id

出現的原因:結合代碼解釋:

import ...os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"model = model(...)torch.cuda.set_device(2) model = torch.nn.DataParrel(model, device_ids=[2,3])

錯誤原因:os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"這個語句將原本的divice:2和device:3的編號映射為device:0和device:1,因此在set_device時匯報錯,無效的設備id

解決辦法:方法一:將os.environ刪除。若是某些卡被占用不得不使用os.environ來設置可用設備,則使用方法二:按照重新映射的編號進行操作,例set_device(0)

##問題二:RuntimeError: CUDA error: invalid device ordinal

出現的原因:結合代碼

import ...os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"model = model(...)model = torch.nn.DataParrel(model, device_ids=[2,3])

錯誤原因:與上文一致,os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"這個語句將原本的divice:2和device:3的編號映射為device:0和device:1,因此在執行torch.nn.DataParrel時會報錯

解決辦法:方法一:將os.environ刪除。若是某些卡被占用不得不使用os.environ來設置可用設備,則使用方法二:按照重新映射的編號進行操作,例:

model = torch.nn.DataParrel(model, device_ids=[0,1])

推薦一篇文章,簡單實現多卡并行:

https://muzhan.blog.csdn.net/article/details/109318226

https://www.codeleading.com/article/2345206500

https://blog.csdn.net/weixin_34233421/article/details/91396978

總結

以上是生活随笔為你收集整理的AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。