當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pytorch 之加载不同形式的预训练模型

發布時間：2024/4/18 编程问答 46 豆豆

生活随笔收集整理的這篇文章主要介紹了 pytorch 之加载不同形式的预训练模型小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我們在學習pytorch時，不可避免的要加載不同的預訓練模型。而且pytorch下的預訓練模型有很多種形式，我們又該如何加載呢。今天，我就為大家介紹三種常用的模型形式以及其加載方式。

1.pth形式和.pt形式，這種形式的模型使我們較為常見的形式，保存的可以是整個模型（含模型結構及參數）或只保存參數。
當保存的是整個模型時，讀取方式有兩種：
? ?1）.直接加載：

if __name__=='__main__':with torch.no_grad():model=InceptionI3d(num_classes=400,in_channels = 3)if not os.path.exists('./rgb_imagenet.pt'):print ('No weights Found! please download first, or comment 382~384th line')model.load_state_dict('./rgb_imagenet.pt')#通過load_state_dict()函數來加載

? ?2）.通過state_dict()函數先讀參數再保存

if __name__=='__main__':with torch.no_grad():model=InceptionI3d(num_classes=400,in_channels = 3)if not os.path.exists('./rgb_imagenet.pt'):print ('No weights Found! please download first, or comment 382~384th line')weight = torch.load("./rgb_imagenet.pt")['model']# 'model'為字典鍵值model.load_state_dict(weight.state_dict())

當僅保存模型參數時：?這種形式一般保存的是一個字典型state_dict:權重，所以要加工一次。

if __name__ == "__main__":with torch.no_grad():net = TSN(num_class, this_test_segments if is_shift else 1, modality,base_model='resnet50',consensus_type = crop_fusion_type,img_feature_dim = img_feature_dim,pretrain = pretrain,is_shift=is_shift, shift_div=shift_div, shift_place=shift_place,non_local='_nl' in this_weights,)weights = 'TSM_something_RGB_resnet50_shift8_blockres_avg_segment16_e45.pth'#指定路徑checkpoint = torch.load(this_weights)#通過load函數讀出來checkpoint = checkpoint['state_dict']#取出state_sict所對應的權重名稱和權重，這里有可能字典鍵值不是state_dict，可以使用.keys()函數查看具體鍵值base_dict = {'.'.join(k.split('.')[1:]): v for k, v in list(checkpoint.items())}#一般是為了除去權重名稱前的module.前綴，這個可根據自己的需要添加。也可以打印出所有的權重名稱.items()。net.load_state_dict(base_dict)#同樣用load_state_dict加載。

2.pth.tar形式，這種形式的模型保存的通常也是字典型，但是不僅僅state_sict一項，可以用print(set(checkpoint))打印查看，我們可以不管其他內容，因此和2的處理方式基本相同。

if __name__ == "__main__":with torch.no_grad():model = MultiColumn(174, Model, 512)checkpoint_path = './model_best.pth.tar'#指定路徑checkpoint = torch.load(checkpoint_path)#使用load函數讀值#print(set(checkpoint))checkpoint = checkpoint['state_dict']base_dict = {'.'.join(k.split('.')[1:]): v for k, v in list(checkpoint.items())}#一般是為了除去權重名稱前的module.前綴，這個可根據自己的需要添加。可以打印出所有的權重稱.items()。model.load_state_dict(checkpoint['state_dict'])#使用load_state_dict()加載權重。

這里的介紹就先到這里啦，大家要學會靈活運用。

總結

以上是生活随笔為你收集整理的pytorch 之加载不同形式的预训练模型的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：思科模拟器。计算机网络实验之四：RIPv
下一篇：返回多维数组中某一维的最大值

编程问答

pytorch 之 加载不同形式的预训练模型

總結

pytorch 之加载不同形式的预训练模型