pytorch 之 加载不同形式的预训练模型
生活随笔
收集整理的這篇文章主要介紹了
pytorch 之 加载不同形式的预训练模型
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
我們在學習pytorch時,不可避免的要加載不同的預訓練模型。而且pytorch下的預訓練模型有很多種形式,我們又該如何加載呢。今天,我就為大家介紹三種常用的模型形式以及其加載方式。
1.pth形式和.pt形式,這種形式的模型使我們較為常見的形式,保存的可以是整個模型(含模型結構及參數)或只保存參數。
當保存的是整個模型時,讀取方式有兩種:
? ?1).直接加載:
? ?2).通過state_dict()函數先讀參數再保存
if __name__=='__main__':with torch.no_grad():model=InceptionI3d(num_classes=400,in_channels = 3)if not os.path.exists('./rgb_imagenet.pt'):print ('No weights Found! please download first, or comment 382~384th line')weight = torch.load("./rgb_imagenet.pt")['model']# 'model'為字典鍵值model.load_state_dict(weight.state_dict())當僅保存模型參數時:?這種形式一般保存的是一個字典型state_dict:權重,所以要加工一次。
if __name__ == "__main__":with torch.no_grad():net = TSN(num_class, this_test_segments if is_shift else 1, modality,base_model='resnet50',consensus_type = crop_fusion_type,img_feature_dim = img_feature_dim,pretrain = pretrain,is_shift=is_shift, shift_div=shift_div, shift_place=shift_place,non_local='_nl' in this_weights,)weights = 'TSM_something_RGB_resnet50_shift8_blockres_avg_segment16_e45.pth'#指定路徑checkpoint = torch.load(this_weights)#通過load函數讀出來checkpoint = checkpoint['state_dict']#取出state_sict所對應的權重名稱和權重,這里有可能字典鍵值不是state_dict,可以使用.keys()函數查看具體鍵值base_dict = {'.'.join(k.split('.')[1:]): v for k, v in list(checkpoint.items())}#一般是為了除去權重名稱前的module.前綴,這個可根據自己的需要添加。也可以打印出所有的權重名稱.items()。net.load_state_dict(base_dict)#同樣用load_state_dict加載。2.pth.tar形式,這種形式的模型保存的通常也是字典型,但是不僅僅state_sict一項,可以用print(set(checkpoint))打印查看,我們可以不管其他內容,因此和2的處理方式基本相同。
if __name__ == "__main__":with torch.no_grad():model = MultiColumn(174, Model, 512)checkpoint_path = './model_best.pth.tar'#指定路徑checkpoint = torch.load(checkpoint_path)#使用load函數讀值#print(set(checkpoint))checkpoint = checkpoint['state_dict']base_dict = {'.'.join(k.split('.')[1:]): v for k, v in list(checkpoint.items())}#一般是為了除去權重名稱前的module.前綴,這個可根據自己的需要添加。可以打印出所有的權重稱.items()。model.load_state_dict(checkpoint['state_dict'])#使用load_state_dict()加載權重。這里的介紹就先到這里啦,大家要學會靈活運用。
總結
以上是生活随笔為你收集整理的pytorch 之 加载不同形式的预训练模型的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 思科模拟器。计算机网络实验之四:RIPv
- 下一篇: 返回多维数组中某一维的最大值