日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 人工智能 > 目标检测 >内容正文

目标检测

PyTorch实现 | 车牌OCR识别,《PyTorch深度学习之目标检测》

發(fā)布時(shí)間:2023/12/29 目标检测 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 PyTorch实现 | 车牌OCR识别,《PyTorch深度学习之目标检测》 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

注:本文選自中國(guó)水利水電出版社出版《PyTorch深度學(xué)習(xí)之目標(biāo)檢測(cè)》一書(shū),有改動(dòng)

福利!免費(fèi)寄送圖書(shū)!!

公眾號(hào)【機(jī)器學(xué)習(xí)與AI生成創(chuàng)作】后臺(tái)回復(fù)168。即可參與免費(fèi)寄送圖書(shū)活動(dòng),活動(dòng)截止日期為 2023-02-26 晚上10點(diǎn)?。

公眾號(hào)后臺(tái)回復(fù):168(建議選中復(fù)制)

也可自行購(gòu)買(mǎi):

01 OCR原理分析

??? ??本文中采用的車(chē)輛號(hào)牌識(shí)別部分的是采用CNN+LSTM+CTC組合而成,整個(gè)網(wǎng)絡(luò)部分可以分為三個(gè)部分,首先是主干網(wǎng)絡(luò)CNN用于提取字符的特征信息,其次采用深層雙向LSTM網(wǎng)絡(luò)在卷積特征的基礎(chǔ)上提取文字或字符的序列特征,最終引入CTC結(jié)構(gòu)解決訓(xùn)練時(shí)字符無(wú)法對(duì)齊的問(wèn)題。詳細(xì)組合結(jié)構(gòu)如圖1所示。

圖1???OCR算法結(jié)構(gòu)圖

? ? ? (1)主干網(wǎng)絡(luò)CNN提取特征。由于該網(wǎng)絡(luò)只是通過(guò)卷積的形式來(lái)提取號(hào)牌的整個(gè)特征信息來(lái)做號(hào)牌上字符的識(shí)別,因此,該算法的輸入是整個(gè)號(hào)牌圖像。

? ? ? (2)LSTM提取序列信息。LSTM作為長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)是一種特殊的RNN結(jié)構(gòu),使用該結(jié)構(gòu)能夠避免長(zhǎng)期依賴的問(wèn)題。與循環(huán)卷積神經(jīng)網(wǎng)絡(luò)(RNN)不同的RNN能保存不同時(shí)刻的狀態(tài),而LSTM的獨(dú)特網(wǎng)絡(luò)結(jié)構(gòu)能夠保存四個(gè)不同狀態(tài)的特征,LSTM網(wǎng)絡(luò)結(jié)構(gòu)單元主要由遺忘門(mén)、輸入門(mén)和輸出門(mén)三種組合而成,單元結(jié)構(gòu)圖如下圖2所示。

圖2? ? LSTM網(wǎng)絡(luò)單元

? ? ?遺忘門(mén)主要是決定從網(wǎng)絡(luò)中丟棄和保留其中的部分特征,實(shí)現(xiàn)過(guò)程是通過(guò)讀取網(wǎng)絡(luò)輸入?yún)?shù)Xt和上一層的輸出狀態(tài)ht-1,并將其通過(guò)Sigmoid函數(shù)歸一化到0-1范圍區(qū)間中,0表示丟棄的特征,1表示需要保留的特征。遺忘門(mén)實(shí)現(xiàn)公式如式1所示:

? ? ???輸入門(mén)與遺忘門(mén)的結(jié)構(gòu)不同,該部分分為兩部分結(jié)構(gòu),一部分與遺忘門(mén)類(lèi)似,另外一部分則是在遺忘門(mén)的基礎(chǔ)上通過(guò)tanh函數(shù)將特征映射至-1和1之間,其中-1表示不同更新的部分,1表示需要更新的特征部分,如式2和3所示:

? ? ??輸出門(mén)中的sigmoid函數(shù)決定哪部分的函數(shù)是需要進(jìn)行輸出的,輸出部分的特征通過(guò)tanh函數(shù),并將其與sigmoid函數(shù)的輸出進(jìn)行乘積,最終決定輸出部分的特征。實(shí)現(xiàn)部分公式如式4和5所示:

? ???(3)CTC結(jié)構(gòu)。CTC結(jié)構(gòu)是解決語(yǔ)音識(shí)別中自動(dòng)對(duì)齊的一種方案,CTC網(wǎng)絡(luò)結(jié)構(gòu)在字符識(shí)別上的應(yīng)用解決了人為切割字符帶來(lái)的問(wèn)題,從而提高整個(gè)算法的準(zhǔn)確率。

02 車(chē)牌號(hào)數(shù)據(jù)集制作

本章中該部分采用的數(shù)據(jù)集,是在第一部分?jǐn)?shù)據(jù)集的基礎(chǔ)上截取圖片中的號(hào)牌得到,在配有Python環(huán)境的機(jī)器上編寫(xiě)Python腳本讀取數(shù)據(jù)集,從已經(jīng)標(biāo)注的xml文件解析出號(hào)牌所在圖片的位置。為了保證切割圖片的完整性,同樣采取擴(kuò)大像素值的辦法,xml文件中保存的號(hào)牌位置,其中左上角位置坐標(biāo)點(diǎn)分別減少5個(gè)像素,右下角位置坐標(biāo)點(diǎn)分別增加5個(gè)像素。與目標(biāo)檢測(cè)不同,識(shí)別號(hào)牌上的文本除了數(shù)據(jù)圖片之外,還需要將圖片名稱(chēng)根據(jù)號(hào)牌上的文本進(jìn)行修改。如圖3為處理后的可訓(xùn)練號(hào)牌數(shù)據(jù)集。

圖3? 號(hào)牌數(shù)據(jù)集

? ????初步處理后的數(shù)據(jù)只是得到具體號(hào)牌的圖片,尚未對(duì)圖片進(jìn)行標(biāo)注處理,因此并不能直接作為數(shù)據(jù)集來(lái)訓(xùn)練OCR算法,該部分主要實(shí)現(xiàn)號(hào)牌上文本的識(shí)別,本章3.2小節(jié)中已經(jīng)通過(guò)YOLOv3算法實(shí)現(xiàn)全部遮擋號(hào)牌、未懸掛號(hào)牌和其他類(lèi)號(hào)牌的定位和分類(lèi),在目標(biāo)檢測(cè)算法基礎(chǔ)上選擇識(shí)別結(jié)果中其他類(lèi)的圖片進(jìn)行進(jìn)一步處理,除了與圖片標(biāo)注的質(zhì)量有關(guān)之外,圖片的數(shù)量也直接影響最終的模型是否更好的泛化能力,數(shù)據(jù)集中的車(chē)輛號(hào)牌圖片除了包括正常號(hào)牌之外,還存在半遮擋的號(hào)牌。在進(jìn)行訓(xùn)練之前還要對(duì)圖片進(jìn)行處理,實(shí)施過(guò)程如圖4所示。

圖4? ? 訓(xùn)練集數(shù)據(jù)處理流程圖

????? (1)修改圖片名稱(chēng)為號(hào)牌的文本。與目標(biāo)檢測(cè)的標(biāo)注方式不同,號(hào)牌的標(biāo)注要根據(jù)實(shí)際圖片中的文本修改為圖片的名稱(chēng),并且圖片的后綴保持不變,對(duì)數(shù)據(jù)集標(biāo)注完成之后還要根據(jù)實(shí)際項(xiàng)目需要的格式修改數(shù)據(jù)集,按照使用Python腳本程序?qū)D片按照6:1的比例分為訓(xùn)練集和測(cè)試集,在項(xiàng)目中新建data目錄,并在data文件夾中分別新建train/text和test/text兩個(gè)路徑,其中train/text用來(lái)存放處理后的訓(xùn)練集圖片,train中存放處理的train.pkl二進(jìn)制文件,test/text中存放測(cè)試集圖片,同樣,test中存放測(cè)試集的test.pkl二進(jìn)制文件。

? ? ? ?(2)生成pkl文件。pkl文件是存儲(chǔ)二進(jìn)制內(nèi)容的文件格式,訓(xùn)練過(guò)程中網(wǎng)絡(luò)從pkl文件中讀取文本信息和對(duì)應(yīng)的圖片進(jìn)行訓(xùn)練。分別將訓(xùn)練集和驗(yàn)證集中的圖片名稱(chēng)按照次序依次存入新建的pkl文件中,命名為train.pkl和test.pkl,并把對(duì)應(yīng)的圖片名稱(chēng)存儲(chǔ)為序號(hào)。

03 修改預(yù)權(quán)重文件

? ????本章中采用在預(yù)訓(xùn)練權(quán)重的基礎(chǔ)上進(jìn)行訓(xùn)練,使用預(yù)訓(xùn)練權(quán)重的好處在于,不僅能夠保證模型快速收斂,減少訓(xùn)練模型的時(shí)間,也能避免從零開(kāi)始訓(xùn)練導(dǎo)致訓(xùn)練過(guò)程中出現(xiàn)梯度爆炸和梯度消失的情況發(fā)生。預(yù)訓(xùn)練權(quán)重是通過(guò)Python的第三方模塊Collections中的子類(lèi)OrderedDict模塊對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ),OrderedDict是一種有序字典,能夠按照輸入的順序?qū)υ剡M(jìn)行存儲(chǔ)并保證順序不發(fā)生變化,也因此OrderedDict的使用能夠保證權(quán)重文件中的參數(shù)按照訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)的層次和順序進(jìn)行存儲(chǔ),權(quán)重文件的存儲(chǔ)除了在保證權(quán)重文件中數(shù)據(jù)存儲(chǔ)的格式順序之外,還與訓(xùn)練過(guò)程中的設(shè)備、存儲(chǔ)方式和網(wǎng)絡(luò)結(jié)構(gòu)相關(guān),因此使用預(yù)訓(xùn)練權(quán)重需要首先對(duì)預(yù)訓(xùn)練權(quán)重的結(jié)構(gòu)以及其存儲(chǔ)訓(xùn)練的方式進(jìn)行了解。本章中對(duì)預(yù)訓(xùn)練權(quán)重的修改包括分析權(quán)重文件,修改權(quán)重文件的維度兩部分,共同實(shí)現(xiàn)修改預(yù)訓(xùn)練權(quán)重文件的目的。具體的實(shí)現(xiàn)方式如圖5所示。

圖5? ?? 修改權(quán)重文件實(shí)現(xiàn)方式

? ???(1)分析權(quán)重結(jié)構(gòu)。預(yù)訓(xùn)練權(quán)重的存儲(chǔ)方式根據(jù)其訓(xùn)練方式可以分為CPU訓(xùn)練、單GPU訓(xùn)練和多GPU訓(xùn)練,其中CPU和單GPU的情況下保存的模型結(jié)構(gòu)相同;根據(jù)存儲(chǔ)的方式可以分為保存模型的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練參數(shù)到權(quán)重文件,只保存訓(xùn)練參數(shù)到權(quán)重文件兩種;根據(jù)存儲(chǔ)的方式可以分為保存訓(xùn)練過(guò)程中訓(xùn)練的批次、訓(xùn)練參數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)的中間結(jié)構(gòu)的權(quán)重文件和只保存最終訓(xùn)練參數(shù)的權(quán)重文件兩種方式;根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)可以通過(guò)Python腳本打印出權(quán)重文件的網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)需求可以修改權(quán)重中需要修改的網(wǎng)絡(luò)參數(shù)。

? ? ?(2)修改預(yù)訓(xùn)練權(quán)重的維度。修改網(wǎng)絡(luò)中的參數(shù)會(huì)導(dǎo)致網(wǎng)絡(luò)發(fā)生變化,因此,要修改預(yù)訓(xùn)練權(quán)重文件來(lái)適配當(dāng)前網(wǎng)絡(luò),解決的方法有兩種:剔除其中不合適的網(wǎng)絡(luò)的節(jié)點(diǎn)訓(xùn)練參數(shù);修改不適合訓(xùn)練的網(wǎng)絡(luò)節(jié)點(diǎn),將其節(jié)點(diǎn)進(jìn)行填充。本章采用第二種方式來(lái)匹配網(wǎng)絡(luò),使用Python讀取權(quán)重中的節(jié)點(diǎn)名稱(chēng)和維度信息,修改權(quán)重文件中的第一層的參數(shù)維度和最后對(duì)應(yīng)種類(lèi)數(shù)的網(wǎng)絡(luò)節(jié)點(diǎn)參數(shù)為修改后的種類(lèi)數(shù)。保存修改后的權(quán)重文件為新的權(quán)重文件。

04? 模型參數(shù)設(shè)置及訓(xùn)練過(guò)程

? ? ? ?OCR識(shí)別的訓(xùn)練過(guò)程之前,要根據(jù)自己訓(xùn)練的數(shù)據(jù)集和硬件配置來(lái)設(shè)置具體的參數(shù),具體的參數(shù)配置如下。

? ? ?(1)加載數(shù)據(jù)集的位置? 在工程目錄cnn+lstm下,打開(kāi)trian_crnn.py文件,修改類(lèi)OCRIter中初始化加載函數(shù)中圖片和pkl文件的相對(duì)路徑,訓(xùn)練集圖片路徑為./data/train/text,訓(xùn)練集標(biāo)簽pkl文件./data/train,測(cè)試集圖片路徑./data/test/text,測(cè)試集標(biāo)簽pkl文件./data/test,同時(shí)設(shè)置參數(shù)train_flag為T(mén)rue,在工程代碼中修改讀取的pkl文件名稱(chēng)。數(shù)據(jù)集的代碼如下:

if train_flag:self.data_path = os.path.join(os.getcwd(), "data", "train", "text")self.label_path = os.path.join(os.getcwd(), "data", "train") else:self.data_path = os.path.join(os.getcwd(), "data", "test", "text")self.label_path?=?os.path.join(os.getcwd(),?"data",?"test")

? ? ? ?生成pkl文件的代碼如下:

def _label_path_from_index(self):label_file = os.path.join(self.label_path, "train_pkl")assert os.path.exists(label_file, "path dose not exits:{}".format(label_file))gt_file = open(label_file, "rb")label_file = cPickle.load(gt_file)gt_file.close()return?label_file

? ? ??注意:在Python代碼中以下滑線開(kāi)始的Python函數(shù)表示的是私有函數(shù),其中以單前導(dǎo)下劃線_開(kāi)頭的方法或變量,僅允許類(lèi)內(nèi)部和子類(lèi)進(jìn)行訪問(wèn),類(lèi)的實(shí)例無(wú)法訪問(wèn)此屬性和方法。和單前導(dǎo)下劃線類(lèi)似的是雙前導(dǎo)下劃線__,以此為開(kāi)頭的變量和方法,僅允許類(lèi)內(nèi)部進(jìn)行訪問(wèn),類(lèi)實(shí)例和派生類(lèi)均不能進(jìn)行訪問(wèn)此屬性和方法。

? ???(1)修改識(shí)別的標(biāo)簽的個(gè)數(shù)。識(shí)別的字符中包含數(shù)字、字母和漢字,OCR識(shí)別原理上相當(dāng)于多分類(lèi)算法,因此,類(lèi)別上設(shè)置包含數(shù)字0-1,包含漢字甲-亥和地域簡(jiǎn)稱(chēng)京、津、晉、冀、蒙、遼、吉、黑、滬、蘇、浙、皖、閩、魯、豫、鄂、湘、粵、桂、瓊、川、貴、云、藏、陜、甘、青、寧、渝、贛、新、臺(tái)、港、澳。具體的修改參數(shù)如圖6所示。

圖6? ?數(shù)據(jù)集代碼配置

? ??(2)修改num_epoch=6000,BATCH_SIZE=64,配置使用GPU-0訓(xùn)練,contexts = [mx.context.gpu(0)],默認(rèn)生成并保存權(quán)重的路徑為工程項(xiàng)目中的model文件夾。

05? ?閾值分析

? ? ? ?實(shí)際應(yīng)用中,污損遮擋號(hào)牌的識(shí)別不僅和算法的識(shí)別率有關(guān),更與所采集的車(chē)輛圖像質(zhì)量和實(shí)際車(chē)牌質(zhì)量息息相關(guān),車(chē)牌質(zhì)量的好壞直接影響最終的識(shí)別性能,例如車(chē)牌會(huì)受到主觀因素上的車(chē)輛套牌、車(chē)牌遮擋、多車(chē)牌等影響,也會(huì)受到客觀因素上的生銹、字體脫落掉漆、號(hào)牌傾斜等影響。除此之外,也會(huì)在拍攝過(guò)程中受到天氣等各種因素影響,這些因素的不同也在不同程度上影響了最終的識(shí)別效果。

? ? ?OCR識(shí)別算法是通過(guò)識(shí)別號(hào)牌上的文本來(lái)實(shí)現(xiàn)正常號(hào)牌和半遮擋號(hào)牌的分類(lèi),因此,OCR算法對(duì)每個(gè)識(shí)別到的字符都會(huì)產(chǎn)生一個(gè)置信度,且各字符之間相互獨(dú)立,為了能描述整個(gè)識(shí)別號(hào)牌的置信度,采用識(shí)別出各字符的置信度相乘的方式作為號(hào)牌的置信度,confi表示第i個(gè)字符的置信度,conf表示號(hào)牌的整體置信度,實(shí)現(xiàn)的公式如式6所示:

? ? ? 從公式中可以看出,識(shí)別到的字符中任何一個(gè)字符存在過(guò)低置信度的字符會(huì)直接導(dǎo)致整個(gè)號(hào)牌的置信度降低,因此,可以選擇直接根據(jù)整個(gè)號(hào)牌的置信度設(shè)置閾值進(jìn)行過(guò)濾,從而可以達(dá)到區(qū)分正常號(hào)牌和半遮擋號(hào)牌的目的,詳細(xì)的實(shí)現(xiàn)過(guò)程如圖7所示。

圖7?? 閾值分析流程圖

? ? ? (1)準(zhǔn)備數(shù)據(jù)。各準(zhǔn)備清晰號(hào)牌和模糊或半遮擋的號(hào)牌一百?gòu)?#xff0c;其中號(hào)牌的種類(lèi)還應(yīng)該包括各種不同顏色、不同種類(lèi)的號(hào)牌數(shù)據(jù)。其中正常號(hào)牌命名為正常號(hào)牌+序號(hào)的方式,序號(hào)從1-100,半遮擋號(hào)牌命名方式為半遮擋號(hào)牌+序號(hào),序號(hào)同樣為1-100,處理后的數(shù)據(jù)放置文件夾dataset下。

? ? ? (2)編寫(xiě)代碼。處理后的數(shù)據(jù)通過(guò)程序計(jì)算不同閾值情況下的準(zhǔn)確率,并保存每次修改閾值后計(jì)算得出的準(zhǔn)確率,最后生成折線圖。實(shí)現(xiàn)過(guò)程中判斷號(hào)牌的置信度是否大于設(shè)置的閾值,高于閾值的號(hào)牌并被判斷其命名為正常號(hào)牌的作為正常號(hào)牌,低于閾值并被判斷命名方式中含有半遮擋號(hào)牌的同樣作為正確識(shí)別,在這兩個(gè)條件下計(jì)算號(hào)牌的準(zhǔn)確率。

? ? ? (3)選擇閾值。經(jīng)過(guò)公式3-6可以得出整個(gè)號(hào)牌的置信度,因此使用號(hào)牌的置信度增加過(guò)濾的閾值可以達(dá)到分類(lèi)的效果。編寫(xiě)腳本統(tǒng)計(jì)在不同閾值情況下驗(yàn)證數(shù)據(jù)集的準(zhǔn)確率,低于設(shè)定閾值的號(hào)牌作為半遮擋號(hào)牌,否則為正常號(hào)牌,設(shè)定初始值為0.5并以0.02的速度遞增,從而測(cè)試出在最高準(zhǔn)確率的情況下最合適的閾值,從圖中可見(jiàn),閾值大致隨準(zhǔn)確率呈正比狀態(tài),閾值為0.95左右時(shí)趨向平穩(wěn),達(dá)到96%的準(zhǔn)確率,因此,選取合適的閾值為0.95,實(shí)驗(yàn)部分的漲幅圖如圖8所示。

圖8? ??閾值圖

06? 實(shí)驗(yàn)結(jié)果

? ? ?配置好模型參數(shù)后,啟動(dòng)模型開(kāi)始進(jìn)行訓(xùn)練,訓(xùn)練OCR模型主要分為生成中間權(quán)重文件以及驗(yàn)證實(shí)驗(yàn)結(jié)果二個(gè)部分。詳細(xì)過(guò)程如下。

? ? ? (1)生成權(quán)重文件。本章中設(shè)置每一次epoch生成一次權(quán)重文件,權(quán)重文件保存到工程項(xiàng)目的model路徑下,權(quán)重文件的命名中包含epoch值,用來(lái)記錄迭代的次數(shù),在不發(fā)生梯度爆炸的情況下,隨著不斷地訓(xùn)練,損失值loss值不斷減少,學(xué)習(xí)效果也更好,由于數(shù)據(jù)量大并且收斂速度較為緩慢,因此在設(shè)置保存間隔時(shí)可設(shè)置為較大的值,本文中設(shè)置的間隔為迭代1000次進(jìn)行一次權(quán)重文件的保存。

? ? ? (2)選擇模型。訓(xùn)練過(guò)程中l(wèi)oss值越低代表在訓(xùn)練集上擬合效果越好,但并不代表對(duì)驗(yàn)證集效果也好,因此,除了要求訓(xùn)練過(guò)程中l(wèi)oss值不斷減少之外,還要求保存中間產(chǎn)生的權(quán)重文件,保證驗(yàn)證集測(cè)試其模型既能夠?qū)W習(xí)到足夠的特征,也能保持更好的泛化能力。經(jīng)過(guò)驗(yàn)證在epoch為4500時(shí),準(zhǔn)確率更高,loss也更低。測(cè)試部分圖片的輸出結(jié)果如圖9所示。

圖9? ?OCR輸出結(jié)果

? ? ? 從數(shù)據(jù)選擇用來(lái)計(jì)算準(zhǔn)確率的驗(yàn)證集200張,其中包含正常號(hào)牌一百?gòu)?#xff0c;半遮擋號(hào)牌一百?gòu)?#xff0c;其中包括各種情況下的號(hào)牌,例如藍(lán)牌、黃牌、新能源等等。驗(yàn)證OCR算法的指標(biāo)與目標(biāo)檢測(cè)的指標(biāo)相同。

? ? ? 本次實(shí)驗(yàn)中使用的閾值為0.95來(lái)計(jì)算其驗(yàn)證集中的準(zhǔn)確率、召回率等等指標(biāo),計(jì)算指標(biāo)的數(shù)據(jù)分為兩部分,一部分采用正常號(hào)牌,另外一部分為半遮擋號(hào)牌,分別計(jì)算其準(zhǔn)確率(accuracy)、召回率(recall)、精確率(precision)和F1score三部分,從下表中可以得出,在準(zhǔn)確率上識(shí)別正常號(hào)牌的準(zhǔn)確率高達(dá)94.90%,遠(yuǎn)高于半遮擋號(hào)牌的準(zhǔn)確率,但半遮擋號(hào)牌的精確率在召回率為91.61%的基礎(chǔ)上可以達(dá)到100%的識(shí)別,從最后計(jì)算的F1score上來(lái)看,半遮擋號(hào)牌的識(shí)別效果要好于正常號(hào)牌。計(jì)算后的結(jié)果如表1所示。

? ? ? ?測(cè)試平臺(tái)的不同也會(huì)影響其運(yùn)行效率,為了減少其他因素造成的影響,使對(duì)比效果更加具有可信度,本次采用的操作系統(tǒng)均為Ubuntu 16.04。其中GPU測(cè)試平臺(tái)為NVIDIA GeForce GTX 1080 Ti顯卡,使用的Cuda版本為10.0,并在測(cè)試的GPU平臺(tái)上安裝Cudnn加速庫(kù),CPU平臺(tái)為AMD 3550H處理器。為了實(shí)現(xiàn)不同平臺(tái)上的速度測(cè)試,分別在不同的平臺(tái)上搭建環(huán)境,運(yùn)行代碼的測(cè)試除了根據(jù)硬件設(shè)施需要對(duì)環(huán)境進(jìn)行安裝之外還需要對(duì)代碼進(jìn)行重新編譯。測(cè)試后的運(yùn)行速率如表2所示。

猜您喜歡:

深入淺出stable diffusion:AI作畫(huà)技術(shù)背后的潛在擴(kuò)散模型論文解讀

?戳我,查看GAN的系列專(zhuān)輯~!

一頓午飯外賣(mài),成為CV視覺(jué)的前沿弄潮兒!

最新最全100篇匯總!生成擴(kuò)散模型Diffusion Models

ECCV2022 | 生成對(duì)抗網(wǎng)絡(luò)GAN部分論文匯總

CVPR 2022 | 25+方向、最新50篇GAN論文

?ICCV 2021 | 35個(gè)主題GAN論文匯總

超110篇!CVPR 2021最全GAN論文梳理

超100篇!CVPR 2020最全GAN論文梳理

拆解組新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多樣性圖像生成

附下載 |?《可解釋的機(jī)器學(xué)習(xí)》中文版

附下載 |《TensorFlow 2.0 深度學(xué)習(xí)算法實(shí)戰(zhàn)》

附下載 |《計(jì)算機(jī)視覺(jué)中的數(shù)學(xué)方法》分享

《基于深度學(xué)習(xí)的表面缺陷檢測(cè)方法綜述》

《零樣本圖像分類(lèi)綜述: 十年進(jìn)展》

《基于深度神經(jīng)網(wǎng)絡(luò)的少樣本學(xué)習(xí)綜述》

《禮記·學(xué)記》有云:獨(dú)學(xué)而無(wú)友,則孤陋而寡聞

歡迎加入 GAN/擴(kuò)散模型 —交流微信群 !

掃描下面二維碼,添加運(yùn)營(yíng)小妹好友,拉你進(jìn)群。發(fā)送申請(qǐng)時(shí),請(qǐng)備注,格式為:研究方向+地區(qū)+學(xué)校/公司+姓名。如?擴(kuò)散模型+北京+北航+吳彥祖

請(qǐng)備注格式:研究方向+地區(qū)+學(xué)校/公司+姓名

點(diǎn)擊?一頓午飯外賣(mài),成為CV視覺(jué)的前沿弄潮兒!,領(lǐng)取優(yōu)惠券,加入?AI生成創(chuàng)作與計(jì)算機(jī)視覺(jué)?知識(shí)星球!

總結(jié)

以上是生活随笔為你收集整理的PyTorch实现 | 车牌OCR识别,《PyTorch深度学习之目标检测》的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。