日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

检测系列--YOLO系列

發(fā)布時(shí)間:2024/7/23 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 检测系列--YOLO系列 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

開(kāi)頭語(yǔ):RCNN系列,需要區(qū)域候選框,即便最后是多任務(wù)損失函數(shù),但回歸和分類各是一塊是很明顯的,而yolo要把分類問(wèn)題轉(zhuǎn)換成回歸,這樣的話就全是回歸。

一.yolo v1

1,介紹,此時(shí)輸入size要一致448*448

2,框架,googlenet作為主干網(wǎng)絡(luò),但注意經(jīng)過(guò)了一些改進(jìn),并沒(méi)有用到多通路做法

3,紅色箭頭是經(jīng)改進(jìn)的googlenet出來(lái)的,改進(jìn)地方在于沒(méi)有用googlenet多通路做法,而是1x1降維,3x3卷積提取,1x1升維

其中7x7是網(wǎng)格的劃分,通道數(shù)30=(B*5+C),B是每個(gè)網(wǎng)格負(fù)責(zé)預(yù)測(cè)的目標(biāo)個(gè)數(shù),5是坐標(biāo)+置信度,C是類別,每個(gè)bound box對(duì)應(yīng)5個(gè)參數(shù),B是用來(lái)確認(rèn)是目標(biāo)還是背景,與C的 每一類概率相乘來(lái)確認(rèn)是哪一類,這里要注意的就是每個(gè)box共享一個(gè)分類的score.候選框篩選到7*7*B,大大減少了候選框,同時(shí)也減少與gt試錯(cuò)的機(jī)會(huì).

4,一個(gè)格子只預(yù)測(cè)兩個(gè)bounding box

5,x,y,w,h要?dú)w一化到1

這里的回歸四個(gè)值主要是中心點(diǎn)x,y(注意相對(duì)于格點(diǎn))和 長(zhǎng)寬

圖片寬為wi,高為hi,box中心點(diǎn)(相對(duì)于格點(diǎn))為(x,y),寬高比例為(wb,hb),col,row代表格點(diǎn)的列數(shù)和行數(shù),S代表劃分的行列數(shù),預(yù)測(cè)的box中心點(diǎn)(相對(duì)于大圖)為(xc,yc)

先看預(yù)測(cè)階段,在逆推回訓(xùn)練階段就好理解了:

預(yù)測(cè)階段:

box相對(duì)于格點(diǎn)的中心點(diǎn)為:(wi/S)*x,(hi/S)*y

格點(diǎn)相對(duì)于大圖的坐標(biāo)為col*(wi/S),row*(hi/S)

故box相對(duì)于大圖的中心點(diǎn)為:xc= (wi/S)*x+col*(wi/S), yc =?(hi/S)*y+row*(hi/S)

訓(xùn)練階段,也就是要回歸box相對(duì)于格點(diǎn)的偏移量也就是求x,y

故x =xc*(S/wi) - col,y?=yc*(S/hi) - row,

回歸寬高就好理解了,回歸w= wb/wi,h = hb/hi.

6.目標(biāo)×屬于每一類的概率得到最大可能性是哪一類

7.loss函數(shù)

此時(shí)還是比較粗暴,全部采用l2 loss.

上面做法存在的問(wèn)題是:

1.8維的定位Loss和20維的分類Loss同等重要是不合理的;

2.如果一個(gè)網(wǎng)絡(luò)沒(méi)有物體,那么loss就由沒(méi)有物體占主導(dǎo),會(huì)將網(wǎng)絡(luò)的box置信度push到0,導(dǎo)致網(wǎng)絡(luò)不穩(wěn)定。

解決辦法:

1.對(duì)8維的定位Loss給予更大的權(quán)重;

2.對(duì)沒(méi)有物體的box的置信度loss給更小的權(quán)重;

為了解決不同大小box造成的偏移loss是一樣的,將box的width和height取平方根代替原本的height和width。小box的橫軸值較小,發(fā)生偏移時(shí),反應(yīng)到y(tǒng)軸上相比大box要大。

8,NMS踢掉剩余的框

9,yolo策略

10,yolo v1效果,因?yàn)橛玫饺B接,丟失空間信息故容易產(chǎn)生定位錯(cuò)誤

二.yolo v2

其也稱為yolo9000.

1,加入bn。

2,取5個(gè)anchor boxes

3.每個(gè)box都有預(yù)測(cè)的坐標(biāo)和類別

4.多尺度訓(xùn)練

每10個(gè)Batch,網(wǎng)絡(luò)會(huì)隨機(jī)地選擇一個(gè)新的圖片尺寸,由于使用了下采樣參數(shù)是32,所以不同的尺寸大小也選擇為32的倍數(shù){320,352…..608},最小320*320,最大608*608,網(wǎng)絡(luò)會(huì)自動(dòng)改變尺寸,并繼續(xù)訓(xùn)練的過(guò)程。

三.yolo v3

backbone采用去除全連接的darknet53,經(jīng)過(guò)5次Res模塊后,得到的特征圖是608->304->152->76->38->19大小

每個(gè)ResX包含1+2*x個(gè)卷積層,故包含1+(1+2*1)+(1+2*2)+(1+2*8)+(1+2*8)+(1+2*4)=52

1.anchor由yolov2的5個(gè)變?yōu)?個(gè);

2.不再使用Softmax進(jìn)行分類,對(duì)每一類使用二分類,分類損失也使用二值交叉熵;

3.采用FPN, 其中包含三個(gè)特征圖尺度,分別下采樣32x,16x,8x,每個(gè)特征圖上設(shè)置三種大小的anchors,對(duì)應(yīng)大、中、小,每一個(gè)尺度的特征圖上可以得到 N × N × [3 ? (4 + 1 + 80)] 的結(jié)果,分別是N x N個(gè) gird cell ,3種尺度的anchors,x、y、w、h、confidence、80類;

4.由yolov2的darknet-19升級(jí)為darknet-53.

四.yolov4

這篇文章寫(xiě)的很詳細(xì)很全。

  • Backbone:CSPDarknet53
  • Neck:SPP,PAN
  • Head:YOLOv3

與yolov3差異:

1.CBM:采用的而是Mish激活函數(shù),可看出分類上還是會(huì)漲點(diǎn);

f(x) = x?tanh(?(x)),?(x) = ln(1+e^x)

? ? ? ? ? ? ? ??

?     ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? mish? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ???(x)與relu


2.CSPX:由卷積和X個(gè)Res unit模塊concate組成,其借鑒的是CSPNet的思想,主要是從網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的角度解決推理中計(jì)算量大的問(wèn)題,采用CSP模塊先將基礎(chǔ)層的特征映射劃分為兩部分,然后通過(guò)跨階段層次結(jié)構(gòu)將它們合并,在減少了計(jì)算量的同時(shí)可以保證準(zhǔn)確率,每個(gè)CSPX包括5+2*x個(gè)卷積層;
3.SPP:多尺度最大池化;
4.卷積層采用dropblock,類似cutout,只不過(guò)cutout作用于輸入層數(shù)據(jù),而dropblock作用于網(wǎng)絡(luò)的每一個(gè)特征圖,將某個(gè)局部區(qū)域刪除丟棄,比dropout力度大;


5.采用PAN結(jié)構(gòu)

其實(shí)就是在FPN輸出在增加下采樣。融合FPN的語(yǔ)義特征和特征金字塔的位置特征。


6.ciou loss

參考我之前寫(xiě)的這篇文章

參考:

https://zhuanlan.zhihu.com/p/136382095

https://zhuanlan.zhihu.com/p/143747206

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎(jiǎng)勵(lì)來(lái)咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎(jiǎng)

總結(jié)

以上是生活随笔為你收集整理的检测系列--YOLO系列的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。