日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Cascade R-CNN的一些记录

發(fā)布時間:2025/3/16 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Cascade R-CNN的一些记录 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Cascade R-CNN的一些記錄

《Cascade R-CNN: Delving into High Quality Object Detection》CVPR2018的一篇文章

論文鏈接:https://arxiv.org/abs/1712.00726?
代碼鏈接:https://github.com/zhaoweicai/cascade-rcnn

參考鏈接:https://blog.csdn.net/qq_21949357/article/details/80046867

本文主要針對的是目標(biāo)檢測問題中的IoU閾值選取問題,眾所周知,閾值選取越大就越容易得到高質(zhì)量的樣本,但是一味選取高的閾值會引發(fā)兩個問題:

  • 樣本減少引發(fā)的過擬合
  • 在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch。(只有輸入的region proposal自身的IOU值和訓(xùn)練器訓(xùn)練用的設(shè)定IOU閾值較為接近的時候,訓(xùn)練器輸出的IOU值才會高即性能才好)

為了解決上述兩個問題就提出了一種基于Faster-RCNN的muti-stage的architecture,核心就是利用不斷提高的閾值,在保證正例樣本數(shù)不減少的情況下訓(xùn)練出高質(zhì)量的檢測器

Abstract

  • 在目標(biāo)檢測中需要一個IOU值來區(qū)分樣本的正負(fù)樣例,檢測器使用較低的IOU值訓(xùn)練時會產(chǎn)生噪聲監(jiān)測,但是使用的IOU閾值變大時會造成檢測效果下降,這主要由兩個原因造成,IOU值變大時正例樣本指數(shù)級消失導(dǎo)致過擬合在train和inference使用不一樣的閾值很容易導(dǎo)致mismatch
  • 級聯(lián)RCNN包括一系列IOU逐漸增大的檢測器,并且是一步一步訓(xùn)練,上一個檢測器的輸出作為下一個檢測器的輸入,因為對一個檢測器來說輸出的IOU值會比輸入的IOU更高。
  • 1 Introduction

  • 目標(biāo)檢測兩個主要問題:識別分類問題,從背景中識別前景物體并正確分類;定位問題,給不同的目標(biāo)準(zhǔn)確的邊界框。
  • 級聯(lián)R-CNN的來源:一個檢測器只能在一個質(zhì)量水平(quality level)上表現(xiàn)的很好,這是從代價敏感學(xué)習(xí)中得出的:ROC曲線不同點的優(yōu)化需要不同的損失函數(shù),不同的是論文中是優(yōu)化IOU閾值而不是假陽率。
  • 從圖中看出,如果提供高質(zhì)量(高IOU)的輸入則檢測器也有較好的效果,但是隨著輸入數(shù)據(jù)的IOU的持續(xù)升高,檢測器效果會下降(因為過擬合),
  • 級聯(lián)R-CNN可以用任意的兩步階段結(jié)構(gòu)的R-CNN建立。
  • 2 Related Work

    RetinaNet解決密集物體檢測,前景和背景極端不平衡問題,并取得了比兩步的目標(biāo)檢測更好的效果。

    3、Object Detection

    基于Faster-RCNN,第一步proposal subnetwork(RPN網(wǎng)絡(luò))生成候選框H0,第二步是ROI池化層H1,將不同大小候選框在特征圖上的映射patch,把映射的patch采樣成固定大小的特征,和SPP類似,但只是用一個尺度(一個patch不論大小就劃分為4個部分)進(jìn)行劃分。分類器是C,邊界框是B

    3.1 Bounding box regression

    邊界框b=(bx,by,bw,bh),邊界框回歸f(x,b)的作用是從候選邊界框中選出目標(biāo)邊界框,邊界框的損失函數(shù)在faster-RCNN中是L1損失函數(shù),并通常用均值和方差正則化處理。在FatserRCNN中一個單獨的邊界框回歸器f不能解決精確定位的問題,所以使用Bbox,但是Bbox中IOU的值固定(單一閾值即使用的是完全相同的級聯(lián)結(jié)構(gòu)),所以IOU的值不一定一直是最優(yōu)的,并且邊界框的分布隨每次迭代變化很大。

    (C0的結(jié)果是anchor中有目標(biāo)或者沒有目標(biāo))

    3.2 Classification

    分類器的函數(shù)是h(x),h(x)是后驗概率的M+1維估計,hk(x) = p(y = k|x),通過最小化交叉熵?fù)p失來學(xué)習(xí),

    3.3 Detection Quality

    如果IOU的值大于給定閾值,則認(rèn)為這個patch是這個類中的一個。

    當(dāng)給定的IOU閾值大時,正例中包含很少的背景,但是正例數(shù)量會很少;當(dāng)小時,容易產(chǎn)生接近但不正確的判斷(假陽率高)。解決方法:傳統(tǒng)最容易想到的是使用分類器的集成,如圖c,Iterative Loss實際上沒有級聯(lián)結(jié)構(gòu),從c圖可以看出來,它只是使用了不同的閾值來進(jìn)行分類,然后融合他們的結(jié)果進(jìn)行分類推理,并沒有同時進(jìn)行BBox reg,因此沒有解決 不同數(shù)量的正例數(shù)應(yīng)對應(yīng)不同的損失 的問題。

    ?

    4、Cascade R-CNN

    與Bbox不同的是,級聯(lián)RCnn通過重采樣改變了不同階段的輸入假設(shè)分布,并且通過重采樣保證了每個階段有足夠固定數(shù)量的正例樣本數(shù)。這就實現(xiàn)了沒有過擬合和更深層的訓(xùn)練階段可以有更高的IOU閾值.

    • cascaded regression通過調(diào)整閾值的方式重采樣,不斷改變候選框region proposal的分布,而且cascaded重采樣后的每個檢測器,都對重采樣后的樣本proposals是最優(yōu)的,沒有mismatch問題。
    • cascaded在train和inference時都會使用,因此并沒有偏差問題。

      其實像我這樣的入門者有很多不懂之處,歡迎指正。

    總結(jié)

    以上是生活随笔為你收集整理的Cascade R-CNN的一些记录的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。