日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

TF实战:(Mask R-CNN原理介绍与代码实现)-Chapter-8

發布時間:2023/12/31 编程问答 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 TF实战:(Mask R-CNN原理介绍与代码实现)-Chapter-8 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?????? 這篇文章寫的挺辛苦,不過對于Mask介紹著墨不多。

?????? 文章:?TF實戰:Chapter-8上(Mask R-CNN介紹與實現)

??????

...............................................

???? MRCNN采用和Faster R-CNN相同的兩個階段,具有相同的第一層(即RPN),第二階段,除了預測種類和bbox回歸,并且并行的對每個RoI預測了對應的二值掩膜(binary mask)。示意圖如下:

這樣做可以將整個任務簡化為mulit-stage pipeline,解耦了多個子任務的關系,現階段來看,這樣做好處頗多。

主要工作

損失函數的定義

依舊采用的是多任務損失函數,針對每個每個RoI定義為

L=Lcls+Lbox+Lmask LclsLbox與Faster R-CNN的定義類似,這里主要看 Lmask

掩膜分支針對每個RoI產生一個Km2

的輸出, 即K個分辨率為m×m的二值的掩膜K為分類物體的種類數目。依據預測類別分支預測的類型 i,只將第 i的二值掩膜輸出記為 Lmask

。
掩膜分支的損失計算如下示意圖:

  • mask branch 預測K
  • 個種類的 m×m 二值掩膜輸出依據種類預測分支(Faster R-CNN部分)預測結果:當前RoI的物體種類為i
    i個二值掩膜輸出就是該RoI的損失Lmask

  • 對于預測的二值掩膜輸出,我們對每個像素點應用sigmoid函數,整體損失定義為平均二值交叉損失熵。
    引入預測K

    個輸出的機制,允許每個類都生成獨立的掩膜,避免類間競爭。這樣做解耦了掩膜和種類預測。不像是FCN的方法,在每個像素點上應用softmax函數,整體采用的多任務交叉熵,這樣會導致類間競爭,最終導致分割效果差。

    掩膜表示到RoIAlign層

    在Faster R-CNN上預測物體標簽或bbox偏移量是將feature map壓縮到FC層最終輸出vector,壓縮的過程丟失了空間上(平面結構)的信息,而掩膜是對輸入目標做空間上的編碼,直接用卷積形式表示像素點之間的對應關系那是最好的了。

    輸出掩膜的操作是不需要壓縮輸出vector,所以可以使用FCN(Full Convolutional Network),不僅效率高,而且參數量還少。為了更好的表示出RoI輸入和FCN輸出的feature之間的像素對應關系,提出了RoIAlign層。

    先回顧一下RoIPool層:

    其核心思想是將不同大小的RoI輸入到RoIPool層,RoIPool層將RoI量化成不同粒度的特征圖(量化成一個一個bin),在此基礎上使用池化操作提取特征。

    下圖是SPPNet內對RoI的操作,在Faster R-CNN中只使用了一種粒度的特征圖:

    平面示意圖如下:

    這里面存在一些問題,在上面量操作上,實際計算中是使用的是[x/16]

    16的量化的步長,[·]

    是舍入操作(rounding)。這套量化舍入操作在提取特征時有著較好的魯棒性(檢測物體具有平移不變性等),但是這很不利于掩膜定位,有較大負面效果。

    針對這個問題,提出了RoIAlign層:避免了對RoI邊界或bin的量化操作,在擴展feature map時使用雙線性插值算法。這里實現的架構要看FPN論文:

    一開始的Faster R-CNN是基于最上層的特征映射做分割和預測的,這會丟失高分辨下的信息,直觀的影響就是丟失小目標檢測,對細節部分丟失不敏感。受到SSD的啟發,FPN也使用了多層特征做預測。這里使用的top-down的架構,是將高層的特征反卷積帶到低層的特征(即有了語義,也有精度),而在MRCNN論文里面說的雙線性差值算法就是這里的top-down反卷積是用的插值算法。

    總結

    MRCNN有著優異的效果,除去了掩膜分支的作用,很大程度上是因為基礎特征網絡的增強,論文使用的是ResNeXt101+FPN的top-down組合,有著極強的特征學習能力,并且在實驗中夾雜這多種工程調優技巧。

    但是吧,MRCNN的缺點也很明顯,需要大的計算能力并且速度慢,這離實際應用還是有很長的路,坐等大神們發力!

    ...................

    請參考原文.............




    總結

    以上是生活随笔為你收集整理的TF实战:(Mask R-CNN原理介绍与代码实现)-Chapter-8的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。