日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Mask R-CNN为什么“家喻户晓”

發(fā)布時間:2024/9/27 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Mask R-CNN为什么“家喻户晓” 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

目標檢測和語義分割技術(shù)通過強大的目標檢測框架和語義分割框架取得顯著進步,這些方法提供了靈活性、魯棒性,快速的訓練。

對象分割要求正確檢測圖像中所有目標的同時精確地分割每個實例。因此,結(jié)合對象檢測的經(jīng)典計算機視覺任務(wù)的元素,其中的目標是分類單個對象和使用邊界框定位每個對象和語義分割,目標是將每個像素分類為一組固定的類別,不區(qū)分對象實例。何愷明團隊證明了這一點一個非常簡單、靈活和快速的系統(tǒng)Mask R-CNN可以超越它先前最先進的實例分割結(jié)果。

該方法,稱為Mask R-CNN。

文章傳送門:https://arxiv.org/abs/1703.06870

“家喻戶曉”的Mask R-CNN是圖像分割領(lǐng)域中非常經(jīng)典的實例分割(Instance segmentation)算法。Mask R-CNN不僅在實例分割任務(wù)中表現(xiàn)優(yōu)異,還是一個非常靈活的框架,可以通過增加不同的分支完成目標分類、目標檢測、語義分割、實例分割、人體姿勢識別等多種不同的任務(wù)。

Mask R-CNN擴展了Faster R-CNN通過添加一個分支來預(yù)測分割掩碼在每個感興趣區(qū)域(RoI)上,與現(xiàn)有分支并行進行分類和邊界框回歸。

Mask R-CNN

本質(zhì)上,Mask R-CNN是一種直觀的延伸Faster R-CNN,但構(gòu)建掩模分支正確是取得好結(jié)果的關(guān)鍵。最重要的是,更快的RCNN不是為網(wǎng)絡(luò)輸入和輸出之間的像素對像素對齊而設(shè)計的。這一點在RoIPool是處理實例的實際核心操作,它如何執(zhí)行粗空間量化特征提取。為了解決這個問題,我們提出了一個簡單的,無量化的層,叫做RoIAlign忠實地保留精確的空間位置。

盡管看似很小的變化,RoIAlign卻有很大的影響:

提高掩模精度10%到50%,顯示在更嚴格的標準下獲得更大的收益。有必要解耦掩碼和類預(yù)測,為每個類單獨預(yù)測一個二進制掩碼,而不依賴于網(wǎng)絡(luò)的投資回報率分類分支預(yù)測類別。

基本結(jié)構(gòu)——two-state結(jié)構(gòu):一階段網(wǎng)絡(luò)找出RPN;對RPN找到的每個RoI進行分類、定位、并找到binary mask。Mask Representation:結(jié)構(gòu)中沒有采用全連接層,而使用了RoIAlign,并是在一個小feature map上做分割。RoIAlign:為從RPN網(wǎng)絡(luò)確定的ROI中導出較小的特征圖。RPN網(wǎng)絡(luò)會提出若干RoI的坐標,然后輸入RoI Pooling,輸出供分類和定位使用的特征圖。

效果:Mask RCNN的分割效果好于FCIS,尤其在目標重合的部分。

Mask RCNN精度高于Faster RCNN。Mask RCNN的分割任務(wù)得分與定位任務(wù)得分相近。

Mask R-CNN預(yù)測效果:

文章傳送門:https://arxiv.org/abs/1703.06870

總結(jié)

以上是生活随笔為你收集整理的Mask R-CNN为什么“家喻户晓”的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。