日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > 目标检测 >内容正文

目标检测

maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)

發(fā)布時間:2025/10/17 目标检测 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network) 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

用于目標(biāo)檢測的池化漸進(jìn)網(wǎng)絡(luò)(Pooling Pyramid Network)

題目:

Pooling Pyramid Network for Object Detection

作者:

Pengchong Jin, Vivek Rathod, Xiangxin Zhu

來源:

Machine Learning (cs.LG)

Submitted on 9 Jul 2018

文檔鏈接:

arXiv:1807.03284

代碼鏈接:

https://github.com/UKPLab/elmo-bilstm-cnn-crf

摘要

我們想分享一個簡單微調(diào)的單鏡頭多盒探測器(SSD),它能有效地減少模型尺寸,同時保持相同的性能。我們在所有的尺度上共享盒測器,并使用最大池替換尺度之間的卷積。與普通的SSD相比,它有兩個優(yōu)點(diǎn):(1)它避免了跨尺度的分?jǐn)?shù)錯誤校準(zhǔn);(2)共享預(yù)測器可以看到所有級別的訓(xùn)練數(shù)據(jù)。由于我們將預(yù)測器的數(shù)量減少到一個,并對它們之間的所有卷積進(jìn)行了修剪,因此模型的大小要小得多。我們的經(jīng)驗(yàn)表明,相比,普通的SSD,這些變化并沒有損害模型的性能。

英文原文

We'd like to share a simple tweak of Single Shot Multibox Detector (SSD) family of detectors, which is effective in reducing model size while maintaining the same quality. We share box predictors across all scales, and replace convolution between scales with max pooling. This has two advantages over vanilla SSD: (1) it avoids score miscalibration across scales; (2) the shared predictor sees the training data over all scales. Since we reduce the number of predictors to one, and trim all convolutions between them, model size is significantly smaller. We empirically show that these changes do not hurt model quality compared to vanilla SSD.

要點(diǎn)

Pooling Pyramid Network (PPN)

該模型是一種單級卷積目標(biāo)檢測器,與傳統(tǒng)的SSD非常相似,只是做了一些簡單的改變。該預(yù)測頭被設(shè)計(jì)成重量輕,運(yùn)行速度快,同時保持與普通SSD相當(dāng)?shù)臋z測精度。網(wǎng)絡(luò)體系結(jié)構(gòu)如圖1所示。

圖1所示。池金字塔網(wǎng)絡(luò)(PPN)與普通SSD的體系結(jié)構(gòu)比較。左:香草SSD,右:PPN。注意,PPN中的變化是突出顯示的:(1)使用max pool構(gòu)建特征金字塔,(2)使用共享卷積預(yù)測器進(jìn)行框分類和回歸。

Shared Box Predictor

普通的SSD對不同尺度的特征圖使用獨(dú)立的框預(yù)測器。一個問題是對不同尺度的預(yù)測分?jǐn)?shù)的錯誤校準(zhǔn)。由于每個框預(yù)測器只使用分配給它的groundtruth框的一部分進(jìn)行獨(dú)立訓(xùn)練,因此不同的框預(yù)測器在訓(xùn)練期間可以看到非常不同數(shù)量的正例和負(fù)例。這種隱式的數(shù)據(jù)不平衡導(dǎo)致了來自不同預(yù)測器的分?jǐn)?shù)落在非常不同的范圍內(nèi)的問題,這使得它們無法比擬,并且在后續(xù)基于分?jǐn)?shù)的后處理步驟(如非最大抑制)中難以使用。我們設(shè)計(jì)了一個跨越不同尺度特征圖的共享框預(yù)測器。因此,即使groundtruth box量表存在不平衡,box預(yù)測器也能看到所有的訓(xùn)練數(shù)據(jù)。這減少了錯誤校準(zhǔn)和不穩(wěn)定預(yù)測分?jǐn)?shù)的影響。有人可能會說,為每個量表設(shè)置單獨(dú)的box預(yù)測器可以增加總?cè)萘?#xff0c;并允許每個預(yù)測器專注于其特定的量表。然而,我們認(rèn)為這可能沒有必要,因?yàn)閷ο蟠蠖嗍浅叨炔蛔兊摹?/p>

Max Pooling Pyramid

我們的目標(biāo)是建立一個多尺度的特征金字塔結(jié)構(gòu),從中我們可以使用共享框預(yù)測器進(jìn)行預(yù)測。我們通過收縮基本特性通過骨干網(wǎng)多次使用一系列最大池操作來實(shí)現(xiàn)。

表1。實(shí)驗(yàn)對比結(jié)果:COCO檢測:MobileNet SSD vs . MobileNet PPN

總結(jié)

以上是生活随笔為你收集整理的maskrcnn用于目标检测_用于目标检测的池化渐进网络(Pooling Pyramid Network)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。