日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > 目标检测 >内容正文

目标检测

【深度学习】百度:YOLOX和NanoDet都没我优秀!轻量型实时目标检测模型PP-PicoDet开源...

發布時間:2025/3/12 目标检测 95 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【深度学习】百度:YOLOX和NanoDet都没我优秀!轻量型实时目标检测模型PP-PicoDet开源... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

??作者丨happy

編輯丨極市平臺

導讀

?

百度提出新型移動端實時檢測模型PP-PicoDet。本文對anchor-free策略在輕量型檢測器中的應用進行了探索;對骨干結構進行了增強并設計了一種輕量Neck部件;同時對SimOTA策略與Loss進行了改進。通過上述改進,所提PP-PicoDet取得了超越其他實時檢測模型的性能。

論文鏈接:https://arxiv.org/abs/2111.00902

代碼鏈接:https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.3/configs/picodet

比YOLOX還要優秀,百度提出新型移動端實時檢測模型PP-PicoDet。本文對anchor-free策略在輕量型檢測器中的應用進行了探索;對骨干結構進行了增強并設計了一種輕量Neck部件;同時對SimOTA策略與Loss進行了改進。通過上述改進,所提PP-PicoDet取得了超越其他實時檢測模型的性能。比如:PicoDet-S僅需0.99M參數即可取得30.6%mAP,比YOLOX-Nano高4.8%同時推理延遲降低55%,比NanoDet指標高7.1%,同時推理速度高達150fps(驍龍865)。

Abstract

更佳的精度-效率均衡已成為目標檢測領域極具挑戰性問題。本文致力于目標檢測的關鍵技術優化與架構選擇以提升其性能與效率。

我們對anchor-free策略在輕量型目標檢測模型中的應用進行了探索;我們對骨干結構進行了增強并設計了一種輕量型Neck結構以提升模型的特征提取能力;我們對label assignment策略與損失函數進行了改進以促進更穩定、更高效的訓練。通過上述優化,我們構建了一類實時目標檢測器PP-PicoDet,它在移動端設備上取得了非常優異的性能。

相比其他主流檢測模型,所提方案取得了更好的精度-效率均衡。比如

  • PicoDet-S僅需0.99M參數即可取得30.6%mAP,比YOLOX-Nano高4.8%同時推理延遲降低55%,比NanoDet指標高7.1%;當輸入尺寸為320時,在移動端ARM CPU上可以達到123FPS處理速度,推理框架為PaddleLite時,推理速度可達150FPS。

  • PicoDet-M僅需2.15M參數即可取得34.3%mAP指標;

  • PicoDet-L僅需3.3M參數即可取得40.9%mAP,比YOLOv5s高3.7%mAP,推理速度快44%。

  • 如下圖所示,所提方案具有最佳的精度-效率均衡。

Contribution

本文貢獻主要包含以下幾點:

  • 采用CSP架構構建CSP-PAN,它通過卷積對所有分支輸入通道進行統一,大幅提升特征提取能力,同時減少了參數量。與此同時,我們將深度卷積從擴展到提升感受野;

  • label assignment是目標檢測非常重要的模塊。我們在SimOTA的基礎上對某些計算細節進行了優化,在不損失效率的同時增強了性能。具體來說,我們采用VarifocalLoss與GIoULoss的加權組合計算損失矩陣

  • ShuffleNetV2在移動端非常高效,我們對其進行了增強并提出一種新的骨干ESNet(Enhanced ShuffleNet, ESNet);

  • 提出一種用于檢測的改進版One-Shot NAS方案以尋找最佳的架構。

Method

接下來,我們將首先呈現設計思路與NAS搜索方案,這有助于提升精度、降低推理延遲;然后我們再介紹關于Neck與Head模塊的增強策略;最后我們對Label Assignment以及其他提升性能的策略進行介紹。

Better Backbone

實驗發現:相比其他模型,ShuffleNetV2在移動端具有更好的魯棒性 。為提升ShuffleNetV2的性能,我們參考PP-LCNet對其進行了增強并構建一種新的骨干ESNet。

上圖給出了ESNet中的ESBlock結構示意圖。SE是一種非常棒的提升特征表達能力的操作,故ESBlock中包含了SE模塊。SE模塊的設計參考了MobileNetV3,即兩個激活函數分別為Sigmoid、H-Sigmoid。

通道置換為ShuffleNetV2中的通道提供了信息交換,但它會導致融合特征損失。為解決該問題,當stride=2時,我們添加了depth與point卷積對不同通道信息進行融合(見上圖3-a)。

GhostNet中的Ghost模塊能夠用更少的參數生成更多特征并提升模型的學習能力。因此,當stride=1時,我們在ESBlock中引入Ghost模塊以提升其性能(見上圖3-b)。

上述部分內容是手工方式的模塊設計,文中還用到了NAS技術對ESNet進行搜索以更好的適配檢測模型。對該部分內容感興趣的同學建議查看原文,筆者對此暫時略過。

CSP-PAN and Detector Head

上圖給出了PP-PicoDet整體架構示意圖。接下來,我們重點關注CSP-PAN與Head部分。CSP結構已被廣泛應用于YOLOv4與YOLOX的Neck部分。

在原始CSP-PAN中,每個輸出特征的通道數與源自骨干的輸入通道數保持相同。大通道數的結構在移動端存在昂貴的計算消耗。我們通過 卷積將輸出特征的通道數調整到最小通道數 以解決上述問題。

Top-down與bottom-up兩路特征融合通過CSP結構執行。此外,我們還在CSP-PAN的基礎上添加了一個特征尺度以檢測更多目標(見上圖P6分支)。與此同時,除了卷積外,其他卷積均為深度卷積。這種結構設計可以帶來可觀的性能提升,同時參數量更少。

在檢測頭部分,我們采用深度分離卷基于卷積提升感受野。深度分離卷積的數量可以設置為2、4或者更多。Neck與Head均具有四個尺度分支,我們保持兩者的通道數一致。YOLOX采用更少通道數的“解耦頭”提升性能;而PP-PicoDet的“耦合頭”具有更好的性能,且無需減少通道數 。該方案的Head與YOLOX的Head具有幾乎相同的參數量和推理速度。

Label Assignment Strategy and Loss

正負樣本的標簽分類對于目標檢測器有著非常重要的影響。RetinaNet通過IoU進行正負樣本劃分;FCOS則將中心點位于GT的anchor視作正樣本;YOLOv4與YOLOv5則選擇中心點與近鄰anchor作為正樣本;ATSS則通過統計信息進行正負樣本劃分;SimOTA則是一種隨訓練過程而動態變換的標簽分配策略,具有更好的性能。因此,我們選擇SimOTA作為標簽分配方案。

在SimOTA的基礎上,我們對其cost矩陣進行優化,采用VarifocalLoss與GIoULoss的加權組合計算。定義如下:

對于分類頭,我們采用VarifocalLoss耦合分類預測與質量預測;對于回歸頭,我們采用GIoU與DistributionFocalLoss。整體損失定義如下:

Other Strategies

近年來,越來越多的激活函數取得了比ReLU更優的性能。其中,H-Swish是一種移動端友好的算子,故我們將檢測器中的ReLU替換為H-Swish,性能大幅提升同時推理速度不變

相比線性學習率機制,cosine 學習率機制更為平滑且有益于訓練穩定性。

過多的數據增強可以提升增強效應,但會影響輕量型模型的訓練難度。因此,我們僅使用RandomFlip, RandomCrop, Multi-scale Resize等數據增廣。

Experiments

上表給出了所提方案與其他輕量型檢測器的性能對比,從中可以看到:無論是精度還是速度,所提方案均大幅超越了所有YOLO模型 。性能的提升主要源于以下幾點改進:

  • Neck部分比其他YOLO模型更輕量,故骨干與Head可以賦予更多計算量;

  • VarifocalLoss的組合可以處理類別不平衡、動態學習樣本分類與FOCS的回歸方案在輕量模型中表現更佳;

在相同參數量下,PP-PicoDet-S超越了YOLOX-Nano與NanoDet;PP-PicoDet-L的精度與速度均超越了YOLOv5s。此外,由于更高效的卷積優化,PaddleLite的推理速度要比NCNN更快。總而言之,PP-PicoDet在極大程度上領先其他SOTA模型。

Ablation Study

上表給出了PP-PicoDet從基線模型逐步優化而來的性能對比。基線模型類似NanoDet,骨干為ShuffleNetV2-1x,Neck采用了無卷積PAN,損失采用了GFL,標簽分配采用ATSS,激活函數為LeakyReLU。從中可以看到:

  • 采用本文所提CSP-PAN可以帶來3.8%mAP指標提升,而參數量提升少于50K;

  • 相比QFL,VFL可以帶來0.1%mAP指標提升;

  • ATSS與SimOTA具有相同的性能,而改進版SimOTA可以將性能提升到30.0%mAP;

  • 相比LeakyReLU,H-Swish可以帶來0.9%mAP指標提升。

上表對比了ShuffleNetV2-1.5x與ESNet-1x的性能,可以看到:ESNet具有更高的性能、更快的推理速度、更少的計算量。

上表對比了人工設計模型與NAS搜索模型的性能,可以看到:搜索到的模型的指標僅下降0.2%mAP,而推理延遲減少41.5% 。因此,我們將基線模型的骨干替換為ESNet-0.75x,參數量減少約200K,而性能僅下降0.3%mAP。

如果覺得有用,就請分享到朋友圈吧!

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件

本站qq群554839127,加入微信群請掃碼:

總結

以上是生活随笔為你收集整理的【深度学习】百度:YOLOX和NanoDet都没我优秀!轻量型实时目标检测模型PP-PicoDet开源...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美色图俺去了 | v片在线免费观看 | 青青草一区 | 亚洲一区二区国产 | 精彩视频一区二区 | 潘金莲一级淫片aaaaa | av日日夜夜| 91视频com | 宅男在线视频 | 亚洲一区二区三区电影在线观看 | 国产精品久久国产精品 | 久久亚洲中文字幕无码 | 日韩插插插 | 国产精品自拍小视频 | 美女免费看片 | 在线观看一二区 | 亚洲一区二区三区网站 | 日韩欧美精品在线播放 | 欧美精品xxxxx | 在线一级视频 | 在线免费观看的av | 国产骚b | 在线观看黄色网页 | 黄网在线| 亚洲黄色片免费看 | 91香焦视频 | 亚洲国产精品99 | 国产精品久久久久久免费 | 91看片成人 | 一区二区免费 | 亚洲国产精品视频 | 天天曰夜夜操 | 久久九九视频 | 成年男女免费视频 | 亚洲a免费| 久久艹免费视频 | 国产精美视频 | 嫩操影院 | 狠狠爱夜夜爱 | 亚洲毛茸茸 | 久久久国产一区二区三区 | 亚洲好骚综合 | 欧美视频免费在线观看 | 日韩有码中文字幕在线 | 91av欧美 | 99久久精品国产色欲 | 日日艹 | 艳情五月 | 亚洲二区在线观看 | 欧美精品 在线观看 | 亚洲天堂网站在线 | 法国空姐电影在线观看 | 亚洲啪啪av | 久久久久国产精品视频 | 97精品人人a片免费看 | 韩国成年人网站 | 97精品国产97久久久久久粉红 | 少妇人妻一区 | 日韩欧美一级在线 | 九一国产在线观看 | 黄频网站在线观看 | 亚洲欧美日韩成人在线 | 日产国产亚洲精品系列 | 日本韩国欧美一区二区三区 | 青青草手机在线 | 日韩av网页 | 欧亚一级片 | 潘金莲一级淫片a.aaaaa播放 | 欧美久久久久久久久久 | 国产一级在线免费观看 | 久久午夜夜伦鲁鲁片无码免费 | 国产精品第三页 | 日韩在线电影一区二区 | 亚洲AV成人无码精品久久盆瓶 | 国产激情视频网站 | 日本黄色大片视频 | 亚欧毛片| 91久久精品国产91久久 | 97香蕉碰碰人妻国产欧美 | 日本少妇电影 | 国产成人啪精品午夜在线观看 | 国产精品久久久久久久妇 | 99久久婷婷| 亚洲小说区图片区都市 | 国产无精乱码一区二区三区 | 国产日日操 | 国产精品美女久久久久图片 | 亚洲欧美韩国 | 国产做爰高潮呻吟视频 | 尹人成人 | 黄色在线视频网址 | 成人h动漫精品一区二区无码 | 蜜乳av一区 | 欧美性猛交乱大交xxxx | 色男人av | 亚洲午夜色 | 日本午夜影院 | 免费精品视频在线 | 日韩成人动漫在线观看 |