日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【论文跟进】PP-YOLOE结构解析

發布時間:2024/1/1 编程问答 56 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【论文跟进】PP-YOLOE结构解析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文地址:https://arxiv.org/abs/2203.16250
Github地址:https://github.com/PaddlePaddle/PaddleDetection

??上周剛剛學習繪制了YOLOX結構,這周發現PP-YOLOE新鮮出爐,特此記錄。

1.文章摘要

??本報告中,我們介紹了PP-YOLOE,這是一種具有高性能和友好部署的工業級先進目標檢測器。我們在之前的PP-YOLOv2的基礎上進行了優化,使用anchor-free范式,更強大的backbone和neck,配備了CSPRepResStage、ET-head和動態標簽分配算法TAL。我們為不同的實踐場景提供了s/m/l/x模型。在COCO testdev上,PP-YOLOE-l的mAP為51.4,使用Tesla V100具有78.1 FPS,與之前最先進的工業模型PP-YOLOv2和YOLOX相比,分別獲得了(+1.9 AP,+13.35%提速)和(+1.3 AP,+24.96%提速)的顯著提高。此外,在TensorRT和FP16-precision的支持下,PP-YOLOE推理速度達到了149.2 FPS。我們還進行了大量的實驗來驗證我們設計的有效性。

2.為什么會有PP-YOLOE

??百度在2021年4月提出了PP-YOLOv2(原文鏈接:https://arxiv.org/abs/2104.10419 ),性能超越同等參數的YOLOv4-CSP和YOLOv5-l,而隨后7月份曠視科技的YOLOX一領風騷,這還能忍,必須走在YOLO系列的前端。受到YOLOX的啟發,百度團隊優化了PP-YOLOv2,順手提出了PP-YOLOE。

??PP-YOLOv2的總體情況包括:
??(1)backbone:具有可變形卷積的ResNet50-vd;
??(2)neck:具有SPP層的PAN,DropBlock;
??(3)head:輕量級的IoU感知;
??(4)激活函數:在backbone中使用ReLU激活,neck中使用Mish激活;
??(5)標簽分配:為每個ground truth目標分配一個anchor box;
??(6)損失:分類損失、回歸損失、目標損失,IoU損失和IoU感知損失;

??COCO性能對比:
????PP-YOLOv2:49.1 mAP,68.9 FPS(Tesla V100)
????YOLOX:50.1 mAP,68.9 FPS(Tesla V100)
????PP-YOLOE-l:51.4mAP,78.1 FPS(Tesla V100)

3.PP-YOLOE的改進


(1)Anchor-free
??Anchor-free方式最先在YOLOv1中出現,由于直接預測位置不準確,在后面的 YOLOv2、v3、v4和v5中均采用了Anchor方式。YOLOX中認為按聚類方式確定最優Anchor尺寸局限于特定領域,難以推廣,此外還增加了head的復雜度與每張圖像的預測數量,故采用了Anchor-free方式。
??同樣,PP-YOLOE中亦采用Anchor-free方式。作者實驗說采用Anchor-free方式加快了模型速度,但是精度相比于基線PP-YOLOv2降低了0.3mAP。

(2)RepResBlock
??啟發于TreeBlock(原文鏈接:https://arxiv.org/abs/2109.12342 ),提出了一種新穎的RepResBlock,將殘差連接和密集連接結合起來,用于backbone和neck中。RepResBlock可提升精度0.7mAP。
??原TreeBlock如下,唔…有點復雜,不過RepResBlock對其進行了簡化。


(3)Task Alignment Learning (TAL)
??標簽分配策略是目標檢測中的一個重要過程,YOLOX采用SimOTA分配策略。TAL由動態標簽分配與任務對齊損失組成。動態標簽分配意味著預測感知,根據預測,為每個ground truth目標分配動態的正樣本。通過顯式對齊兩個任務,TAL可以同時獲得最高的分類準確率和最精確的邊界框。TAL可提升精度0.9mAP。

(4)Efficient Task-aligned Head (ET-head)
??為了解決分類任務與定位任務沖突的問題,YOLOX中采用了Decoupled head結構。但作者認為Decoupled head結構會使分類和定位任務分離獨立,缺乏任務特異性學習,故提出了ET-head,ET-head可提升精度0.5mAP。

??對于分類和定位任務的學習,作者分別選擇了變焦損失(VFL)和分布焦損失(DFL)。VFL使用target score對陽性樣本的損失進行加權,使得具有高IoU的陽性樣本對損失的貢獻相對更大,也使得模型在訓練時更加關注高質量的樣本而不是低質量的樣本。DFL是為了解決邊界框表示不靈活的問題,提出了利用常規分布預測邊界框的方法。
??模型損失函數為:

總結

以上是生活随笔為你收集整理的【论文跟进】PP-YOLOE结构解析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。