當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【论文跟进】PP-YOLOE结构解析

發布時間：2024/1/1 编程问答 56 豆豆

生活随笔收集整理的這篇文章主要介紹了【论文跟进】PP-YOLOE结构解析小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

原文地址：https://arxiv.org/abs/2203.16250
Github地址：https://github.com/PaddlePaddle/PaddleDetection

??上周剛剛學習繪制了YOLOX結構，這周發現PP-YOLOE新鮮出爐，特此記錄。

1.文章摘要

??本報告中，我們介紹了PP-YOLOE，這是一種具有高性能和友好部署的工業級先進目標檢測器。我們在之前的PP-YOLOv2的基礎上進行了優化，使用anchor-free范式，更強大的backbone和neck，配備了CSPRepResStage、ET-head和動態標簽分配算法TAL。我們為不同的實踐場景提供了s/m/l/x模型。在COCO testdev上，PP-YOLOE-l的mAP為51.4，使用Tesla V100具有78.1 FPS，與之前最先進的工業模型PP-YOLOv2和YOLOX相比，分別獲得了(+1.9 AP，+13.35%提速)和(+1.3 AP，+24.96%提速)的顯著提高。此外，在TensorRT和FP16-precision的支持下，PP-YOLOE推理速度達到了149.2 FPS。我們還進行了大量的實驗來驗證我們設計的有效性。

2.為什么會有PP-YOLOE

??百度在2021年4月提出了PP-YOLOv2(原文鏈接：https://arxiv.org/abs/2104.10419 )，性能超越同等參數的YOLOv4-CSP和YOLOv5-l，而隨后7月份曠視科技的YOLOX一領風騷，這還能忍，必須走在YOLO系列的前端。受到YOLOX的啟發，百度團隊優化了PP-YOLOv2，順手提出了PP-YOLOE。

??PP-YOLOv2的總體情況包括：
??（1）backbone：具有可變形卷積的ResNet50-vd；
??（2）neck：具有SPP層的PAN，DropBlock；
??（3）head：輕量級的IoU感知；
??（4）激活函數：在backbone中使用ReLU激活，neck中使用Mish激活；
??（5）標簽分配：為每個ground truth目標分配一個anchor box；
??（6）損失：分類損失、回歸損失、目標損失，IoU損失和IoU感知損失；

??COCO性能對比：
????PP-YOLOv2：49.1 mAP，68.9 FPS(Tesla V100)
????YOLOX：50.1 mAP，68.9 FPS(Tesla V100)
????PP-YOLOE-l：51.4mAP，78.1 FPS(Tesla V100)

3.PP-YOLOE的改進

（1）Anchor-free
??Anchor-free方式最先在YOLOv1中出現，由于直接預測位置不準確，在后面的 YOLOv2、v3、v4和v5中均采用了Anchor方式。YOLOX中認為按聚類方式確定最優Anchor尺寸局限于特定領域，難以推廣，此外還增加了head的復雜度與每張圖像的預測數量，故采用了Anchor-free方式。
??同樣，PP-YOLOE中亦采用Anchor-free方式。作者實驗說采用Anchor-free方式加快了模型速度，但是精度相比于基線PP-YOLOv2降低了0.3mAP。

（2）RepResBlock
??啟發于TreeBlock(原文鏈接：https://arxiv.org/abs/2109.12342 )，提出了一種新穎的RepResBlock，將殘差連接和密集連接結合起來，用于backbone和neck中。RepResBlock可提升精度0.7mAP。
??原TreeBlock如下，唔…有點復雜，不過RepResBlock對其進行了簡化。

（3）Task Alignment Learning (TAL)
??標簽分配策略是目標檢測中的一個重要過程，YOLOX采用SimOTA分配策略。TAL由動態標簽分配與任務對齊損失組成。動態標簽分配意味著預測感知，根據預測，為每個ground truth目標分配動態的正樣本。通過顯式對齊兩個任務，TAL可以同時獲得最高的分類準確率和最精確的邊界框。TAL可提升精度0.9mAP。

（4）Efficient Task-aligned Head (ET-head)
??為了解決分類任務與定位任務沖突的問題，YOLOX中采用了Decoupled head結構。但作者認為Decoupled head結構會使分類和定位任務分離獨立，缺乏任務特異性學習，故提出了ET-head，ET-head可提升精度0.5mAP。

??對于分類和定位任務的學習，作者分別選擇了變焦損失(VFL)和分布焦損失(DFL)。VFL使用target score對陽性樣本的損失進行加權，使得具有高IoU的陽性樣本對損失的貢獻相對更大，也使得模型在訓練時更加關注高質量的樣本而不是低質量的樣本。DFL是為了解決邊界框表示不靈活的問題，提出了利用常規分布預測邊界框的方法。
??模型損失函數為：

總結

以上是生活随笔為你收集整理的【论文跟进】PP-YOLOE结构解析的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 2021年G2电站锅炉司炉最新解析及G2
下一篇： Unity游戏运行后出现花屏解决方案