日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

层与特征融合_【计算机系统应用】(第122期)感受野特征增强的 SSD 目标检测算法...

發布時間:2023/12/4 windows 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 层与特征融合_【计算机系统应用】(第122期)感受野特征增强的 SSD 目标检测算法... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
點擊上方“藍字”,關注我們吧!

目標檢測是計算機視覺領域的一項重要任務,?是 生活中如實例分割[1] ,?面部分析[2] ,?汽車自動駕駛[3]、視 頻分析[4] 等各種視覺應用的先決條件.?

近些年,?伴隨著深度卷積神經網絡的充分發展[5] 以及良好的數據集注釋先驗工作的積累[6] ,?物體檢測器 的性能得到了顯著提高.?但是,?物體檢測過程中的尺度變化仍然是所有檢測器的關鍵挑戰,?為了識別不同尺 度的物體,?早期大多數的檢測器都是基于手工制作的 特征[7] ,?并且利用圖像金字塔.?考慮到內存和檢測時間, 這些工作無論在計算還是花費上都是昂貴的.?得益于 卷積神經網絡的發展,?手工設計的特征已逐漸被卷積 神經網絡計算的特征所取代.?最近的檢測系統[8,9] 利用 卷積神經網絡 (ConvNets) 在單個輸入尺度圖像依次進 行運算,?獲得不同尺度的特征圖,?然后用最頂層特征圖 來預測具有不同尺度和縱橫比的候選邊界框.?然而,?最 頂部的特征圖具有固定的感受野,?與自然圖像中的不 同尺度的物體沖突.?特別是小物體在最頂層上幾乎沒 有信息,?因此可能會損害物體檢測性能,?尤其是小物體.

信息,?因此可能會損害物體檢測性能,?尤其是小物體. 在解決多尺度問題方面,?SSD 利用從下到上的特 征金字塔來適應各種尺寸的物體,?然而,?SSD 算法的特 征金字塔形式未能利用深層特征圖中強大的語義信息, 這對于小物體檢測至關重要.?因為語義信息對于檢測 視覺上困難的物體 (例如小的,?遮擋的物體) 是決定性 的,?為了克服 SSD 的缺點并使網絡對對象尺度更加穩 健,?最近的工作 (例如 FPN[9] ,?DSSD[10] ,?RON[11] ) 建議將 低分辨率帶有強語義信息的特征圖同具有高分辨率但 帶有弱語義弱信息的特征圖通過自上而下的通道橫向 連接.?

與 SSD 中的自下而上的方式相比,?橫向連接將 語義信息一個接一個地傳遞到淺層,?從而增強了淺層 特征的檢測能力.?與傳統檢測器相比,?這些網絡在精度 方面有著顯著的提高.?但是我們注意到這些在最頂層 特征圖中使用反卷積層的方法完全丟失了小物體的精 細細節. 本文致力于提高小物體的檢測性能,?緩解 SSD 算法的尺度變化問題,?同時又不失實時檢測速度.?通常, 較深層中的深層特征對于分類子任務更具辨別性,?而 較淺層中的淺層特征則對于物體位置回歸子任務更有 利.?

此外,?淺層特征更適合于具有簡單外觀的特征對象, 而深層特征適用于具有復雜外觀的對象.?基于此,?本文 通過特征融合模塊將具有語義信息的深層特征添加到 淺層特征中,?以獲得具有豐富信息的特征圖,?將來自不 同層次的不同尺度的特征圖投影并連接在一起,?然后 用 BN[12] 層進行歸一化處理,?最后附加下采樣層以生 成新的特征金字塔,?此外,?添加了感受野模塊 (RFM), 以加強從輕量級 CNN 模型中學到的深層特征,?使它們 有助于檢測器快速準確.?與傳統 SSD 相比,?本文算法 RF_SSD 主要選擇 VGG16 作為骨干網絡,?而不是更深 層次的 ConvNets?(例如 ResNet[13] 或 DenseNet[14] ),?原 因是深層卷積神經網絡 (ConvNets) 雖然對特征提取有 利但會加大計算量同時降低檢測速度,?實驗表明本文 所提出的結構在精度上比 SSD 算法有所提升.?

本文的 貢獻主要表現為以下幾點:

(1)?提出了新穎的、輕量級的特征融合方式,?主要 是將不同層的特征圖合并,?并生成特征金字塔,?降低了 重復檢測一個對象的多個部分或者多個對象合并到一 個對象的檢測概率,?同時小物體檢測表現更好.

(2)?借鑒混合空洞卷積和 Inception 結構,?設計并添 加感受野模塊來增強網絡的特征提取能力,?同時在不 增加卷積參數的前提下增大卷積感受野,?加強輕量級 卷積神經網絡學到的深層特征,?保證檢測器的實時性.?

(3)?在 PASCAL?VOC 數據集上進行了定性與定量 的實驗,?結果表明,?同傳統 SSD 算法相比,?本文所提出 的算法在目標檢測性能上有顯著的提升,?同時以相對 低的速度損耗提高了小物體的準確率.?

1???相關工作

在目標檢測算法研究中,?無論是在單階段檢測器 還是兩階段檢測器中,?相關研究者都投入了大量的工 作來改善目標檢測中的尺度變化問題,?大致可分為兩 種策略.?一種是圖像金字塔,?通過圖像的尺度變化來產 生具有語義代表性的多尺度特征,?然后用來自不同尺 度的圖像的特征分別產生預測,?最后將這些預測放在 一起進行評估以給出最終預測.?在識別精度和定位精 度方面,?來自多尺寸圖像的特征確實超越僅基于單尺 度圖像的特征.?諸如 OHEM[15] 和 SNIP[16] 之類的方法 都采用了這種策略.?雖然性能得到了提升,?但這種策略 在時間和內存方面花銷很大,?所以在實時任務中很難 得到應用.?另一種是利用網絡內的特征金字塔以較低 的計算成本來模擬圖像金字塔.?該策略比第一個策略 需要的內存和計算成本要少得多,?從而可以在實時網 絡的訓練和測試階段中進行使用.?此外,?特征金字塔構 建模塊可以很容易地修改,?并應用在最先進的基于深 度神經網絡的探測器.?MS-CNN[17] ,?SSD[8] ,?DSSD[10] , FPN[9] ,?YOLOv3[18] ,?RetinaNet[19] 和 RefineDet[20] 以不 同的方式采用了這種策略.?

此外,?MS-CNN[17] 提出了兩個子網絡,?并首先將多 尺度特征結合到用于物體檢測的深度卷積神經網絡中. 提議子網利用幾種分辨率的特征圖來檢測圖像中的多尺度物體.?SSD 利用 VGG16 網絡的后幾層的特征圖和 額外特征層進行多尺度預測.?FPN 將高層特征與低層 特征相結合,?由最近鄰居上采樣和橫向連接實現.?DSSD 實現了反卷積層,?用于聚合上下文和增強淺層特征的 高級語義信息,?RefineDet[20] 采用了兩步級聯回歸,?在 保持 SSD 效率的同時,?在準確性方面取得了顯著提高.

2???RF_SSD 算法?

本節將在 SSD 框架基礎上,?分析算法涉及到的特 征融合處理、感受野模塊的設計以及算法的具體處理 過程.

S SD 采用不同尺度的特征圖來檢測物體, ?以 VGG16[21] 作為骨干網絡,?采用級聯卷積的方式生成不 同尺度的特征圖,?結合 YOLO 的回歸思想和 FasterRCNN 的 Anchor 機制,?使用全圖各個位置的多尺度區 域特征進行回歸,?既保證檢測速度又保持了精度.?同時 在對特征圖預測時,?采用卷積核來預測一系列 Default Bounding?Boxes 的類別和坐標偏移.?

由于小物體不會在淺層中丟失太多的位置信息, 并且大物體也可以在較深層中很好地定位和識別,?所 以 SSD 算法使用淺層特征圖檢測小物體,?深層特征圖 檢測大物體這種策略是合理的,?但問題是由淺層產生 的小物體的特征缺乏足夠的信息,?這將導致小物體檢 測性能的不良.?此外,?小物體也嚴重依賴于上下文信息, SSD 網絡結構如圖 1 所示.

2.1 特征融合?(Feature Fusion)?

針對傳統 SSD 算法缺點,?FPN 和 DSSD 利用頂層 特征的反卷積層,?經過驗證,?這種方法可以大大提高傳 統探測器的性能,?但卻需要多個功能合并過程.?而且右 側的新特征只能融合相應的左側和更高層級的特征[9,10] .?

此外,?潛在特征和大量特征的 element-wise?process 過程也會消耗大量時間.?基于此,?本文提出了一種輕量 級和高效的特征融合模塊來處理這項任務.?本文的動 機是以適當的方式一次融合不同級別的特征,?并從融 合特征生成特征金字塔. 傳統的 SSD300 是基于 VGG16 的,?作者選擇 Conv4_3, FC7 和新添加的 Conv8_2,?Conv9_2,?Conv10_2,?Conv11_2 層特征圖進行檢測.?相應的特征圖的大小為 38×38, 19×19,10×10,5×5,3×3 和 1×1.?本文認為大小小于 10×10 的特征圖太小而幾乎沒有要合并的信息,?所以本文先 將 Conv8_2 的 stride 設為 1,?這樣 Conv9_2 的大小為 10×10,?然后本文選擇 Conv4_3,?Conv9_2 融合為新的 特征圖,?增強了淺層特征的語義信息,?同時也有很強的 幾何細節信息表征能力. 在傳統的處理方法中,?主要有兩種方法合并不同 的特征圖:?concatenation 及 element-wise?summation. Element-wise?summation 要求特征圖的通道相同,?這意 味著我們必須將特征圖轉換為相同的通道.?

由于此 要求限制了融合特征圖的靈活性,?所以我們選擇用 concatenation 方式.?為了使 Conv4_3,?Conv9_2 融合為 新的特征圖,?需對 Conv9_2 進行上采樣處理.?如圖 2 所 示,?首先使用大小為 2×2,?通道數為 256 的反卷積核進 行上采樣,?將輸出通過 3×3 的卷積核映射至 BN 層,?然 后再到下一個反卷積核.?Con4_3 通過 1×1 的卷積核直 接映射輸出至 BN 層.?最終將 Conv4_3 通過 1×1 卷積 層的輸出與 Con9_2 經過兩層反卷積層的輸出進行 concat 操作,?之后傳入至 ReLU 層,?再通過 L2?Normalization 層做歸一化處理,?同時增加模型的魯棒性.

2.2 感受野模塊?

本模塊采用多支路卷積形式,?其內部結構可以分 為兩個部分:?多支路卷積層和空洞卷積層.?多支路卷積 層的結構和 Inception 相同,?模擬不同尺寸的感受野,?空 洞卷積層利用空洞卷積模擬不同尺寸感受野之間的關系[22] .?在卷積神經網絡中,?卷積核的感受野大小和卷積 核的尺寸成正相關,?通過改變卷積核的尺寸可以獲得 不同大小的感受野,?進而更加有效的利用特征信息.?本 文的設計借鑒了 Inception-V4 和 Inception?-ResNet[23] , 結構如圖 3 所示,?首先在每個分支結構中使用 1×1 的 卷積層,?減少特征圖中通道數量,?用 2 個連續的 3×3 Conv 替代 Inception 模塊中的 5×5?Conv,?從而實現網 絡深度的增加,?之后將原有 3×3 的卷積核分解成兩個 一維的卷積核 (1×3 和 3×1),?目的是加速計算,?同時網 絡寬度增加,?增加了網絡的非線性.?除此之外,?為了保 留更多的原始特征信息,?增加了一條剪接支路.

本算法感受野模塊結構上借鑒了混合空洞卷積和 Inception,?混合空洞卷積 (hybrid?dilated?convolution) 由文獻 [24] 提出,?通過疊加多個不同空洞率的空洞卷 積來避免網格效應和平衡不同尺寸感受野之間的關系, 解決了傳統卷積神經網絡采用池化層所造成的內部數 據結構遺失和小物體信息無法重建等問題,?同時協調 多支路卷積,?在很好的結合多支路卷積的同時提高了 算法的檢測效率.

2.3 算法結構?

本文算法是以 SSD 算法框架為基礎構建的,?提出 新的特征融合模塊來充分利用深層的特征信息以此提 高算法的檢測精度,?同時改善小物體檢測的效果,?另外, 通過在特征提取網絡上添加感受野模塊來提高特征的 提取能力.?無論特征融合模塊還是感受野模塊都比較 簡單,?所以在極大程度上保留了 SSD 原有的網絡結構, 保證了檢測速度.?

整體的算法結構如圖 4 所示,?骨干網 絡采用 VGGNet,?先對 Con9_2 層特征圖進行尺寸調整, 后將調整尺寸后的 Con9_2 層特征圖與 Con4_3 層特 征圖傳入 Feature?Fusion 模塊產生新特征圖,?經 BN 層 后,?通過一系列下采樣形成特征金字塔,?同時加入感受 野模塊.?具體描述如下:?

第一是將 Conv8_2 的 stride 設 為 1,?這樣 Conv9_2 的大小為 10×10,?然后使用兩層反 卷積核對 Conv9_2 進行上采樣處理.?之后將輸出和經 過 BN 層的 Conv4_3 進行 concat 操作,?之后傳入至 ReLU 層,?再通過 L2Normalization 層做歸一化處理.?

第二,?對 新得到的特征圖進行下采樣 (包含一些 1×1 和 stride 為 2 的 3×3 的卷積層來改變通道數和特征圖的大小), 形成新的特征金字塔,?同時利用新添加的感受野模塊 對新的特征信息進行檢測.?第三,?用 RFM 替換掉中間 兩層卷積層,?考慮到最后兩個卷積層的尺寸,?將最后兩 層保持不變.

3???實驗分析

3.1 數據增強?

在進行訓練之前,?可先通過數據增強的方式對數 據進行預處理,?以此提高數據集的多樣性,?使模型有更 高的魯棒性.?常用的數據增強方式如隨機翻轉、縮 放、顏色變化和裁剪等.?通過將數據增強方式應用到 訓練當中,?可使模型學到旋轉不變性和對稱不變性.?

3.2 網絡訓練策略?

本文算法采用與 SSD 算法相似的訓練策略,?都是 使用訓練好 VGGNet 網絡,?本文使用 PASCAL?VOC 2007 和 PASCAL?VOC?2012 數據集,?同時把與真實框 (ground?truth) 的交并比 (IOU) 大于 0.5 的預測框認為 是正樣本.?采用平均精度 (mAP) 作為評測算法性能的 度量,?幀速 (Frame?Per?Second,?FPS) 作為目標檢測速度 的評價指標.?訓練階段將輸入圖像的大小設為 300×300 像素.?

訓練時,?我們用 VOC?2007?trainvaland?VOC2012 trainval?(VOC07+12) 的聯合數據集訓練,?在 VOC?2007 test 測試集上測試.?本文的硬件環境為深度學習框架 Caffe,?ubuntu16.04 系統,?GPU 顯卡型號為 NVIDIA 1080Ti,?Batch?size=16,?初始學習率設定為 0.001, max_epoch 設置為 180?K,?然后在步驟 100?K,?140?K 和 180?K 除以 10.?將權重衰減設置為 0.0005.?和 SSD 算法 一樣采用動量為 0.9 的 SGD 來優化本文算法.

3.3 PASCAL VOC2007 測試結果分析?

PASCAl?VOC 是一個用于物體分類識別和檢測的 標準數據集,?該數據集包括 20 個類別,?表 1 為 PASCAl VOC 具體類別.

不同目標檢測算法在精度和速度上的分布如圖 5 所示,?Faster-RCNN,?R-FCN,?YOLOv2,?DSOD,?RSSD, DSSD 算法是在 Titan?X?GPU 上進行測試的,?而 SSD 和本文提出的算法是在 1080?Ti?GPU 上測試的.?從圖 5 中也可看出本文的算法在檢測速度和精度上有著一定 的優勢.

本文將傳統的 SSD 算法和 RF_SSD 算法在每一 類目標檢測的精度上進行比較,?結果如表 3 所示.?從表 中可知,?飛機,?自行車,?鳥,?船,?瓶子,?公交車等類別都有 顯著的提升,?其中,?瓶子,?盆栽的檢測精度較低,?雖然得 益于本文提出的網絡結構,?相比于傳統的 SSD 算法, 精確度有所提升,?但因物體相比于其他類別太小,?特征 提取較少,?導致相應檢測精度不高.?

但總體來說,?本文 算法相比于 SSD 算法 mAP 提高了 2.7%,?基本滿足實 際需求,?同時也論證了本文算法思想的可行性. 同時本文對比了感受野模塊對算法檢測結果的影 響 (參見表 4),?通過實驗可知添加感受野模塊可提高算 法的準確率,?說明感受野對算法性能有一定的提升,?同 時由于感受野模塊采用多個支路卷積,?提高了模型的 復雜度,?所以導致檢測速度降低.

最后本文分析了不同卷積層融合后的結果,?結果 如表 5,?若融合 Conv3_3,?Conv4_3,?和 Conv9_2,?則在 VOC2007 的 mAP 為 79.8%,?若去掉 Conv3_3,?則 mAP 為 80.2%,?表明 Conv3_3 對檢測器的結果并沒有 太大的影響,?原因在于 Conv3_3 卷積層提取的特征圖 包含較多的背景噪聲.?此外,?本文從 COCO 數據集中隨 機挑選了幾張照片,?測試結果如圖 6 所示.

4???結論?

本文基于 SSD 算法,?提出了一種新穎高效的目標 檢測算法,?通過將不同層的特征圖以輕量級的方式融 合在一起,?使新的特征圖既有深層特征的語義信息,?同 時又有高分辨率,?然后采用下采樣層生成特征金字塔, 之后設計添加感受野模塊,?提高網絡的特征提取能力, 提高了算法的整體精度,?也改善了小目標的檢測效果. 本文的算法在精度上超越了傳統 SSD 算法以及一系 列其他目標檢測算法,?由于添加感受野模塊,?增加了網 絡特征的提取能力,?增加了精度,?但加深了深度和模型 復雜度,?導致檢測速度降低,?雖以速度換取精度,?但基 本滿足實時檢測要求.?和大多數單階段目標檢測結構 一樣,?本算法類別不平衡問題依舊未能得到解決.?未來, 將繼續改進該算法,?使用 anchor-free 模型方法或進一 步修改目標損失函數改善類別不平衡問題,?設計輕量 型的特征提取和融合網絡結構,?在不降低精度的同時 提高速度.

本文轉載《計算機系統應用》期刊 2020年第29卷第9期

關注我們公眾號,還可以獲得PS AI等工具包哦~

總結

以上是生活随笔為你收集整理的层与特征融合_【计算机系统应用】(第122期)感受野特征增强的 SSD 目标检测算法...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。