红外弱小目标检测之“Asymmetric Contextual Modulation for Infrared Small Target Detection“阅读笔记
Asymmetric Contextual Modulation for Infrared Small Target Detection
本文開源代碼及單幀紅外小目標檢測數(shù)據(jù)集:
code:https://github.com/YimianDai/open-acm
sirst:https://github.com/YimianDai/sirst
427張短波、中波,950nm紅外圖像,5種標注方式 (a)類別標簽 (b) 實例分割 ? 邊界框 (d) 語義分割 (e) 實例定位
模型驅(qū)動方法存在的缺點:
本文動機:
- 缺乏公共數(shù)據(jù)集
- 缺少目標內(nèi)在信息(SPIE將紅外小目標定義為在256×256圖像里具有小于 80 像素(9×9)的總空間范圍)
- 深度網(wǎng)絡(luò)即需要學習語義表示也需要兼顧細節(jié)特征
- 重新定制下采樣方案。(隨著網(wǎng)絡(luò)的加深,紅外小目標的特征幾乎無法保留。)
- 重新定制注意力模塊。(現(xiàn)有的注意力模塊傾向于聚合全局或遠程上下文,潛在的假設(shè)是對象相對較大并且更全局地分布,全局注意力模塊會削弱紅外小目標的特征。)
- 重新定制特征融合方法。(小目標可能被深層背景,單向、自上而下的方式融合跨層特征可能不起作用。)
評價指標:
-
nIoU(the normalized Intersection over Union)
nIoU=1N∑iNTP[i]T[i]+P[i]?TP[i]\mathrm{nIoU}=\frac{1}{N}\sum_{i}^{N}\frac{\mathrm{TP}[i]}{\mathrm{T}[i]+\mathrm{P}[i]-\mathrm{TP}[i]} nIoU=N1?i∑N?T[i]+P[i]?TP[i]TP[i]?
其中,N 是總樣本數(shù)。 -
ROC(the receiver operating characteristic)
ACM模型(Asymmetric Contextual Modulation)
其中X是低級(low-level)特征,Y是高級(high-level)特征,C為通道數(shù),H×W表示特征圖大小。
-
Top-Down Modulation
-
高層特征提供了更準確的目標語義信息;
-
全局信道上下文是一個稱職的調(diào)制信號。
-
Bottom-Up Modulation
- 用低級特征的空間細節(jié)豐富高級特征。
-
Asymmetric Contextual Modulation Module
同時利用自上而下(Top-Down)的全局注意力調(diào)制和自下而上(Bottom-Up)的局部注意力調(diào)制來交換多尺度上下文,以便對語義信息和空間細節(jié)進行更豐富的編碼。
Z=G(Y)?X+L(X)?Y\mathbf{\ Z}=\mathbf{G(Y)}\otimes\mathbf{X} + \mathbf{L(X)}\otimes\mathbf{Y} ?Z=G(Y)?X+L(X)?Y
示例:FPN 和 UNet
紅外小目標檢測問題看成是語義分割問題,將ACM模型運用到FPN及U-Net網(wǎng)絡(luò)中
主干網(wǎng)絡(luò)采用ResNet-20,如下所示,b = 3。為了保留小目標,下采樣僅在 Stage-2 和 Stage-3 的第一個卷積層執(zhí)行。
實驗結(jié)果:
-
Ablation Study
- 下采樣方案(Regular-ACM特征圖被下采樣4倍, ACM-本文下采樣方案)。
- 雙向注意力調(diào)制的影響(TopDownLocal、BiLocal)
- 非對稱注意力調(diào)制的影響(BiLocal、BiGlobal、ACM)
-
與最先進方法的比較
IoU 和 nIoU 反映的是固定閾值下的分割效果;ROC 反映的是滑動閾值下的整體效果。
總結(jié)
以上是生活随笔為你收集整理的红外弱小目标检测之“Asymmetric Contextual Modulation for Infrared Small Target Detection“阅读笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java基础--awt详解以及简单应用
- 下一篇: 从R-CNN到Faster-RCNN再到