ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记
? 理解出錯(cuò)之處望不吝指正。
? 本文模型叫做UCT。就像論文題目一樣,作者提出了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的end2end的tracking模型。模型的整體結(jié)構(gòu)如下圖所示(圖中實(shí)線代表online tracking過(guò)程,虛線框內(nèi)和虛線表示離線訓(xùn)練過(guò)程和在第一幀進(jìn)行訓(xùn)練):
???
? 模型的目的是從樣本中學(xué)習(xí)出一系列convolution filter ,則在樣本上進(jìn)行卷積得到的卷積response為(其中代表channel數(shù)):
???
? 則損失函數(shù)可以寫(xiě)為:
???
? 在測(cè)試階段,可以看作:
???
?
-
? 作者把模型的訓(xùn)練過(guò)程分為兩部分:
? (1).off-line training
??? 這部分訓(xùn)練即為在訓(xùn)練集上最小化損失函數(shù),不同的是,由于最后一幀中的目標(biāo)位置經(jīng)常不在cropped patch的中心,所以作者將train patch cropped with jittering(抖動(dòng))。
? (2).traing on first frame
??? 這部分訓(xùn)練的目的是使模型適應(yīng)于跟蹤特定的目標(biāo)。在訓(xùn)練時(shí),虛線框內(nèi)的權(quán)值使用均值為0的高斯分布進(jìn)行隨機(jī)初始化,然后使用SGD進(jìn)行訓(xùn)練。
?
-
? Online Tracking的過(guò)程主要包括以下兩部分:
? (1).Model update
??? 作者認(rèn)為在每一幀或者固定間隔幀進(jìn)行更新是不合理的,于是作者提出了一個(gè)定義,PNR(peak-versus-noise ratio):
?????
??? 這里分母表示對(duì)response map中除去峰值的地方求均值。
??? 當(dāng)以下兩個(gè)閾值都被滿足的時(shí)候,才進(jìn)行模型的更新。
?????
? (2).Scale estimation
??? 這部分作者使用了DSST中一樣的尺度估計(jì)方法,下面回顧一下。
?????
??? ①.在第一幀中以目標(biāo)正中間為中心,截取S張不同尺度的圖像,每張圖像提取一個(gè)d維的特征向量,得到S*d的特征矩陣;
??? ②.構(gòu)造相關(guān)圖g,大小為S*1,中間值最大,向兩端遞減;
??? ③.計(jì)算出尺度濾波模板h;
??? ④.對(duì)于當(dāng)前幀,選取S張不同尺度的圖像,和位置估計(jì)一樣,計(jì)算出當(dāng)前幀的相關(guān)圖g,響應(yīng)最大值對(duì)應(yīng)的尺度即為估計(jì)的尺度。
總結(jié)
以上是生活随笔為你收集整理的ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: CVPR 2017 ECO:《ECO:
- 下一篇: ICCV 2017 DSiam:《Lea