CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记
? 理解出錯之處望不吝指正。
? 本文模型叫做SINT,和Siamese-fc一樣,通過相似學(xué)習(xí)解決跟蹤問題(這篇論文的發(fā)表時間比Siamese-fc早)。模型的整體結(jié)構(gòu)如下:
???
-
? 跟蹤過程
? 模型分為兩路,左側(cè)為“Query stream”(接收第一幀的bbox),右側(cè)為“Search stream”(接收第t幀的candidate boxes),在跟蹤的過程中,根據(jù)下式選出得分最高的candidate box作為跟蹤結(jié)果。
???
???
? 函數(shù)表示對于輸入進行特征提取、池化、正則化之后得到的數(shù)據(jù)表示形式。
?
-
? 訓(xùn)練過程
? 模型的訓(xùn)練集和驗證集選擇的是ALOV。訓(xùn)練集合包括60000對幀,每一對幀中包括128對bbox。驗證集包括2000對幀,每對包括128對bbox。
? 訓(xùn)練過程就是最小化損失函數(shù):
???
???
? 式中代表訓(xùn)練對是正樣本對or負樣本對,如果是正樣本對,則,否則。
? 論文中提到,跟蹤問題作為一個定位問題,不應(yīng)使用過多的max pooling,過多的max pooling會導(dǎo)致定位不準確。但是max pooling的優(yōu)勢在于對于輸入的局部形變具有不變性,也不能棄之不用,故設(shè)計為兩個max pooling層。
?
-
? 實驗
? 首先是網(wǎng)絡(luò)結(jié)構(gòu)的選擇,下圖是在OTB-2013上的測試結(jié)果:
???
? 作者通過實驗發(fā)現(xiàn),max pooling對于Siamese Alexnet是不必要的:
???
? 下圖是模型在OTB-2013上的測試結(jié)果(其中SINT+是基于SINT上使用更好的采樣策略和光流附加模塊的一個模型):
???
???
?
?
?
?
?
?
總結(jié)
以上是生活随笔為你收集整理的CVPR 2016 SINT:《Siamese Instance Search for Tracking》论文笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu复制相同的目录结构(不复制文
- 下一篇: ICCV 2015 《Understan