【每周CV论文推荐】 初学目标检测必须要读的文章
歡迎來到《每周CV論文推薦》。在這個(gè)專欄里,還是本著有三AI一貫的原則,專注于讓大家能夠系統(tǒng)性完成學(xué)習(xí),所以我們推薦的文章也必定是同一主題的。
目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺的基礎(chǔ)任務(wù)之一,應(yīng)用非常廣泛,今天給大家推薦初學(xué)目標(biāo)檢測(cè)必讀的一些文章。
作者&編輯 | 言有三
1 OverFeat
傳統(tǒng)的目標(biāo)檢測(cè)如V-J人臉檢測(cè)算法需要使用多尺度的滑動(dòng)窗口技術(shù)來提取候選檢測(cè)區(qū)域然后提取特征,OverFeat作為ILSVRC2013年目標(biāo)檢測(cè)和定位的冠軍網(wǎng)絡(luò),它把分類過程中提取到的特征同時(shí)又用于定位檢測(cè)任務(wù),將滑動(dòng)窗口從圖像空間轉(zhuǎn)移到了特征空間,大大降低了計(jì)算代價(jià)。
文章引用量:3000+
推薦指數(shù):?????
[1] Sermanet P, Eigen D, Zhang X, et al. Overfeat: Integrated recognition, localization and detection using convolutional networks[J]. arXiv preprint arXiv:1312.6229, 2013.
2 Cascade CNN
Cascade CNN是級(jí)聯(lián)的結(jié)構(gòu)和深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)合的代表,與V-J框架思想相同。具體實(shí)現(xiàn)是將分類網(wǎng)絡(luò)最后的全連接層修改成卷積層得到全卷積網(wǎng)絡(luò),從而可以接受任意大小的輸入圖像。這樣由粗到精的框架是目標(biāo)檢測(cè)中很常見的思路,以后還會(huì)看到很多的研究。
文章引用量:600+
推薦指數(shù):?????
[2] Li H, Lin Z, Shen X, et al. A convolutional neural network cascade for face detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 5325-5334.
3 RCNN
基于候選區(qū)域的RCNN框架是卷積神經(jīng)網(wǎng)絡(luò)做目標(biāo)檢測(cè)中影響巨大的研究,引領(lǐng)了一個(gè)系列的發(fā)展,這也是傳統(tǒng)算法和CNN的一個(gè)結(jié)合。
文章引用量:9000+
推薦指數(shù):?????
[3] Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2014: 580-587.
4 SPPNet與Fast RCNN
SPPNet提出的Spatial Pyramid Pooling層實(shí)現(xiàn)了將輸入的任意尺度的特征圖轉(zhuǎn)換為特定維度的輸出,從而去掉了RCNN框架中原始圖像上的crop/warp等操作的約束。
Fast RCNN借鑒了SPPNet的思想,使用了一個(gè)簡(jiǎn)化的SPP層,即RoI(Region of Interesting)Pooling層,通過RoI pooling反投影回原來的圖像空間,實(shí)現(xiàn)獲取任意圖像區(qū)域特征的目標(biāo)。它有點(diǎn)類似于VJ算法中的積分圖,實(shí)現(xiàn)了一次特征提取,處處可以使用,從而大大降低了計(jì)算量。
文章引用量:3000+
推薦指數(shù):?????
[4] He K, Zhang X, Ren S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE transactions on pattern analysis and machine intelligence, 2015, 37(9): 1904-1916.
[5]?Girshick R. Fast r-cnn[C]//Proceedings of the IEEE international conference on computer vision. 2015: 1440-1448.
5 Faster RCNN與R-FCN
Faster RCNN方法提出了Region Proposal Networks,實(shí)現(xiàn)了神經(jīng)網(wǎng)絡(luò)自己學(xué)習(xí)生成候選區(qū)域,充分利用了feature maps的價(jià)值,去除了耗時(shí)的selective search,使得目標(biāo)檢測(cè)框架達(dá)到了實(shí)時(shí)的性能。
R-FCN使用了全卷積的架構(gòu),去除了Faster RCNN中每一個(gè)區(qū)域進(jìn)行分類時(shí)需要單獨(dú)使用全連接層進(jìn)行特征提取的方案,進(jìn)一步降低了計(jì)算代價(jià)。
文章引用量:11000+
推薦指數(shù):?????
[6] Ren S, He K, Girshick R, et al. Faster r-cnn: Towards real-time object detection with region proposal networks[C]//Advances in neural information processing systems. 2015: 91-99.
[7]?Dai J, Li Y, He K, et al. R-fcn: Object detection via region-based fully convolutional networks[C]//Advances in neural information processing systems. 2016: 379-387.
6 FPN
為了解決Faster RCNN系列不能很好地適用多尺度目標(biāo)預(yù)測(cè)的問題,FPN框架將高層的特征與低層的特征進(jìn)行融合,分別對(duì)每一層進(jìn)行預(yù)測(cè),多尺度從此是一個(gè)性能強(qiáng)勁的目標(biāo)檢測(cè)框架中必不可少的元素。
文章引用量:1000+
推薦指數(shù):?????
[8] Lin T Y, Dollár P, Girshick R, et al. Feature pyramid networks for object detection[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2117-2125.
8 如何獲取文章與交流
找到有三AI開源項(xiàng)目即可獲取。
https://github.com/longpeng2008/yousan.ai
文章細(xì)節(jié)眾多,閱讀交流在有三AI知識(shí)星球中進(jìn)行,感興趣可以加入。
總結(jié)
以上就是初次進(jìn)入目標(biāo)檢測(cè)領(lǐng)域要讀的文章,下一次,我們將介紹初次進(jìn)入圖像分割領(lǐng)域要讀的文章。
有三AI夏季劃
有三AI夏季劃進(jìn)行中,歡迎了解并加入,系統(tǒng)性成長(zhǎng)為中級(jí)CV算法工程師。
轉(zhuǎn)載文章請(qǐng)后臺(tái)聯(lián)系
侵權(quán)必究
往期精選
【每周論文推薦】 初入深度學(xué)習(xí)CV領(lǐng)域必讀的幾篇文章
【每周CV論文推薦】 掌握殘差網(wǎng)絡(luò)必讀的10多篇文章
【每周CV論文推薦】 初學(xué)者必須精讀的5篇深度學(xué)習(xí)優(yōu)化相關(guān)文章
【每周CV論文推薦】 CV領(lǐng)域中數(shù)據(jù)增強(qiáng)相關(guān)的論文推薦
【每周CV論文推薦】 初學(xué)高效率CNN模型設(shè)計(jì)應(yīng)該讀的文章
總結(jié)
以上是生活随笔為你收集整理的【每周CV论文推荐】 初学目标检测必须要读的文章的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【每周NLP论文推荐】 聊天机器人中FA
- 下一篇: 【NLP-词向量】词向量的由来及本质