日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文: YOLO9000-Better,Faster,Stronger

發布時間:2023/12/18 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文: YOLO9000-Better,Faster,Stronger 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文閱讀: YOLO9000-Better,Faster,Stronger

?

YOLOv2 是經過改造之后的YOLO?

?

Batch Normalization:在所有的conv layer后加了BN之后提高了2% mAP,BN可以幫助regularize模型,這樣的話就可以放棄 dropout。

?

High Resolution Classifier: 之前的 YOLO是基于224X224,將resolution提高到448,首先在imagenet 上fine tune Network 10 epochs。

?

Convolutional With Anchor Boxes: 對于之前的YOLO,conv layers之后的 FC layer,YOLOv2 將FC layer移除之后,使用anchor boxes來預測 bounding boxes。
使用了anchor boxes在accuracy有了微小的提高,YOLO只有98 (7 x 7 x 2) 個bboxs,在anchor boxes下可以產生上千個box。


Diminsion Cluster:使用k-means來自動挑選box dimensions,選擇非Euclidean distance,而是 distance metric:



在VOC和COCO上的表現:

?

Direct Location Prediction:在YOLOv2中不直接regression計算offsets,而是predict location of the grid cell,利用 logistic activation來選擇 predictions,限制predictions落在range之內。

所以,prediction為:

如圖:

?

Fine-Grained Features
13 x 13 feature map , good for finer grained features for localizing smaller objects.


multi-scale training: change the network every few iterations. (Every 10 batches our network randomly chooses a new image dimension size)

?

為了Faster,重新修改了網絡結構:

?

YOLO9000, 利用細粒度分類 fine grained, wordTree 來幫助分類。

在train YOLO9000時候使用了 data combination,將COCO和ImageNet兩個數據集合并。

ImageNet的WordTree representation為圖像分類提供了更加豐富更加細致的輸出空間。

?

本人觀點:之前的YOLO出的早,網絡結構是很不錯,但是這兩年的classification、Detection領域發展太快,有太多好的trick和method,作者重新取長補短,將那些好的思想融入到YOLO中。實現了題目中的 Better,Faster, Stronger的特點。不錯的paper。

?

轉載于:https://www.cnblogs.com/zhang-yd/p/7387875.html

創作挑戰賽新人創作獎勵來咯,堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的论文: YOLO9000-Better,Faster,Stronger的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。