Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略
Dataset之COCO數據集:COCO數據集的簡介、安裝、使用方法之詳細攻略
目錄
COCO數據集的簡介
0、COCO數據集的80個類別—YoloV3算法采用的數據集
1、COCO數據集的意義
2、COCO數據集的特點
3、數據集的大小和版本
COCO數據集的下載
1、2014年數據集的下載
2、2017的數據集的下載
COCO數據集的使用方法
1、基礎用法
COCO數據集的簡介
? ? ? ? MS COCO的全稱是Microsoft Common Objects in Context,起源于微軟于2014年出資標注的Microsoft COCO數據集,與ImageNet競賽一樣,被視為是計算機視覺領域最受關注和最權威的比賽之一。?
? ? ? ? COCO數據集是一個大型的、豐富的物體檢測,分割和字幕數據集。這個數據集以scene understanding為目標,主要從復雜的日常場景中截取,圖像中的目標通過精確的segmentation進行位置的標定。圖像包括91類目標,328,000影像和2,500,000個label。目前為止有語義分割的最大數據集,提供的類別有80 類,有超過33 萬張圖片,其中20 萬張有標注,整個數據集中個體的數目超過150 萬個。
官網地址:http://cocodataset.org
0、COCO數據集的80個類別—YoloV3算法采用的數據集
person(人) ?
bicycle(自行車) ?car(汽車) ?motorbike(摩托車) ?aeroplane(飛機) ?bus(公共汽車) ?train(火車) ?truck(卡車) ?boat(船) ?
traffic light(信號燈) ?fire hydrant(消防栓) ?stop sign(停車標志) ?parking meter(停車計費器) ?bench(長凳) ?
bird(鳥) ?cat(貓) ?dog(狗) ?horse(馬) ?sheep(羊) ?cow(牛) ?elephant(大象) ?bear(熊) ?zebra(斑馬) ?giraffe(長頸鹿) ?
backpack(背包) ?umbrella(雨傘) ?handbag(手提包) ?tie(領帶) ?suitcase(手提箱) ?
frisbee(飛盤) ?skis(滑雪板雙腳) ?snowboard(滑雪板) ?sports ball(運動球) ?kite(風箏) baseball bat(棒球棒) ?baseball glove(棒球手套) ?skateboard(滑板) ?surfboard(沖浪板) ?tennis racket(網球拍) ?
bottle(瓶子) ?wine glass(高腳杯) ?cup(茶杯) ?fork(叉子) ?knife(刀)
spoon(勺子) ?bowl(碗) ?
banana(香蕉) ?apple(蘋果) ?sandwich(三明治) ?orange(橘子) ?broccoli(西蘭花) ?carrot(胡蘿卜) ?hot dog(熱狗) ?pizza(披薩) ?donut(甜甜圈) ?cake(蛋糕)
chair(椅子) ?sofa(沙發) ?pottedplant(盆栽植物) ?bed(床) ?diningtable(餐桌) ?toilet(廁所) ?tvmonitor(電視機) ?
laptop(筆記本) ?mouse(鼠標) ?remote(遙控器) ?keyboard(鍵盤) ?cell phone(電話) ?
microwave(微波爐) ?oven(烤箱) ?toaster(烤面包器) ?sink(水槽) ?refrigerator(冰箱)
book(書) ?clock(鬧鐘) ?vase(花瓶) ?scissors(剪刀) ?teddy bear(泰迪熊) ?hair drier(吹風機) ?toothbrush(牙刷)
1、COCO數據集的意義
? ? ? ? MS COCO的全稱是Microsoft Common Objects in Context,起源于是微軟于2014年出資標注的Microsoft COCO數據集,與ImageNet 競賽一樣,被視為是計算機視覺領域最受關注和最權威的比賽之一。
? ? ? ? 當在ImageNet競賽停辦后,COCO競賽就成為是當前目標識別、檢測等領域的一個最權威、最重要的標桿,也是目前該領域在國際上唯一能匯集Google、微軟、Facebook以及國內外眾多頂尖院校和優秀創新企業共同參與的大賽。?
? ? ? ? 該數據集主要解決3個問題:目標檢測,目標之間的上下文關系,目標的2維上的精確定位。COCO數據集有91類,雖然比ImageNet和SUN類別少,但是每一類的圖像多,這有利于獲得更多的每類中位于某種特定場景的能力,對比PASCAL VOC,其有更多類和圖像。
1、COCO目標檢測挑戰?
- COCO數據集包含20萬個圖像;
- 80個類別中有超過50萬個目標標注,它是最廣泛公開的目標檢測數據庫;
- 平均每個圖像的目標數為7.2,這些是目標檢測挑戰的著名數據集。
?
2、COCO數據集的特點
COCO is a large-scale object detection, segmentation, and captioning dataset. COCO has several features:
| |
3、數據集的大小和版本
大小:25 GB(壓縮)
記錄數量: 330K圖像、80個對象類別、每幅圖像有5個標簽、25萬個關鍵點。
?? ? ? ? COCO數據集分兩部分發布,前部分于2014年發布,后部分于2015年,2014年版本:82,783 training, 40,504 validation, and 40,775?testing images,有270k的segmented people和886k的segmented object;2015年版本:165,482 train, 81,208 val, and 81,434 test images。
(1)、2014年版本的數據,一共有20G左右的圖片和500M左右的標簽文件。標簽文件標記了每個segmentation的像素精確位置+bounding box的精確坐標,其精度均為小數點后兩位。
COCO數據集的下載
官網地址:http://cocodataset.org/#download
1、2014年數據集的下載
train2014:http://images.cocodataset.org/zips/train2014.zip
val2014:http://images.cocodataset.org/zips/val2014.zip
http://msvocds.blob.core.windows.net/coco2014/train2014.zip
2、2017的數據集的下載
http://images.cocodataset.org/zips/train2017.zip
http://images.cocodataset.org/annotations/annotations_trainval2017.zip
http://images.cocodataset.org/zips/val2017.zip
http://images.cocodataset.org/annotations/stuff_annotations_trainval2017.zip
http://images.cocodataset.org/zips/test2017.zip
http://images.cocodataset.org/annotations/image_info_test2017.zip
| train2017 | train2017:http://images.cocodataset.org/zips/train2017.zip |
| val2017 | val2017:http://images.cocodataset.org/zips/val2017.zip |
| test2017 | test2017:http://images.cocodataset.org/zips/test2017.zip |
COCO數據集的使用方法
1、基礎用法
| (1)、Download Images and Annotations from [MSCOCO] | 后期更新…… |
| (2)、Get the coco code | 后期更新…… |
| (3)、Build the coco code | 后期更新…… |
| (4)、Split the annotation to many files per image and get the image size info | 后期更新…… |
| (5)、?Create the LMDB file | 后期更新…… |
總結
以上是生活随笔為你收集整理的Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CV之NS之VGG16:基于TF Sli
- 下一篇: CV之NS之VGG16:基于预训练模型V