日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Pascal voc 2012 数据集简介

發布時間:2023/12/14 编程问答 54 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Pascal voc 2012 数据集简介 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1. 簡介

Pascal VOC網址:http://host.robots.ox.ac.uk/pascal/VOC/

VOC2012數據集下載地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

參考鏈接:https://blog.csdn.net/zz2230633069/article/details/84769339

Pascal VOC的三個主要物體識別競賽是:分類,檢測和分割(classification, detection, and segmentation)。對于分割任務, VOC2012的trainval包含2007-2011年的所有對應圖片, test只包含2008-2011。trainval有 2913張圖片共6929個物體。

2. 分類

總共20類如下(背景為第21類):

Person: person

Animal: bird, cat, cow, dog, horse, sheep

Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train

Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

序號為(0代表背景,1~20代表20個類別):

0

background

?

?

1

aeroplane

11

diningtable

2

bicycle

12

dog

3

bird

13

horse

4

boat

14

motorbike

5

bottle

15

person

6

bus

16

pottedplant

7

car

17

sheep

8

cat

18

sofa

9

chair

19

train

10

cow

20

tv

分布如下:

類別與顏色的對應關系如下:

一張標簽圖片總共有22種數字(0-20,255)其中0和255的顏色都是黑色RGB=(0,0,0),所以語義圖總共有21種顏色。

?

?

3. 具體文件

下載后得到如下壓縮包:

在VOCdevkit/VOC2012下有5個文件夾,如下所示:

逐個介紹:

(1)Annotations

Annotations文件夾中存放的是xml格式的標簽文件,每一個xml文件都對應于JPEGImages文件夾中的一張圖片,共計17125個文件,如下所示:

以2007_000027.xml和2007_000032.xml文件為例,打開xml文件(截取部分):

2007_000027.xml文件:

2007_000032.xml文件:

紅框標注部分表示是否可以用于分割:0否;1是。

(2)ImageSets

ImageSets存放的是每一種類型的challenge對應的圖像數據。

在ImageSets下有四個文件夾:

Action:存放的是人的動作(running、jumping等等)

Layout:存放的是具有人體部位的數據(人的head、hand、feet等等)

Main:存放的是圖像物體識別的數據,總共分為20類。

Segmentation:存放的是可用于分割的數據。

主要看Segmentation文件夾。其中包含了train.txt(1416張圖)、val.txt(1449張圖)和trainval.txt(2913張圖)三個文本文件,里面儲存的是用于語義分割的圖片的名字(無擴展名)。train和val兩者沒有交集,即訓練數據和驗證數據不能有重復,隨機產生而trainval則是兩者的總和。

(3)JPEGImages

JPEGImages文件夾中包含了PASCAL VOC提供的所有的就jpg圖片,共計17125張,包括了訓練和測試圖片。

這些圖像都以“年份_編號.jpg”格式命名。

圖片的像素尺寸大小不一,但是橫向圖的尺寸大約在500*375左右,縱向圖的尺寸大約在375*500左右,長寬均不會超過512。

(4)SegmentationClass

保存了分割后的標簽圖(2913張png圖片),標注出了每一個像素屬于哪一個類別

(5)SegmentationObject

保存了分割后的標簽圖(2913張png圖片),標注出了每一個像素屬于哪一個具體的物體

對比上面兩個文件夾中文件的區別:

注意:上面兩個文件夾中的label圖,位深度是8位,并不是RGB三通道,只是由于colormap的存在,使其看起來是彩色的(具體我也不太了解)。因此,在deeplabv3+方法中,準備數據時需要先去掉label們的colormap。

總結

以上是生活随笔為你收集整理的Pascal voc 2012 数据集简介的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。