适合初学者的PASCAL VOC2012数据集的下载及简单讲解
如題,我本身也是一個初學者,本篇文章是我在了解PASCAL VOC數據集中所學習到的,因此記錄下來與大家分享,如果有不對的地方還希望大家指正。
PASCAL VOC挑戰賽是世界級的計算機視覺挑戰賽,PASCAL的全稱是:Pattern Analysis,Statistical Modelling and Computational Learning Visual Objection Classes,是一個由歐盟資助的網絡組織,挑戰賽主要分為以下幾類:圖像分類,目標檢測,目標分割以及動作識別等。
一、PASCAL VOC2012數據集的下載
由于我下載的時候官網打不開,因此找到了一個鏡像網站,大家可以直接復制到迅雷中下載,還是比較快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
二、PASCAL VOC2012數據集的內容
解壓下載的文件,里面結構如下:
1.Annotations
這個文件夾下的內容為所有圖像的標注信息,均為XML文件。
就像這樣,任選其中一個打開可以看到如下信息,’#'后的是我加上的注釋:
2.ImageSets
此文件夾下又有四個文件夾
其中Action文件夾中為人的行為動作圖像信息,Layout為人的各個部位圖像信息,Segmentation為目標分割圖像信息,Main文件夾為目標檢測分類圖像信息,Main文件夾中包括了20個種類的txt格式的信息,每一個種類都有三個,分別是_train,_trainval,_val,部分截圖如下。除此之外,還包含了三個總的信息文件train.txt,val.txt,trainval.txt,這里面訓練集共有5717張圖片,驗證集共有5823張圖片,共有11540張圖片。
訓練集train.txt文件中的每一行都是一個圖片的名稱,驗證集val.txt也同樣,并且訓練集中的圖片和驗證集中的是完全不一樣的。trainval.txt是將這兩部分融合到一起的。
隨機點開某一個類別的txt文件,如bird_train.txt,可以發現每一行除了名稱后面還有一個數字,如果是-1,說明這個圖片中沒有鳥這個目標;如果是1,說明這個圖片中有鳥這個目標;如果是0,說明這個目標檢測起來是有困難的。如下部分截圖:
3.JPEGImages
這個文件夾下就是一個個.jpg格式的圖片。
4.SegmentationClass
基于類別的圖像分割圖,都是png格式的。
5.SegmentationObject
基于目標的圖像分割圖,也都是png格式的。
三、PASCAL VOC2012數據集的使用順序
首先讀入train.txt的文件,獲取它的每一行信息,然后去Annotations找到它的xml文件,然后解析這個文件,再去JPEGImages中找到這個圖片,載入到內存中。
如果大家覺得我寫的不夠細致,可以去b站搜這位up主的講解,很細致,感謝他!https://b23.tv/KRwTKT
總結
以上是生活随笔為你收集整理的适合初学者的PASCAL VOC2012数据集的下载及简单讲解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mrp下载基地
- 下一篇: 计算机1级题库软件,计算机一级软件哪个好