當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

适合初学者的PASCAL VOC2012数据集的下载及简单讲解

發布時間：2023/12/14 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了适合初学者的PASCAL VOC2012数据集的下载及简单讲解小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

如題，我本身也是一個初學者，本篇文章是我在了解PASCAL VOC數據集中所學習到的，因此記錄下來與大家分享，如果有不對的地方還希望大家指正。

PASCAL VOC挑戰賽是世界級的計算機視覺挑戰賽，PASCAL的全稱是：Pattern Analysis，Statistical Modelling and Computational Learning Visual Objection Classes，是一個由歐盟資助的網絡組織，挑戰賽主要分為以下幾類：圖像分類，目標檢測，目標分割以及動作識別等。

一、PASCAL VOC2012數據集的下載

由于我下載的時候官網打不開，因此找到了一個鏡像網站，大家可以直接復制到迅雷中下載，還是比較快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

二、PASCAL VOC2012數據集的內容

解壓下載的文件，里面結構如下：

1.Annotations

這個文件夾下的內容為所有圖像的標注信息，均為XML文件。

就像這樣，任選其中一個打開可以看到如下信息，’#'后的是我加上的注釋：

<annotation><folder>VOC2012</folder>#圖片所在的文件夾<filename>2007_000033.jpg</filename>#所對應的圖片名稱<source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image>#來自網絡分享</source><size>#尺寸<width>500</width><height>366</height><depth>3</depth></size><segmented>1</segmented>#是否被分割過，1是被分割過，沒有就是0<object>#目標1<name>aeroplane</name>#類別<pose>Unspecified</pose><truncated>0</truncated>#目標是否被截斷<difficult>0</difficult>#目標檢測的難易程度，1為難檢測，0為容易檢測<bndbox>#目標的左上角和右下角坐標<xmin>9</xmin><ymin>107</ymin><xmax>499</xmax><ymax>263</ymax></bndbox></object><object>#目標2<name>aeroplane</name><pose>Left</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>421</xmin><ymin>200</ymin><xmax>482</xmax><ymax>226</ymax></bndbox></object><object>#目標3<name>aeroplane</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>325</xmin><ymin>188</ymin><xmax>411</xmax><ymax>223</ymax></bndbox></object> </annotation>

2.ImageSets

此文件夾下又有四個文件夾

其中Action文件夾中為人的行為動作圖像信息，Layout為人的各個部位圖像信息，Segmentation為目標分割圖像信息，Main文件夾為目標檢測分類圖像信息，Main文件夾中包括了20個種類的txt格式的信息，每一個種類都有三個，分別是_train,_trainval,_val，部分截圖如下。除此之外，還包含了三個總的信息文件train.txt,val.txt,trainval.txt，這里面訓練集共有5717張圖片，驗證集共有5823張圖片，共有11540張圖片。

訓練集train.txt文件中的每一行都是一個圖片的名稱，驗證集val.txt也同樣，并且訓練集中的圖片和驗證集中的是完全不一樣的。trainval.txt是將這兩部分融合到一起的。

隨機點開某一個類別的txt文件，如bird_train.txt，可以發現每一行除了名稱后面還有一個數字，如果是-1，說明這個圖片中沒有鳥這個目標；如果是1，說明這個圖片中有鳥這個目標；如果是0，說明這個目標檢測起來是有困難的。如下部分截圖：

3.JPEGImages

這個文件夾下就是一個個.jpg格式的圖片。

4.SegmentationClass

基于類別的圖像分割圖，都是png格式的。

5.SegmentationObject

基于目標的圖像分割圖，也都是png格式的。

三、PASCAL VOC2012數據集的使用順序

首先讀入train.txt的文件，獲取它的每一行信息，然后去Annotations找到它的xml文件，然后解析這個文件，再去JPEGImages中找到這個圖片，載入到內存中。

如果大家覺得我寫的不夠細致，可以去b站搜這位up主的講解，很細致，感謝他！https://b23.tv/KRwTKT

總結

以上是生活随笔為你收集整理的适合初学者的PASCAL VOC2012数据集的下载及简单讲解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： mrp下载基地
下一篇：计算机1级题库软件,计算机一级软件哪个好