日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

适合初学者的PASCAL VOC2012数据集的下载及简单讲解

發布時間:2023/12/14 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 适合初学者的PASCAL VOC2012数据集的下载及简单讲解 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

如題,我本身也是一個初學者,本篇文章是我在了解PASCAL VOC數據集中所學習到的,因此記錄下來與大家分享,如果有不對的地方還希望大家指正。

PASCAL VOC挑戰賽是世界級的計算機視覺挑戰賽,PASCAL的全稱是:Pattern Analysis,Statistical Modelling and Computational Learning Visual Objection Classes,是一個由歐盟資助的網絡組織,挑戰賽主要分為以下幾類:圖像分類,目標檢測,目標分割以及動作識別等。

一、PASCAL VOC2012數據集的下載

由于我下載的時候官網打不開,因此找到了一個鏡像網站,大家可以直接復制到迅雷中下載,還是比較快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar

二、PASCAL VOC2012數據集的內容

解壓下載的文件,里面結構如下:

1.Annotations

這個文件夾下的內容為所有圖像的標注信息,均為XML文件。

就像這樣,任選其中一個打開可以看到如下信息,’#'后的是我加上的注釋:

<annotation><folder>VOC2012</folder>#圖片所在的文件夾<filename>2007_000033.jpg</filename>#所對應的圖片名稱<source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image>#來自網絡分享</source><size>#尺寸<width>500</width><height>366</height><depth>3</depth></size><segmented>1</segmented>#是否被分割過,1是被分割過,沒有就是0<object>#目標1<name>aeroplane</name>#類別<pose>Unspecified</pose><truncated>0</truncated>#目標是否被截斷<difficult>0</difficult>#目標檢測的難易程度,1為難檢測,0為容易檢測<bndbox>#目標的左上角和右下角坐標<xmin>9</xmin><ymin>107</ymin><xmax>499</xmax><ymax>263</ymax></bndbox></object><object>#目標2<name>aeroplane</name><pose>Left</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>421</xmin><ymin>200</ymin><xmax>482</xmax><ymax>226</ymax></bndbox></object><object>#目標3<name>aeroplane</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>325</xmin><ymin>188</ymin><xmax>411</xmax><ymax>223</ymax></bndbox></object> </annotation>

2.ImageSets

此文件夾下又有四個文件夾

其中Action文件夾中為人的行為動作圖像信息,Layout為人的各個部位圖像信息,Segmentation為目標分割圖像信息,Main文件夾為目標檢測分類圖像信息,Main文件夾中包括了20個種類的txt格式的信息,每一個種類都有三個,分別是_train,_trainval,_val,部分截圖如下。除此之外,還包含了三個總的信息文件train.txt,val.txt,trainval.txt,這里面訓練集共有5717張圖片,驗證集共有5823張圖片,共有11540張圖片。

訓練集train.txt文件中的每一行都是一個圖片的名稱,驗證集val.txt也同樣,并且訓練集中的圖片和驗證集中的是完全不一樣的。trainval.txt是將這兩部分融合到一起的。

隨機點開某一個類別的txt文件,如bird_train.txt,可以發現每一行除了名稱后面還有一個數字,如果是-1,說明這個圖片中沒有鳥這個目標;如果是1,說明這個圖片中有鳥這個目標;如果是0,說明這個目標檢測起來是有困難的。如下部分截圖:

3.JPEGImages

這個文件夾下就是一個個.jpg格式的圖片。

4.SegmentationClass

基于類別的圖像分割圖,都是png格式的。

5.SegmentationObject

基于目標的圖像分割圖,也都是png格式的。

三、PASCAL VOC2012數據集的使用順序

首先讀入train.txt的文件,獲取它的每一行信息,然后去Annotations找到它的xml文件,然后解析這個文件,再去JPEGImages中找到這個圖片,載入到內存中。

如果大家覺得我寫的不夠細致,可以去b站搜這位up主的講解,很細致,感謝他!https://b23.tv/KRwTKT

總結

以上是生活随笔為你收集整理的适合初学者的PASCAL VOC2012数据集的下载及简单讲解的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。