怎么拿img标签的data_PASCAL VOC数据集-分割标签索引颜色对照及程序
作者:陳洪瀚 /洪瀚筆記知乎專欄
摘要:介紹了PSACAL VOC分割標(biāo)簽的索引格式,用圖表詳細(xì)展示索引值和對應(yīng)的顏色和類別;然后使用python程序分別調(diào)用opencv和pillow庫如何快速讀取索引表,并對索引圖像(實(shí)際應(yīng)用中是網(wǎng)絡(luò)輸出的類別標(biāo)號)著色。(相比其他程序利用列表手工定義調(diào)色板的方法,本文通過讀取標(biāo)簽圖片獲取調(diào)色板,更加便捷。)
一. 準(zhǔn)備實(shí)驗(yàn)數(shù)據(jù)
二. 運(yùn)行環(huán)境
Numpy, pillow, pypng, opencv-python 通過pip install 安裝
三. 圖片格式
PASCAL VOC分割任務(wù)中,共有20個(gè)類別的對象,其他內(nèi)容作為背景類。圖1 是PASCAL VOC的原圖片,圖2是針對圖1分割的標(biāo)注,其中紅色代表飛機(jī)類,黑色是背景,飛機(jī)邊界部分用米黃色(看著像白色)線條描繪,表示分割模糊區(qū)。其中,分割標(biāo)簽都是png格式的圖像,該圖像其實(shí)是單通道的顏色索引圖像,即每個(gè)像素的值為0~255的整數(shù),對于VOC的標(biāo)簽圖像而言,0代表背景,255代表邊界,其他1~20為20個(gè)類別。具體見圖3 所示。該圖像除了有一個(gè)單通道和圖像大小一樣的索引圖像外,還存儲(chǔ)了256個(gè)顏色值列表(調(diào)色板),每一個(gè)索引值對應(yīng)調(diào)色板里一個(gè)RGB顏色值,因此,一個(gè)單通道的索引圖+調(diào)色板就能表示彩色圖。
程序完成的內(nèi)容主要包括讀取分割標(biāo)簽圖像,并獲取圖像的調(diào)色板信息。對于分割后的標(biāo)簽圖像用調(diào)色板進(jìn)行著色。這里用一個(gè)長條狀矩陣索引圖像(numpy生成)模擬分割模型得到的圖像,32x704(32x22)個(gè)像素。即22個(gè)32x32個(gè)色塊拼接而成,每個(gè)色塊代表一類顏色。20個(gè)類+背景+邊界。
圖1 原圖圖2 分割標(biāo)簽圖3 圖像類別-索引值-調(diào)色板對應(yīng)關(guān)系四. 程序
2. 采用pillow庫完成,這里用getpalette()庫來讀取圖片的調(diào)色板信息。著色采用getpalette()函數(shù)完成。
from PIL import Image import numpy label_path = r'./VOCdevkit/VOC2012/SegmentationClass/2007_000033.png' label_img = Image.open(label_path) color_map = label_img.getpalette() color_map_arr = numpy.array(color_map) color_palette = numpy.reshape(color_map_arr,(256,1,3)).astype(numpy.uint8)output_arr = numpy.zeros((32,22*32),dtype=numpy.uint8) for i in range(21):output_arr[:,i*32:(i+1)*32]=i output_arr[:,21*32:22*32]=255output_img = Image.fromarray(output_arr,mode='L') output_img.putpalette(color_palette) output_img.save('output_img.png')圖4 生成的圖像總結(jié)
以上是生活随笔為你收集整理的怎么拿img标签的data_PASCAL VOC数据集-分割标签索引颜色对照及程序的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我的备忘录
- 下一篇: 解决IE6透明PNG图片的代码