Dataset之CIFAR-10:CIFAR-10数据集简介、下载、使用方法之详细攻略
Dataset之CIFAR-10:CIFAR-10數據集簡介、下載、使用方法之詳細攻略
?
?
目錄
CIFAR-10簡介
1、與MNIST 數據集中目比, CIFAR-10 真高以下不同點
2、TensorFlow 官方示例的CIFAR-10 代碼文件
3、CIFAR-10 數據集的數據文件名及用途
CIFAR-10下載
1、下載CIFAR-10 數據集的全部數據
CIFAR-10使用方法
1、使用TF讀取CIFAR-10 數據
?
?
?
CIFAR-10簡介
官網鏈接:The CIFAR-10 dataset
? ? ? ? ? CIFAR-10是一個更接近普適物體的彩色圖像數據集。CIFAR-10 是由Hinton 的學生Alex Krizhevsky 和Ilya Sutskever 整理的一個用于識別普適物體的小型數據集。一共包含10 個類別的RGB 彩色圖片:飛機( airplane )、汽車( automobile )、鳥類( bird )、貓( cat )、鹿( deer )、狗( dog )、蛙類( frog )、馬( horse )、船( ship )和卡車( truck )。
? ? ? ? ?每個圖片的尺寸為32 × 32 ,每個類別有6000個圖像,數據集中一共有50000 張訓練圖片和10000 張測試圖片。
?
1、與MNIST 數據集中目比, CIFAR-10 真高以下不同點
- (1)、CIFAR-10 是3 通道的彩色RGB 圖像,而MNIST 是灰度圖像。
- (2)、CIFAR-10 的圖片尺寸為32 × 32 , 而MNIST 的圖片尺寸為28 × 28 ,比MNIST 稍大。
- (3)、相比于手寫字符, CIFAR-10 含有的是現實世界中真實的物體,不僅噪聲很大,而且物體的比例、特征都不盡相同,這為識別帶來很大困難。直接的線性模型如Softmax 在CIFAR-10 上表現得很差。
?
2、TensorFlow 官方示例的CIFAR-10 代碼文件
?
3、CIFAR-10 數據集的數據文件名及用途
? ? ?在CIFAR-10 數據集中,文件data_batch_1.bin、data_batch_2.bin 、··data_batch_5.bin 和test_ batch.bin 中各有10000 個樣本。一個樣本由3073 個字節組成,第一個字節為標簽label ,剩下3072 個字節為圖像數據。樣本和樣本之間沒高多余的字節分割, 因此這幾個二進制文件的大小都是30730000 字節。
| 文件名 | 文件用途 |
| batches.meta. bet | 文件存儲了每個類別的英文名稱。可以用記事本或其他文本文件閱讀器打開瀏覽查看 |
| data batch I.bin 、 data batch 2.bm 、 …… data batch 5.bin | 這5 個文件是CIFAR- 10 數據集中的訓練數據。每個文件以二進制格式存儲了10000 張32 × 32 的彩色圖像和這些圖像對應的類別標簽。一共50000 張訓練圖像 |
| test batch.bin | 這個文件存儲的是測試圖像和測試圖像的標簽。一共10000 張 |
| readme.html | 數據集介紹文件 |
?
CIFAR-10下載
1、下載CIFAR-10 數據集的全部數據
FLAGS = tf.app.flags.FLAGS cifar10.maybe_download_and_extract() >> Downloading cifar-10-binary.tar.gz 0.0% …… >> Downloading cifar-10-binary.tar.gz 0.0% >> Downloading cifar-10-binary.tar.gz 0.1% …… >> Downloading cifar-10-binary.tar.gz 0.1% >> Downloading cifar-10-binary.tar.gz 0.2% …… >> Downloading cifar-10-binary.tar.gz 0.2% >> Downloading cifar-10-binary.tar.gz 0.3% …… >> Downloading cifar-10-binary.tar.gz 98.9% …… >> Downloading cifar-10-binary.tar.gz 99.0% …… >> Downloading cifar-10-binary.tar.gz 100.0% Successfully downloaded cifar-10-binary.tar.gz 170052171 bytes.?
CIFAR-10使用方法
1、使用TF讀取CIFAR-10 數據
- (1)、用tf.train.string_ input producer 建立隊列。
- (2)、通過reader.read 讀數據。一個文件就是一張圖片,因此用的reader 是tf.WholeFileReader()。CIFAR-10 數據是以固定字節存在文件中的,一個文件中含再多個樣本,因此不能使用tf. WholeFileReader (),而是用tf.FixedLengthRecordReader() 。
- (3)、調用tf. train . start_ queue_ runners 。
- (4)、最后,通過sess.run()取出圖片結果。
?
?
相關文章
TF:利用TF讀取數據操作,將CIFAR-10 數據集中的訓練圖片讀取出來,并保存為.jpg 格式
?
?
總結
以上是生活随笔為你收集整理的Dataset之CIFAR-10:CIFAR-10数据集简介、下载、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: TF:基于CNN(2+1)实现MNIST
- 下一篇: TF学习——TF数据读取:TensorF