FCN训练自己的数据集及测试
1 默認caffe已配置好,直接下載FCN網絡模型
https://github.com/shelhamer/fcn.berkeleyvision.org
將模型文件放到caffe-master路徑下
2 打開其中一個文件夾voc-fcn8s
3 放置好模型,現在就是配置相關路徑
caffemodel-url中是訓練之前預加載的權值模型的下載地址,打開這個文件,并下載這個模型
deploy.protptxt是訓練好模型之后,進行圖片預測的網絡模型
net.py是生成網絡模型的文件,暫時用不到
solve.py和solve.prototxt是網絡訓練之前一些數據路徑和參數的設置
train.prototxt和val.prototxt不用說了,一個是訓練模型,一個是訓練過程中測試的模型
好下面開始修路徑,打開solve.py,修改如下圖所示:
見圖中畫框的部分,第一個框是加載你python與caffe的接口部分路徑,第二個框是你下載的訓練之前的權值模型,第三個框是不用解釋,至于第四個框是你的訓練數據data里面的一個路徑,至于segvalid11.txt這個文件你可能沒有,沒有關系后面給出。還有就是注釋了一條caffe.set_device(int(sys.argv[1]))!!!!
注:如果不想用已有model進行fine-tune,注釋掉19行solver.net.copy_from(weights),后面還需要根據你分的類數進行prototxt文件的修改,這個后面會提到。
修改完這個文件,打開solver.prototxt,修改如下:
第一個框不用說是什么路徑很明顯,第二個框是你訓練時保存的模型地址。其中參數:、
test_iter是測試時,一次會測試多少張圖片
display是訓練多少次,終端中展示一次loss值
max_iter是訓練最多多少次(但是似乎這里不管用,前面solver.py里面那個才循環是關鍵,有興趣的自己可以看看)
snapshot是訓練到多少次保存一次
其他參數,見> http://blog.csdn.net/q6324266/article/details/52451088
這個設置完成之后,就差最后一步路徑設置了 打開train.prototxt:
修改路徑到dataset的位置,這個dataset就是我們構建的訓練集,后面詳細介紹
同理打開val.prototxt,修改路徑同train.prototxt。
注:這里介紹一下param_str這一行,這里面有4個參數(sbdd_dir,seed,split,mean),sbdd_dir為數據集的路徑(train.prototxt和val.prototxt的這一參數一樣,因我們把訓練集和測試集都放到這一路徑下),split為生成的txt文件名(訓練集生成一個,測試集生成一個)。其他參數還沒有仔細研究
4 開始訓練
配置路徑之后,在終端中cd到caffe-master目錄下,運行sudo python fcn.berkeleyvision.org-master/voc-fcn8s/solve.py 即可開始訓練,如果出現什么問題,不要緊張,根據提示,一步步修改,一般問題不大。
上面基本按照博主supe_king的步驟來進行
http://blog.csdn.net/supe_king/article/details/54142973
關于自己訓練集的設置也是參照supe_king的步驟來做
http://blog.csdn.net/supe_king/article/details/58121993
我們的數據集都是使用的原圖片,沒有轉化為mat等其他格式的文件,但原FCN模型中程序設置為需要輸入mat文件,所以我們對其進行修改
我們先打開fcn下voc_layers.py這個文件,里面我們可以看到 class VOCSegDataLayer(caffe.Layer):和 class SBDDSegDataLayer(caffe.Layer) 這兩個類,第一個是測試時數據輸入調用的python類,第二個是訓練時數據輸入調用的python類。而這類里面,分別是對輸入數據的一些預處理操作。
我們只要進入class VOCSegDataLayer(caffe.Layer)這個類,copy出def load_label(self, idx):這個函數,
將其復制到class SBDDSegDataLayer(caffe.Layer)類下,并注釋調原代碼,并修改voc_dir為sbdd_dir
這下就直接讀取圖像文件而不用轉換成mat了。
然后就是修改路徑了,
根據每個人的情況修改SegmentationClass這個路徑,大家可以看到其前后各有兩個{},這個就是傳遞參數的意思,將后面的self.vocdir和idx分別傳遞到前面兩個{}中,idx為圖片名稱,根據生成的txt來讀取。
××前面講的更改prototxt文件,看你分幾類,我這邊是分的兩類,把里面后幾層num_output輸出改為2即可。(如果需要用已有模型fine-tune的話再改num_output為2的所在層的名字就可以了)
5 測試
測試代碼在fcn.berkeleyvision.org-master文件下的infer.pyimport numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltimport caffe# load image, switch to BGR, subtract mean, and make dims C x H x W for Caffeim = Image.open('data/skin/val/ISIC_0000001.jpg')in_ = np.array(im, dtype=np.float32)in_ = in_[:,:,::-1]in_ -= np.array((104.00698793,116.66876762,122.67891434))in_ = in_.transpose((2,0,1))# load netnet = caffe.Net('voc-fcn32s/deploy.prototxt', 'voc-fcn32s/model_2/_iter_10000.caffemodel', caffe.TEST)# shape for input (data blob is N x C x H x W), set datanet.blobs['data'].reshape(1, *in_.shape)net.blobs['data'].data[...] = in_ #read image# run net and take argmax for predictionnet.forward() #in forward NNout = net.blobs['score'].data[0].argmax(axis=0) #imageprint net.blobs['score'].data[0].shapeprint net.blobs['score'].data[0].argmax(axis=0)print out.shapeplt.imshow(out,cmap='gray');plt.axis('off')#plt.savefig('test.png')plt.show()
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
我在里面加了幾行代碼,用于輸出分割的圖片。(我現在可能參數設置的有問題,或者時數據集的原因,訓練的不好,我也在找問題,不過大家至此可以將FCN跑起來了)
總結
以上是生活随笔為你收集整理的FCN训练自己的数据集及测试的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 训练FCN时遇到的问题总结
- 下一篇: FCN 学习: Semantic Seg