當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

FCN训练自己的数据集及测试

發布時間：2024/9/21 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了 FCN训练自己的数据集及测试小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1 默認caffe已配置好，直接下載FCN網絡模型

https://github.com/shelhamer/fcn.berkeleyvision.org

將模型文件放到caffe-master路徑下

2 打開其中一個文件夾voc-fcn8s

3 放置好模型，現在就是配置相關路徑

caffemodel-url中是訓練之前預加載的權值模型的下載地址，打開這個文件，并下載這個模型
deploy.protptxt是訓練好模型之后，進行圖片預測的網絡模型
net.py是生成網絡模型的文件，暫時用不到
solve.py和solve.prototxt是網絡訓練之前一些數據路徑和參數的設置
train.prototxt和val.prototxt不用說了，一個是訓練模型，一個是訓練過程中測試的模型
好下面開始修路徑，打開solve.py，修改如下圖所示：

見圖中畫框的部分，第一個框是加載你python與caffe的接口部分路徑，第二個框是你下載的訓練之前的權值模型，第三個框是不用解釋，至于第四個框是你的訓練數據data里面的一個路徑，至于segvalid11.txt這個文件你可能沒有，沒有關系后面給出。還有就是注釋了一條caffe.set_device(int(sys.argv[1]))!!!!
注：如果不想用已有model進行fine-tune,注釋掉19行solver.net.copy_from(weights)，后面還需要根據你分的類數進行prototxt文件的修改，這個后面會提到。
修改完這個文件，打開solver.prototxt,修改如下：

第一個框不用說是什么路徑很明顯，第二個框是你訓練時保存的模型地址。其中參數：、
test_iter是測試時，一次會測試多少張圖片
display是訓練多少次，終端中展示一次loss值
max_iter是訓練最多多少次（但是似乎這里不管用，前面solver.py里面那個才循環是關鍵，有興趣的自己可以看看）
snapshot是訓練到多少次保存一次
其他參數，見> http://blog.csdn.net/q6324266/article/details/52451088
這個設置完成之后，就差最后一步路徑設置了打開train.prototxt:

修改路徑到dataset的位置，這個dataset就是我們構建的訓練集，后面詳細介紹
同理打開val.prototxt，修改路徑同train.prototxt。
注：這里介紹一下param_str這一行，這里面有4個參數（sbdd_dir,seed,split,mean）,sbdd_dir為數據集的路徑（train.prototxt和val.prototxt的這一參數一樣，因我們把訓練集和測試集都放到這一路徑下），split為生成的txt文件名（訓練集生成一個，測試集生成一個）。其他參數還沒有仔細研究

4 開始訓練

配置路徑之后，在終端中cd到caffe-master目錄下，運行sudo python fcn.berkeleyvision.org-master/voc-fcn8s/solve.py 即可開始訓練，如果出現什么問題，不要緊張，根據提示，一步步修改，一般問題不大。

上面基本按照博主supe_king的步驟來進行

http://blog.csdn.net/supe_king/article/details/54142973

關于自己訓練集的設置也是參照supe_king的步驟來做

http://blog.csdn.net/supe_king/article/details/58121993

我們的數據集都是使用的原圖片，沒有轉化為mat等其他格式的文件，但原FCN模型中程序設置為需要輸入mat文件，所以我們對其進行修改
我們先打開fcn下voc_layers.py這個文件，里面我們可以看到 class VOCSegDataLayer(caffe.Layer)：和 class SBDDSegDataLayer(caffe.Layer) 這兩個類，第一個是測試時數據輸入調用的python類，第二個是訓練時數據輸入調用的python類。而這類里面，分別是對輸入數據的一些預處理操作。
我們只要進入class VOCSegDataLayer(caffe.Layer)這個類，copy出def load_label(self, idx):這個函數，

將其復制到class SBDDSegDataLayer(caffe.Layer)類下，并注釋調原代碼，并修改voc_dir為sbdd_dir
這下就直接讀取圖像文件而不用轉換成mat了。
然后就是修改路徑了，

根據每個人的情況修改SegmentationClass這個路徑，大家可以看到其前后各有兩個{}，這個就是傳遞參數的意思，將后面的self.vocdir和idx分別傳遞到前面兩個{}中，idx為圖片名稱，根據生成的txt來讀取。
××前面講的更改prototxt文件，看你分幾類，我這邊是分的兩類，把里面后幾層num_output輸出改為2即可。（如果需要用已有模型fine-tune的話再改num_output為2的所在層的名字就可以了）

5 測試

測試代碼在fcn.berkeleyvision.org-master文件下的infer.pyimport numpy as npfrom PIL import Imageimport matplotlib.pyplot as pltimport caffe# load image, switch to BGR, subtract mean, and make dims C x H x W for Caffeim = Image.open('data/skin/val/ISIC_0000001.jpg')in_ = np.array(im, dtype=np.float32)in_ = in_[:,:,::-1]in_ -= np.array((104.00698793,116.66876762,122.67891434))in_ = in_.transpose((2,0,1))# load netnet = caffe.Net('voc-fcn32s/deploy.prototxt', 'voc-fcn32s/model_2/_iter_10000.caffemodel', caffe.TEST)# shape for input (data blob is N x C x H x W), set datanet.blobs['data'].reshape(1, *in_.shape)net.blobs['data'].data[...] = in_ #read image# run net and take argmax for predictionnet.forward() #in forward NNout = net.blobs['score'].data[0].argmax(axis=0) #imageprint net.blobs['score'].data[0].shapeprint net.blobs['score'].data[0].argmax(axis=0)print out.shapeplt.imshow(out,cmap='gray');plt.axis('off')#plt.savefig('test.png')plt.show()

我在里面加了幾行代碼，用于輸出分割的圖片。（我現在可能參數設置的有問題，或者時數據集的原因，訓練的不好，我也在找問題，不過大家至此可以將FCN跑起來了）

總結

以上是生活随笔為你收集整理的FCN训练自己的数据集及测试的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：训练FCN时遇到的问题总结
下一篇： FCN 学习: Semantic Seg