SuperPoint学习训练纪录 盘点各种报错解决方法(二)
之前介紹了原版SuperPoint,可惜原版沒有公開訓練代碼,接下來看一個復現版本。
為了成功運行這個版本,反復配置無數遍,建議大家就跟著我的方法來,一次就成功。
運行成功,cuda cudnn tensorflow-gpu 版本和之間的版本對應十分重要,配置有點不對,后面各種問題。
????配置方法來源
1.配置虛擬安裝環境
首先安裝anaconda,用來配置虛擬環境,我用的3.5.3版本,我是系統是ubuntu18.04。
?下載后終端命令安裝(一路回車,yes,問到vscode,填no,安裝完成。)
bash Anaconda3-5.3.0-Linux-x86_64.sh安裝完成后創造一個python=3.6的環境(3.7遇到tf1.12無法安裝的錯)
conda create --name superpoint python=3.62.開始superpoint環境配置
別用pip配TensorFlow 然后conda配cuda cudnn 那樣版本都需要自己控制,非常容易出問題。用conda配TensorFlow,conda會適配cuda cudnn。
conda install tensorflow-gpu=1.12安裝完畢用 查看一下配置
conda list?可以看見cuda cudnn都安裝好了 分別是10.0 和 7.6.5?
由于已經安裝了TensorFlow-gpu 則在編譯源碼前需要在requirement.txt中去掉TensorFlow-gpu
打開SuperPoint/requirement.txt 去掉第一行的TensorFlow==1.12
?然后開始安裝源碼,在Superpont目錄下。
make install?3.配置完畢 盤點我遇到的小部分報錯
Check failed: h != kInvalidChunkHandle??TensorFlow版本問題? 1.12改1.13。
load without loader? ?yaml.load掉了參數 改為config = yaml.load(f,Loader=yaml.FullLoader)
大概是input axle 0 ?200,shape must(50,150,0) 調用兩個以上gpu訓練就會遇到,建議就兩個來。
scores has incompatible shape? ? ? tf? cuda cudnn? 之間的版本錯誤
Check failed: cusolverDnCreate(&cusolver_dn_handle) == CUSOLVER_STATUS_SUCCESS Failed to create cuSolverDN instance?? ?終端運行export TF_FORCE_GPU_ALLOW_GROWTH=true
OP_REQUIRES failed at cholesky_op.cc:154 : Internal: tensorflow/core/kernels/cuda_solvers.cc:375: cuSolverDN call failed with status =7? ?tf? cuda cudnn? 之間的版本錯誤
總結
以上是生活随笔為你收集整理的SuperPoint学习训练纪录 盘点各种报错解决方法(二)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Sennedjem古埃及匠人的水壶
- 下一篇: 1019.礼物