Learning Less is More – 6D Camera Localization via 3D Surface Regression
在Python滿天飛, tensorflow橫行的DL界, 遇到好久不見的開源C++ Project簡直是一股清流...................
Proj:https://hci.iwr.uni-heidelberg.de/vislearn/research/scene-understanding/pose-estimation/
Git:https://github.com/vislearn/LessMore
?
Key Point:? differentable? RANSAC
?
Learning Less Is More - 6D Camera Localization via 3D Surface Regression
本文由德國海德堡大學完成,跟上面介紹的 MapNet 一樣,也是研究從單張圖像恢復相機 6DOF 位姿的問題。在目前主流的基于深度學習進行相機 6DOF 定位的方法中,一般都采用端到端地學習整個相機定位的過程或者用學習相機定位的大部分流程。這篇文章與其它方法不太一樣,作者認為,其實只需要學習相機定位中的一個模塊便足夠做到精準的定位。基于作者之前的 CVPR 2017 的可導 RANSAC 方法,作者提出了一種用全連接神經網絡來稠密擬合“場景坐標”的方法,建立輸入彩色圖像和三維場景空間的聯系。“場景坐標”是指將圖像中的局部塊映射到三維空間中三維點,從而得到局部塊的坐標。由于局部塊具有相對比較穩定的外觀,即對視角變化不太敏感,使得對齊圖像和三維模型比較容易。作者提出的這種方法具有高效、精確、訓練魯棒、泛化能力強等優點,其在室內和室外的數據集上都一致地比當前領先的技術要好。最后值得一提的是,這種方法在訓練的時候不需要利用一個已知的三維場景模型,因為訓練的時候可以自動地從單目視覺約束中學習到這個三維場景的幾何信息。從論文中描述的在 7Scenes 數據集上的性能來看,本篇論文的方法的精度比MapNet 方法的精度要高出不少。
Our method scales to large outdoor scenes but fails on city-scale scenes like the challenging Cambridge Street scene [11]. In the future, we could pair our system with an image retrieval approach as proposed in [21].
文章闡述,在應用大場景中,此種方法是失敗的.預期在后期引入圖像檢索的方法;
?
總結
以上是生活随笔為你收集整理的Learning Less is More – 6D Camera Localization via 3D Surface Regression的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 优美网络游戏女角色名字,游戏名字550个
- 下一篇: 老婆我爱你的说说218个