AR设备单目视觉惯导SLAM算法综述与评价
點云PCL免費知識星球,點云論文速讀。
標題:Survey and evaluation of monocular visual-inertial SLAM algorithms for augmented reality
作者:Jinyu LI, Bangbang YANG, Danpeng CHEN, Nan WANG, Guofeng ZHANG1
編譯:particle
歡迎各位加入免費知識星球,獲取PDF論文,歡迎轉發朋友圈分享快樂。
摘要
盡管VSLAM/VI-SLAM已經取得了巨大的成功,但是由于缺乏合適的標準的基準,從增強現實的角度定量評估各種SLAM系統的定位結果仍然困難。實際中的AR應用,由于用戶可能不小心移動了AR設備,并且實際環境可能相當復雜,因此很容易遇到各種具有挑戰性的場景(例如快速運動、強旋轉、嚴重的運動模糊、動態干擾等)。此外,AR應用應盡量減少圖像跟蹤丟失的頻率,并能夠從故障的丟失狀態中快速準確地恢復,以獲得良好的AR體驗。現有的SLAM數據集通常只提供姿態精度的評估,而且它們的相機運動很簡單,不適合常見的移動AR應用場景。基于上述情況,我們建立了一個新的視覺慣性數據集和一系列AR的評價標準,并對現有的單目VSLAM/VI-SLAM方法進行了詳細的分析和比較。特別是選擇了8種具有代表性的單目VSLAM/VI-SLAM方法/系統,并在我們的基準上對它們進行了定量評價。我們的數據集、樣本代碼和相應的評估工具可以在網站找到: http://www.zjucvg.net/eval-vislam/.
主要內容
文章開始介紹了視覺SLAM以及VI-SLAM的基本理論,并且最終將兩種的SLAM都歸結為優化方程,比如視覺SLAM總結為優化相機位姿以及三維特征點的函數
這種優化稱為捆集調整(BA)[1],即SfM和VSLAM的核心模塊。
對于單目慣性SLAM,通過IMU的數據來恢復和優化單目SLAM中的絕對尺度問題,所以VI-SLAM結合了視覺測量和慣性測量的方式,可視為是VSLAM的擴展方法。所以VISLAM中的BA函數定義為:
接下來文章將著重介紹AR應用中的各種SLAM方案,并進行對比與評價。眾所周知,SLAM系統可以通過濾波或優化來求解狀態?;诖说腟LAM方法可以分為基于濾波的方法和基于優化的方法。并且用于圖像跟蹤的前端部分也不盡相同。一些方法利用關鍵點匹配來優化重投影誤差。也有一些方法直接使用圖像像素最小化光度誤差。這里將介紹一些有代表性的單目VSLAM/VI-SLAM方法。
基于濾波的SLAM
MonoSLAM是最早的單目VSLAM系統之一。由于它使用擴展卡爾曼濾波器來解決相機姿態問題,所以它是一個基于濾波的SLAM系統。對于Kalman更新步驟,所使用的觀測值是標準針孔模型的重投影
基于優化的SLAM
基于濾波的SLAM系統不可避免地存在累積誤差。據調查,基于優化的SLAM方法比基于濾波的方法具有更高的精度[2],首先介紹基于關鍵幀優化方法的PTAM,然后介紹了在PTAM之后的ORB-SLAM,它將圖像跟蹤、局部地圖維護和回環檢測放在三個線程中,在整個系統中使用ORB特征來提高系統的健壯性。ORB-SLAM使用了兩種初始化的方式:單應矩陣模型和極線約束模型,并選擇最佳模型初始化前兩個關鍵幀。所以當有足夠的運動時,系統會自動初始化。ORB-SLAM的開源激發了許多新的作品,包括基于慣性的ORB-SLAM.
OKVIS是設計用于融合慣性測量VI-SLAM系統,OKVIS的核心優化問題是一個既有重投影誤差又有IMU運動誤差的滑動窗口優化問題。而VINS Mono是一個強大的視覺慣性SLAM系統。與ORB-SLAM相比,它有許多新的亮點,擁有穩健的初始化與尺度估計。
基于直接法的SLAM
以上介紹的SLAM前端需要提取特征點,可以概括為特征點法的SLAM,直接法一般是求解最小化圖像的光度誤差作為SLAM的前端。直接法和間接法各有利弊。在大多數情況下,特征點法對幾何噪聲(如鏡頭畸變或卷簾效應)更為穩健,而直接法對幾何噪聲可能敏感。另一方面,直接方法對光度噪聲更為魯棒,因為使用了具有強度梯度的所有圖像區域(邊緣、無特征的墻等)。具有代表性的是DSO(Direct Sparse Odometry)
接下來主要就是介紹基于視覺與慣導的數據的采集以及對采集硬件的介紹,并且與常見的開源數據及進行了對比,同時也介紹了一些相機與IMU對齊和標定的工作。
并且文章介紹到使用了安卓和IOS設備采集各種場景的數據。并將數據集應用到以上的8中SLAM方案中,從跟蹤精度,包括絕對誤差、相對誤差等進行比對,初始化的質量與快慢,以及跟蹤的魯棒性,重定位的耗時等方面進行評價和對比
實驗結果
采集場景的介紹
VI-SLAM的跟蹤精度的對比
初始化的時間對比
重定位的耗時對比
總結
現有的單目VSLAM和VI-SLAM方法,選擇了8個有代表性的系統對我們的基準進行定量評估。雖然我們的視覺慣性數據是由手機采集的,但是評估仍然是在PC機上進行的,由于PC機的計算能力遠遠大于手機,所以SLAM結果不能真實反映手機上的實際SLAM效果。實際上,許多SLAM系統不能在手機上實時運行。PTAM和VINS Mono的移動版本已經上市。SenseSLAM是專門為移動AR開發的,能夠在移動手機上實時跟蹤。
由于文章的篇幅限制,有興趣可以查看文章主頁http://www.zjucvg.net/eval-vislam/,查看論文《Survey and evaluation of monocular visual-inertial SLAM algorithms for augmented reality》
參考文獻
【1】Triggs B, McLauchlan P F, Hartley R I, Fitzgibbon A W. Bundle Adjustment—A Modern Synthesis. Vision Algorithms: Theory and Practice. Berlin, Heidelberg: Springer Berlin Heidelberg, 2000: 298-372
【2】Strasdat H, Montiel J M M, Davison A J. Visual SLAM: why filter? Image and Vision Computing, 2012, 30(2): 65–77
如果你對本文感興趣,請點擊“原文閱讀”獲取知識星球二維碼,務必按照“姓名+學校/公司+研究方向”備注加入免費知識星球,免費下載pdf文檔,和更多熱愛分享的小伙伴一起交流吧!
總結
以上是生活随笔為你收集整理的AR设备单目视觉惯导SLAM算法综述与评价的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: PCL common中常见的基础功能函数
- 下一篇: 【开源方案共享】ORB-SLAM3开源啦