日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

invalid floating point operation什么意思_Point-MVSNet:基于多视角的点云重建网络

發布時間:2023/12/20 编程问答 23 豆豆
生活随笔 收集整理的這篇文章主要介紹了 invalid floating point operation什么意思_Point-MVSNet:基于多视角的点云重建网络 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Point-Based Multi-View Stereo Network是一篇點云重建領域的文章,其工作內容為通過輸入多張不同角度的圖片,提取不同的點云特征,再進行融合,從而生成最終的點云。

1.介紹

Point-MVSNet的大致流程如下:

  • 首先生成一個粗略的深度圖(通過MVSNet,這是另一篇文章提出的網絡結構,不過它是通過cost volume的方式進行重建的)。
  • 然后把深度圖轉換為點云,再通過事先生成的深度圖與ground truth之間的差值,通過迭代的方式進一步優化點云。
  • Point-MVSNet的亮點為,該網絡把3D幾何先驗知識和2D紋理信息融合到一個叫做特征增強點云中(feature-augmented point cloud),然后在為每一個點估計它的3D flow(什么是3D flow,難道是一個點的3D屬性的抽象表示???)

    2.方法

    粗略深度圖預測

    論文采用MVSNet模型來生成一個粗略的深度圖。通過給予MVSNet圖片和相關的相機參數,MVSNet生成一個3D cost volume(代價塊),所謂代價塊,是指每一個像素其實都有一個代價值,這個代價是通過代價聚合(cost aggregation)的方式計算來的,假想此處有一個WxHxD的三維矩陣,W和H分別是圖像的寬高,D是深度范圍(一般這個D都是在實驗中,假定的一個范圍比如5-10之類的),這個三維矩陣的每一個值都是一個像素點在不同深度值下的代價,如果說某一個像素點在

    的深度值下,它的代價最小,那么就取 作為該像素點的深度值,每一個像素點的深度值確定了之后,這張圖片的深度圖也就確定了。

    2D-3D特征融合

    在網絡里面使用的點特征是由從多尺度條件下提取出來的圖像2D特征和歸一化的3D坐標組成的,這就是所謂的2D-3D特征融合。

    這里的2D特征就是通過卷積網絡金字塔結構,提取出多尺度的圖像特征,賦予每個點更大的感受野和上下文信息,一張圖片

    的2D特征就是 ,這些不同尺度下的特征圖是需要融合在一起,再去和坐標信息融合的。而且這里還不止一張圖片,是不同角度的多張圖片,每一張圖片還提取出了多尺度的特征圖,融合不同角度的圖像特征使,需要用到不同角度的相機參數,這樣才能把特征圖wrap到一個統一的方向(就是一些旋轉矩陣和平移向量組成的相機外參以及相機內參,再和特征圖做矩陣乘法)。多張圖片在同一個尺度下的特征融合公式如下:

    。j代表了不同尺度。

    然后再和點云的坐標位置進行融合,公式如下:

    文中提到的動態特征提取的意思就是,得出來的

    輸入到point flow中,得到深度殘差,然后這個深度殘差往回輸入到點云中,進一步更新點云的位置,然后再通過更新后的點云輸入到point flow得到深度殘差。這個過程文中迭代了兩次。

    PointFlow

    PointFlow是論文中的核心模塊,工作內容為為unprojected point點(通過深度圖外加相機參數,通過非映射的方式生成的點)生成一系列假設點,利用這些點構造出一個有向圖,在進行邊卷積進一步提取鄰域特征。然后經過MLP判斷unprojected point的偏移位置,偏移向量由各假設點帶權平均得到。

    假設點的生成(Point Hypothesis Generation)

    對每一個unprojected point都會沿著參考相機的方向生成一系列不同偏移的點(就是在投影出來的點的前前后后生成一些點)。公式如下:

    代表參考相機的方向, 代表偏移距離。最后會有2m+1個假設點。邊卷積(Edge Convolution)

    如上圖所示,論文通過KNN的方法生成一個有向圖。邊卷積可以先簡單理解為提取出邊的特征(后面研究DGCNN的時候再做詳細記錄)。

    是一個可學習的非線性函數, 是一個逐渠道的對稱聚合操作(對稱操作主要是max pooling、average pooling和weighted sum等方法,可以把多個特征聚合到一起,所謂對稱是指輸入的順序并不影響結果)。

    如上圖所示,邊卷積過后的點云跳連接到一起。

    Flow Prediction

    如上圖所示,Point Flow輸入增強點云,輸出深度殘差圖。內部使用了三個EdgeConv層來聚合不用尺度下的點特征(特征金字塔剛好也是3層),再通過快連接把EdgeConv的結果組合成一個局部點特征。最后通過MLP來轉換點特征,輸出每一個unprojected point在假設點上的概率值,最終的unprojected point的偏移是由每一個假設點帶權平均得到的。

    Training loss

    損失函數的公式如下所示:

    代表迭代次數

    總結

    以上是生活随笔為你收集整理的invalid floating point operation什么意思_Point-MVSNet:基于多视角的点云重建网络的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。