日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

VD-BERT:用BERT搭建统一的视觉对话模型

發布時間:2024/10/8 编程问答 39 豆豆
生活随笔 收集整理的這篇文章主要介紹了 VD-BERT:用BERT搭建统一的视觉对话模型 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

論文標題:

VD-BERT: A Unified Vision and Dialog Transformer with BERT

論文作者:

Yue Wang, Shafiq Joty, Michael R. Lyu, Irwin King, Caiming Xiong, Steven C.H. Hoi

論文鏈接:

https://arxiv.org/abs/2004.13278


視覺對話(Visual Dialog)指的是給定一張圖、它的標題和問題,我們需要給出這個問題的答案,在VD中,對話往往有多輪,而后面的問題會和前面的對話相關。

本文提出統一的視覺對話VD-BERT模型,聯合編碼視覺信息和文本信息,既適用于判別式方法,也適用于生成式方法。VD-BERT在視覺對話數據集VisDial實現了單個模型和集成模型上的最佳效果。

視覺對話

人類感知世界是“多模態”的而非“單模態”,學習知識也是在多模態的條件下進行的。

在所有的感知模態中,視覺和文本(語言),是其中最為重要的兩類,而文本又是人類所獨有的能力。

通過將視覺感知到的內容轉換為文本信息,是我們了解世界的重要途徑。視覺對話任務就是在模擬這個過程。

給定一副圖片(或視頻等視覺內容)和一個問題,我們可以根據圖片內容去回答這個問題。

之后,我們還可以連續問若干問題,每個問題都有回答,如此根據圖片和之前的對話進行下一輪對話,就是視覺對話,而找到每個問題的答案,就是視覺對話的目標。

這可以形式化為:

其中是視覺信息,是視覺信息的說明(如標題),是第輪的問題,是第輪的回答。

有兩種方法可以找到,一是“判別式”——從給定的一些回答候選中選一個,二是“生成式”——直接生成回答。

從上式可以看到,視覺對話實際上有四個部分:視覺信息V,對話歷史H,當前問題Q和當前回答A。

過去對視覺對話的研究大都采用注意力的方法,讓回答A去關注Q,V和H。然而,這種方法不能直接讓V和H之間建立聯系,從而可能忽略過去的對話內容。

基于此,本文提出VD-BERT,用BERT去建模多個部分的聯系,任意兩個部分之間就可以通過自注意力完成交互,從而不丟失歷史對話信息,如下圖所示:

和BERT一樣,本文使用MLM和NSP兩個訓練任務去訓練VD-BERT,然后再通過Rank的方法微調VD-BERT,從而可以使用一個模型同時完成判別式和生成式兩種生成方法。

總的來說,本文貢獻如下:

  • 使用預訓練的BERT作為視覺對話模型,并通過MLM和NSP的訓練得到一個統一模型;

  • 在VisDial數據集上實現了單個模型和集成模型二者的最優結果;

  • 可以同時應用在判別式和生成式兩種生成方法上。

VD-BERT

VD-BERT的結構和流程十分簡單。下圖是VD-BERT的模型結構:

模型流程分為幾步:得到視覺表征,得到文本表征,模型訓練,模型微調。

視覺表征

本文使用Faster R-CNN得到36個對象視覺表征,用于編碼圖片的視覺信息,記為。這些特征將作為BERT的輸入的一部分。

文本表征

為了編碼文本信息并讓其和視覺信息充分結合,本文按照BERT,把歷史對話以[EOT]為分隔符拼接起來,作為VD-BERT的文本部分,從而得到,其中是一個候選回答。

模型訓練

在得到視覺輸入和文本輸入后,把這兩個再拼接起來作為VD-BERT整個的輸入,得到。注意到,我們使用了預訓練的BERT去初始化VD-BERT,讓它得到一些文本的先驗知識。

為了訓練VD-BERT,本文提出兩個,也是BERT所提出的訓練任務:MLM和NSP。MLM和BERT一致,隨機掩碼文本部分15%的詞,讓模型去預測它。

NSP有所不同,VD-BERT所做的是,讓模型的[CLS]去預測當前的候選回答是不是真正的回答,即輸出一個0-1之間的概率。

對于判別式方法,只需要從候選回答集中采樣一些回答,然后再用NSP去預測是否正確即可;對于生成式方法,只需要一步一步預測即可,類似自回歸模型。

模型微調

除了一個回答是否是正確答案之外(0或1),VisDial v1.0還為每個候選答案給出了相關性得分,用于評判每個答案和正確答案之間的語義相關性,得分范圍為0-1之間。于是,VD-BERT就可以使用NSP在此基礎上進一步微調,而在推理的時候,只需要選擇得分最大的那個答案即可。

實驗

本文在視覺對話數據集VisDial v0.9和VisDial v1.0上實驗,使用BERT-base作為VD-BERT骨干,使用Recall@K、MRR、Mean Rank和NDCG作為測評指標,其他實驗細節詳見原文。

下表是在VisDial v1.0上的結果,可以看到,VD-BERT在幾乎所有指標上都超越了之前的模型。

特別注意到,微調的VD-BERT(*)只在NDCG上表現更好,而在其他指標上表現更差,這是因為NDCG衡量的回答的相關度,微調可以提高其表現,但是反而降低了在其他指標上的效果。

下表是在VisDial v0.9上的結果,可以看到,無論是判別式方法還是生成式方法,VD-BERT都能取得一致更好的效果。

下面來看看視覺信息和文本信息的交互情況。從下圖可以看到,文本和圖片中的對象是對應的。motorcycle關注了5和8(都是motorcycle),而he關注了4(人),helmet關注了4和8。

小結

本文提出VD-BERT,使用預訓練的BERT作為統一的視覺對話模型,通過MLM和NSP的訓練,VD-BERT能夠很好建模視覺信息和文本信息及其之間的相互聯系。

VD-BERT簡單有效,不需要任何模型結構設計,也不需要多余的損失函數優化,更不需要額外的標注數據,就能實現SOTA表現。

多模態是近些年發展很快的一個領域,因為和人類獲取信息的過程更接近,多模態能夠更大地推動CV和NLP在現實的應用和落地。更好、更快的多模態模型是未來的一個持續性研究方向。

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關于PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。

總結

以上是生活随笔為你收集整理的VD-BERT:用BERT搭建统一的视觉对话模型的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 欧美一级片观看 | 亚洲日本护士毛茸茸 | 国产精品成人久久 | 美女黄视频在线观看 | 亚洲天堂av免费在线观看 | 帮我拍拍漫画全集免费观看 | 成人在线网址 | 青青草网址 | 好吊日av| 日韩一区二区免费视频 | 久久精品99久久久久久 | 人妻无码中文久久久久专区 | 国产精品一区三区 | 亚洲热在线视频 | 久久亚洲国产成人精品性色 | 91免费视频网站 | 中文字幕在线播放 | 色呦呦视频在线 | 天堂网在线中文 | www.天天综合| 黄色网址在线免费播放 | 国产成人精品一区二区色戒 | 国产精品啪啪啪视频 | 性欧美大战久久久久久久久 | 中文幕无线码中文字夫妻 | 国产伦精品一区二区三区高清版禁 | 岛国中文字幕 | 欧美成人xxx | 亚洲av无码一区二区三区人妖 | 人人干狠狠干 | 日韩精品在线免费观看 | 日本免费在线观看 | 亚洲国产精品18久久久久久 | 人人射av | 天天插伊人| 一级片大全 | 黄色小说图片视频 | 九九精品在线观看 | 欧美激情一区 | 欧美日韩亚洲精品内裤 | 国产精品12 | 波多野在线观看 | 欧美第五页 | 337p日本欧洲亚洲大胆张筱雨 | 中文字幕少妇 | 污污内射在线观看一区二区少妇 | 嫩草影院在线视频 | 一本色道久久综合亚洲精品图片 | 国产又粗又硬又长又爽的演员 | 污污免费观看 | 又黄又爽又色的视频 | 亚洲最新色图 | 亚洲激情久久 | a天堂视频| 九九九在线| 99欧美精品 | 久久久久久久色 | 久久久久国产一区二区 | 婷婷六月在线 | 一区二区欧美视频 | 久久久久久欧美精品se一二三四 | 大胸美女啪啪 | 手机免费av片 | 亚洲国产无线乱码在线观看 | 特级西西444www大精品视频 | 国产美女裸体无遮挡免费视频 | 国产精品国产三级国产Av车上的 | 中文字幕亚洲专区 | aa在线| 天堂在线中文字幕 | 欧美色女人 | 欧美性xxxx | 亚洲一区二区久久久 | 国产精品网址 | 亚洲综合二区 | 大陆av片| 狠狠艹视频| 欧美高清视频 | 国产福利片在线观看 | 国产成人精品一区二区三 | 亚洲国产免费看 | 国产chinese| 国产精品国产三级国产专区53 | 免费成人在线观看视频 | 欧美成人视屏 | 最好看的日本字幕mv视频大全 | 天堂视频在线免费观看 | 西西44rtwww国产精品 | 国产精品99久久久久久久久 | 美女主播福利视频 | 亚洲婷婷在线视频 | 182tv午夜福利在线观看 | 欧美日韩一区二区在线播放 | 国产资源av | 国产乱码一区二区三区在线观看 | 天天看片天天射 | 东北熟女一区二区三区 | 久热精品免费视频 | 亚洲精品国产精品国自产观看浪潮 |