日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Attention技术应用的最新进展概述

發布時間:2025/3/8 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Attention技术应用的最新进展概述 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

來源:https://zhuanlan.zhihu.com/

p/130388873

作者:一塊小蛋糕
編輯:深度傳送門

本文主要總結了最新的關于attention的應用文章。

Attention-based Dropout Layer for Weakly Supervised Object Localization(CVPR19)

任務:弱監督的物體定位:只給定圖像類別的標簽,要求定位出目標所在的區域。

動機:只給定物體類別的話,網絡往往只關注最具有判別性的信息,無法挖掘到整個物體信息。能否設計一種drop操作,每次迭代時drop最具判別性的信息,強迫網絡關注其他的區域?

做法:代替之前采用CAM得到特征的熱力圖,模型使用(channel-wise pooling)直接生成熱力圖。采用一個設定的閾值,得到一個drop mask。

Visual Attention Consistency under Image Transforms for Multi-Label Image Classification (CVPR19)

任務:多標簽圖像分類問題

動機:數據增廣被廣泛用于圖像分類任務,但是數據增廣存在缺陷。圖像的一些變換(如旋轉)應該是比較漸層能學習到的,但是在一般使用數據增廣的策略中,都只是使用最后loss來對這種變換進行學習。能否對數據增廣學到的特征圖進行約束。

方法:采用兩分支結構。輸入原始圖像I和轉換后的圖像T(I),利用CAM得到兩個特征圖的熱力圖,約束I的熱力圖經過T的轉換后與T(I)的熱力圖相同。即圖像數據增廣后仍然關注同樣部件的區域。

AttPool: Towards Hierarchical Feature Representation in Graph Convolutional Networks via Attention Mechanism (ICCV19)

任務:定義了一個graph pooling操作。

方法:對于一個有N個節點的圖(N,D),首先預測每個節點的得分(N),然后選擇前K個節點(K,D),對這K個節點利用全部的N個節點進行更新(GCN)。

問題:和之前的文章Self-Attention Graph Pooling思想和做法很像,加了一步更新操作。

Group-wise Deep Object Co-Segmentation with Co-Attention Recurrent Neural Network (ICCV19)

任務:圖像組間的共有物體的定位。

做法:設計了類似GRU的單元,設定了更新門和重置門,不斷的更新隱單元g,使其融入了所有圖像的信息,然后返回來指導每個圖像的預測生成。

End-to-End Multi-Task Learning with Attention

任務:多任務學習

動機:對于多任務學習,應該有任務共享的特征和任務特定的特征。對于任務共享的特征可以通過在所有任務上學習得到。那么如何得到任務特定的特征呢?

方法:對于每個任務學習一個attention,作為特征選擇器,選擇與該任務相關的特征。

See More, Know More: Unsupervised Video Object Segmentation with Co-Attention Siamese Networks (CVPR19)

任務:無監督的視頻物體分割

做法:提出了一個co-attention模塊,將相鄰幀對齊,并將F1(F2)幀的信息整合到F2(F1)上。

問題:用在視頻reID上,相鄰幀進行對齊后,再進行特征整合。

Improving Referring Expression Grounding with Cross-modal Attention-guided Erasing (CVPR19)

任務:跨模態的檢索。給定一個語句描述,檢索出圖像的那個框是與之對應的。

動機:圖像與語句之中可能存在多個對應關系,但是現有方法往往會過多的關注最具有判別性的對應關系。能否有一種機制,迫使網絡可以關注更多的對應關系。

做法:擦除最具有判別性的語句或者圖像區域。

Cross-Modal Self-Attention Network for Referring Image Segmentation

任務:跨模態分割,給定一個語句描述,分割出圖像對應的物體區域。

做法:設計了一個擴模態的self attention機制,即對于query,key, value融入了圖像特征和語句特征。

Mask-Guided Attention Network for Occluded Pedestrian Detection (ICCV19)

任務:遮擋的行人檢測

做法:遮擋會對行人檢測的性能產生較大的影響。對于特征,生成一個空間mask,mask掉遮擋區域的特征。利用可見的bounding box監督mask的生成。

Looking for the Devil in the Details: Learning Trilinear Attention Sampling Network for Fine-grained Image Recognition (CVPR)

動機:如何自適應地并且無監督的定位出物體各個部件的區域。每個channel可以響應一個特定的物體,但是單個channel的噪聲大。能否整合channel使其可以定位出目標物體

做法:利用self-attention的思想,加強每個channel的特征。X為(C,N)??.此時每個channel可以看做一個空間注意力圖,對應一個指定的部件。

往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯AI基礎下載(pdf更新到25集)機器學習的數學基礎專輯本站qq群1003271085,加入微信群請回復“加群”獲取一折本站知識星球優惠券,復制鏈接直接打開:https://t.zsxq.com/yFQV7am喜歡文章,點個在看

總結

以上是生活随笔為你收集整理的Attention技术应用的最新进展概述的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。