日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

attention的query、key和value的理解

發布時間:2025/4/5 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 attention的query、key和value的理解 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

attention是干什么用的?解決什么問題?

我們如果使用傳統的窗口分割數據的方法,那么我們很難讓每個窗口都有全局的信息,實際上每個窗口只有自己的那部分信息其他部分的信息其實這個窗口是沒有的。
為了讓這個點又具有當前窗口的信息也具有全局的信息,這里就要求我們在這里融入其他部分的信息,這就是注意力機制提出的背景驅動。

query和key的理解

可以看到我們是想把其他部分的信息融合到當前這個窗口當中,但是這個融合不可以是簡單的加和,是需要一個權重,這就是我們需要使用query和key的原因。
這哥倆的作用就是生成一個權重的情況,這里想要完全的了解這個東西為什么叫這個東西,我們還得想一下誰起的這個名字的了,也就是谷歌,這個大哥主要是搞搜索的(雖然他現在搜索只是一小部分業務,但是這個東西畢竟是起家的行當嘛)這個例的query其實就是查詢,而key則是被比對的項。
這倆相乘其實得到的是一個向量的點積,這個點積其實反映的是兩個是不是十分相似,而這個相似與否,則可以理解乘是不是相關的問題。
所以這個最終的結果就是我們通過這個乘算之后過softmax得到一個權重,這個權重其實是兩者的cos相似度,之后通過這個cos相似度,當成相關性給原來的數據融入資源。

但是為什么我們看到的都是直接矩陣乘法乘在一起的?

我們先針對單個query進行理解:
其實只是單個query和全部的key(包括這個query本身)求相似度,之后通過這個相似度將value(對應每個key)融入到這個query當中。

然后我們對這個內容進行并行化:
也就得到了softmax(q×k)×v的形式
這個推算的過程之后會補充。

總結

以上是生活随笔為你收集整理的attention的query、key和value的理解的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。