日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

李宏毅 Attention

發布時間:2023/12/8 编程问答 28 豆豆
生活随笔 收集整理的這篇文章主要介紹了 李宏毅 Attention 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

?考慮整個 sequence?長度的內容

可以多層 self attention?疊加 attention is all you need

1, dafada

alpha? : attention score?代表兩個輸入的關聯性

?

b1~b4?并行產生

?

?

?

?

?Muti-head self attention

?

?

Positional Encoding

No position information in self attention

each position has a unique position vector e^i

?

?Truncated self attention?并不需要看整句話,只需要考慮小范圍數據,加快訓練速度

self attention?適用于輸入為 vector set

影像也可以看成一個 vector set ,每一個pixel?都可以看成一個vector

?

CNN是簡化版的 self attention,?CNN相對是小的 model?適合數據集小的情況

?

CNN?的model小,彈性小,適合數據比較小的情況?

?

self attention?比?RNN更?平行處理輸入數據,運算速度更快

很多架構從?RNN改成 self attention?

?self attention?變形很多,?運算量非常大

?

?

總結

以上是生活随笔為你收集整理的李宏毅 Attention的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。