日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

EMA(指数移动平均)及其深度学习应用

發布時間:2024/3/12 pytorch 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 EMA(指数移动平均)及其深度学习应用 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

在深度學習中,經常會使用EMA(指數移動平均)這個方法對模型的參數做平均,以提高測試指標并增加模型魯棒。

1.基于數學的介紹

1.1 公式例子

我們有關于“溫度-天數”的數據

:在第t天的溫度。

:第t天的移動平均數。

:權重參數。

圖中紅線即是藍色數據點的指數移動平均。

1.2? 和 之間的關系

大概表示前天的平均數據。(以第天做參考)

如:

大概表示前10天的平均數據

紅線

大概表示前50天的平均數據

綠線

大概表示前2天的平均數據

黃線

那么越大,表示考慮的時間長度越長。

1.3 進一步理解

當,從往回寫

? ...

迭代代入, … 得:

由此可知:

1.是的加權求和

2. 𝜃?前的系數相加起來為?1?或者逼近?1

當某項系數小于峰值系數(𝟏?𝜷)𝟏/𝒆時,我們可以忽略它的影響

(0.9)^10 ~= 0.34 ~= 1/e 所以當β=0.9時,相當于前10天的加權平均。

(0.98)^50 ~= 0.36 ~= 1/e 所以當β=0.98時,相當于前50天的加權平均。

(0.5)^2 ~= 0.25 ~= 1/e 所以當β=0.5時,相當于前2天的加權平均。

2.在深度學習模型中的應用

:在第t次更新得到的所有參數權重。

:第t次更新的所有參數移動平均數。

:權重參數。

2.1 為啥EMA會有用

對于更新n次時普通的參數權重? ?(為第n次傳播得到的梯度):

對于更新n次時使用EMA的參數權重?(此式中α為上面提到的參數β):

代入表達式,并且令得:

對比兩式:

普通的參數權重相當于一直累積更新整個訓練過程的梯度,使用EMA的參數權重相當于使用訓練過程梯度的加權平均(剛開始的梯度權值很小)。由于剛開始訓練不穩定,得到的梯度給更小的權值更為合理,所以EMA會有效。

3.Pytorch實現EMA類

4.biggan實現的EMA

總結

以上是生活随笔為你收集整理的EMA(指数移动平均)及其深度学习应用的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。