日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋

發布時間:2025/3/21 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.


為什么深度學習很慢?
如果我們利用并行計算,怎樣才能完美的利用大量的processor?
為什么large batch size會引起精度降低?
新優化器
參考:
快速神經網絡的訓練算法 --UC Berkeley博士尤洋
本片文章介紹的兩種算法不僅可以優化并行計算,在普通硬件環境中運行也是有效的。算法是由UC Berkeley博士尤洋開發。在固定精度的情況下,新算法可以更快的達到要求,在固定訓練時間的情況下,可以有更好的精度。
目前深度學習面臨的一個問題是,沒有一個通用的優化器。Adaptive optimizers (Adam/AdaGrad)在ImageNet上面表現就不是很好,這導致現在很多ImageNet都在用Momentum進行優化。反過來Momentum在BERT的訓練上面也表現平平。

為什么深度學習很慢?
現在大部分的算法都是SGD的變形。SGD隨機梯度下降算法:
(Mini-Batch) SGD:
1.Take B data points each iteration (B: batch size)
2.Compute gradients of woeights based on B data points
3.Update the weights: W = W - learning_rate * ▽W

由上圖我們可以看到ResNet50的計算量非常大,而BERT的計算量是ResNet的50倍左右。

如果我們利用并行計算,怎樣才能完美的利用大量的processor?
有三種思路,第一種并行計算神經網絡的層。每臺機器負責運算神經網絡中的幾層。這種思路顯然是不對的,因為神經網絡需要前向與反向傳遞,這種傳遞是順序的數據依賴,所以在計算的時候只有一臺機器在運作其他機器在等待。
第二種思路是并行計算每一層中不同的節點。這種思路可行,但是這就需要一個很寬的神經網絡。每一層都都很多神經元。而相比于神經網絡的寬度,深度明顯要更重要。

根據上圖可以看出,寬而淺的神經網絡的表現并沒有深度網絡好。進而我們有了第三種思路:數據并行。

這種思路也是現今的主流,但是這種思路也有一個問題,那就是需要比較大的batch size。在忽略收斂性的前提下增加batch size可以加快并行速度。

上圖我們可以看到batch size增加,GPU的速度也增加了。

從上圖的表中我們可以看到,t1遠大于t2,增加batch size可以減小迭代次數從而加快計算速度。這樣加快深度神經網絡的訓練就可以轉化為,如何去增加訓練的batch size。

但是問題隨之而來,大的batch size會引起精度降低。所以增加訓練的batch size又可以轉化成如何在增加batch size的情況下保持模型的精度。

為什么large batch size會引起精度降低?
一般來說有兩種解釋,第一種是泛化問題(Generalization problem),模型具有較高training accuracy,但是test accuracy卻很低。這種解釋是Intel公司2017年提出的。論文地址:https://openreview.net/pdf?id=H1oyRlYgg

Generalization problem:

Regular batch: |Test loss - Train loss| is small
Large batch: |Test loss - Train loss| is large
泛化問題具體解釋可以去論文原文中找到,這里就不在贅述。

想要解決這種問題,可以利用Batch Normalization。利用BN之后test accuracy下降從原來的0.05降低到了0.01左右(batch size = 4096)。
第二種解釋是因為優化難度問題,很難去找到正確的超參。這種解釋是17年由Facebook公司提出的。論文地址:https://openreview.net/pdf?id=H1oyRlYgg
論文里面提出了兩種解決方法,第一種是在增加batch size的同時增加learning rate,兩者增加相同的倍數。第二種方法是warmup熱身,從小的learning rate一點點增加然后再回復到原始的learning rate。

新優化器
在尤洋博士的研究中,他發現Large batch size在深度神經網絡中,每一層的梯度權重比有很大的不同。如下圖所示:

這張圖我們可以看到第1層和第6層的比值相差很大。這就意味著用相同的learning rate去更新權重的話,會導致第一層更新的效率跟第六層的更新效率相差很大。如果learning rate適應第6層的話,第1層很有可能無法收斂。這就導致了神經網絡的準確率下降。
所以這里引入了尤洋博士的新算法Layer-wise Adaptive Rate Scaling(LARS)。新的算法主要改變了learning rate。算法如圖:


LARS算法使得每一層的學習率都有所不同,這樣就減少因為學習率導致無法收斂的情況。(學習率修正)
在經過LARS優化之后AlexNet的large batch size的test accuracy的效果也變得很好。

增加了batch size訓練速度也有大幅度提升。
在文章的第一步我們提到了神經網絡中沒有一個通用的優化器,那么LARS是否可以用于其他模型的優化。


由上面兩張圖中我們可以看到LARS在ResNet中表現的很好,在BERT上面雖然在8k左右的時候表現比原來的優化器表現要好,但是當batch size增加到16k以上的時候,表現卻出現了下滑。

由此,尤洋博士提出了新優化器Layer-wise Adaptive Moments for Batch(LAMB):

新的算法結合了Adam和剛才提出的layer-wise修正(LARS)。
在應用LAMB優化器后,BERT的訓練時間在保持精度的同時降低了60倍。

LAMB優化器在ResNet的訓練ImageNet中也擊敗了Momentum優化器。

并且在小的數據集中表現也非常好。


參考:
https://www.bilibili.com/video/av54050301
https://arxiv.org/pdf/1904.00962v3.pdf
https://openreview.net/pdf?id=H1oyRlYgg
?

總結

以上是生活随笔為你收集整理的速神经网络的训练算法LARS/LAMB工作原理 --UC Berkeley在读博士生尤洋的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 一区二区三区四区在线免费观看 | 丁香六月欧美 | 国产精品50页 | 人人草网站 | 精品国产欧美日韩 | 中文字幕在线观看视频www | 中文在线观看免费 | 黑名单上的人全集免费观看 | 97超碰在线免费 | 国产亚洲精品精品国产亚洲综合 | 亚洲欧美日韩久久 | 老女人毛片 | 免费激情av| 国产精品88| 国产日韩欧美视频 | 色综合a| 性高跟鞋xxxxhd国产电影 | 涩涩网站入口 | 五月天在线观看 | 国产免费无码一区二区 | www国产91 | 久久国产网站 | 亚洲中文字幕一区二区在线观看 | 日韩爽片 | 少妇一级淫免费播放 | 日韩xxx高潮hd | 人人插人人插 | 午夜片在线 | 91在线视频导航 | 伊人焦久影院 | 国产私拍视频 | 国产欧美日韩在线播放 | 青青草原国产在线 | 日本高清不卡在线观看 | 51人人看 | www.综合色| 波多野结衣在线影院 | 日日夜夜国产精品 | 国产三级三级三级三级三级 | 理论av| 在线免费小视频 | youjizz自拍 | 音影先锋av资源 | 少妇高潮一区二区三区 | 丰满少妇影院 | 懂色视频在线观看 | 在线精品免费视频 | 婷婷网址| 美女洗澡无遮挡 | 伊人青青草原 | 国产精品视频网址 | 在线欧美日韩国产 | 人人射影院 | 亚洲三级网 | 国产精品入口a级 | 香蕉久久夜色精品国产使用方法 | 久久久久久人妻一区二区三区 | 成人久久久精品国产乱码一区二区 | 国产最新在线 | 五月天综合激情 | 亚洲中字| 中文字幕激情 | 96久久精品 | 国产伦理片在线观看 | 色综合久久久无码中文字幕波多 | 欧美日韩亚洲一区 | 日本999视频| 欧美视频一二三区 | 中国黄色1级片 | 黄色一级片 | 午夜亚洲AV永久无码精品蜜芽 | 国产欧美日韩在线观看 | 黑人巨大精品人妻一区二区 | 肉肉av福利一精品导航 | 嫩模一区二区三区 | 亚洲av成人片色在线观看高潮 | 手机在线看a | 97狠狠干| 极品超粉嫩尤物69xx | 国产视频综合在线 | 黄色天天影视 | 乌克兰极品av女神 | 日日摸日日碰夜夜爽av | 恶虐女帝安卓汉化版最新版本 | 亚洲乱码视频在线观看 | wwwxxx在线播放| 99爱爱| 亚洲国产日韩a在线播放性色 | 成人你懂的| 久久亚洲一区二区 | 黄色网页大全 | 日日操天天操夜夜操 | 国产av人人夜夜澡人人爽 | 99爱视频在线观看 | 亚洲女人天堂网 | 欧美aa级 | 欧美日韩另类视频 | 美女视频国产 | 动漫av网 |