日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【AutoML】强化学习如何用于模型蒸馏?

發布時間:2025/3/20 编程问答 13 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【AutoML】强化学习如何用于模型蒸馏? 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

大家好,歡迎來到專欄《AutoML》,在這個專欄中我們會講述AutoML技術在深度學習中的應用,這一期講述在知識蒸餾中的應用。

作者&編輯 | 言有三

上一期給大家介紹了AutoML技術在模型量化中的應用,而知識蒸餾作為模型壓縮的另外一個技術,也是學術界和工業界的重點研究方向,今天給大家介紹AutoML在模型蒸餾中的應用思路。

1?N2N Learning

N2N learning是一個知識蒸餾框架,它使用增強學習算法來將teacher模型轉化為student模型,框架結構如下:

N2N learning基于一個假設,即一個教師網絡轉化成學生網絡的過程可以看作是馬爾可夫決策過程Markov Decision Process(MDP),當前的步驟只和有限的之前幾步有關系,使用增強學習來進行優化,其基本概念如下:


狀態S:將網絡的架構作為狀態,對于任何一個大的網絡,采樣后比它小的網絡都很多,所以狀態空間非常大。


動作A與狀態轉換T:包括層的縮減以及移除操作。這一個過程通過雙向LSTM來實現,它會觀察某一層與前后層的關系,學習到是否進行約減或者刪除。


獎勵r:模型壓縮的目標是保證精度的同時盡可能壓縮模型,因此reward就是壓縮率。

在上圖結構中中包括了兩個動作,實際進行優化時依次進行:

(1) 首先選擇一組動作,用來判斷當前層的去留;

(2) 然后使用另一個策略選擇一組動作,用來決定剩下每一層的裁剪程度,偽代碼流程如下:

以上兩種動作使用的LSTM也有差異,下圖(a)是層的去留使用的LSTM,可以看出是一個雙向的LSTM,要同時考慮前向和反向的中間狀態。

下圖(b)是層的裁剪使用的LSTM,可以看出是一個單向的LSTM,其中at的值范圍是[0.1,0.2,...,1],表示壓縮率。

而獎勵reward公式如下:

其中C表示壓縮率,A表示學生模型準確率,Ateacher表示教師模型準確率,教師網絡的輸出作為學生網絡的真值。

損失函數包括兩項,分別是學生網絡的分類損失以及蒸餾損失,其中蒸餾損失中教師網絡的輸出作為學生網絡的真值,使用L2距離。

實驗結果如下:

從結果來看,實現了非常高的壓縮率,并且性能下降不明顯。

2 關于模型優化

如果說要我在深度學習這么多方向里選擇一個的話,我會毫不猶豫地選擇模型優化。公眾號寫過很多的模型解讀了,如下是一些文章總結和直播鏈接以及資源下載。

【完結】總結12大CNN主流模型架構設計思想

「總結」言有三&天池深度學習模型設計直播匯總,贈超過200頁課件

知識星球也有一個模型結構1000變板塊,比公眾號的內容更深更廣。其中的模型優化部分主要包括緊湊模型的設計,剪枝,量化以及知識蒸餾等內容的詳細解讀,感興趣可以移步。

[1] Ashok A , Rhinehart N , Beainy F , et al. N2N Learning: Network to Network Compression via Policy Gradient Reinforcement Learning[C]// ICLR 2018. 2017.

總結

本次我們簡單介紹了AutoML在知識蒸餾中的一個經典案例,更多知識蒸餾與模型優化,AutoML的內容,請大家移步有三AI知識星球長期學習。

有三AI知識星球

知識星球是有三AI的付費內容社區,里面包括各領域的模型學習,數據集下載,公眾號的付費圖文原稿,技術總結PPT和視頻,知識問答,書籍下載,項目推薦,線下活動等資源,了解詳細請閱讀以下文章:

【雜談】有三AI知識星球一周年了!為什么公眾號+星球才是完整的?

【雜談】萬萬沒想到,有三還有個保密的‘朋友圈’,那里面都在弄啥!

轉載文章請后臺聯系

侵權必究

往期精選

  • 【AutoML】如何選擇最合適的數據增強操作

  • 【AutoML】激活函數如何進行自動學習和配置

  • 【AutoML】歸一化(Normalization)方法如何進行自動學習和配置

  • 【AutoML】優化方法可以進行自動搜索學習嗎?

  • 【AutoML】損失函數也可以進行自動搜索學習嗎?

  • 【AutoML】如何使用強化學習進行模型剪枝?

  • 【AutoML】強化學習如何用于模型量化?

  • 【AutoML】當前有哪些可用的AutoML平臺?

  • 【星球知識卡片】殘差網絡家族10多個變種學習卡片,請收下!

  • 【星球知識卡片】移動端高效率的分組網絡都發展到什么程度了?

  • 【星球知識卡片】注意力機制發展如何了,如何學習它在各類任務中的應用?

  • 【星球知識卡片】模型剪枝有哪些關鍵技術,如何對其進行長期深入學習

  • 【星球知識卡片】模型量化的核心技術點有哪些,如何對其進行長期深入學習

總結

以上是生活随笔為你收集整理的【AutoML】强化学习如何用于模型蒸馏?的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 免费又黄又爽又色的视频 | 天堂аⅴ在线最新版在线 | 欧美一级片在线播放 | 麻豆免费在线观看 | 不卡视频国产 | av一二三 | 日韩国产欧美一区二区三区 | 四虎影院国产精品 | 天堂网av手机版 | 69视频在线 | 一级片在线免费播放 | 美女伊人网 | www.av免费| aaaa毛片 | 欧美午夜精品久久久久免费视 | a国产免费 | 性福利视频 | jizz视频在线观看 | 一道本在线 | 午夜免费福利视频 | 成人动漫在线观看 | 成人免费毛片糖心 | 97色婷婷| 九九视频免费 | 欧美在线视频网站 | 欧美日韩亚洲国产精品 | 国产一卡二 | 日韩人妻精品无码一区二区三区 | 四虎影院永久地址 | 亚洲第一区在线播放 | 动漫女生光屁股 | 日韩精品视频播放 | 我要色综合网 | 丰满少妇av | 黑人玩弄人妻一区二区三区 | av爱爱网站| 久久久久久999| 久久美女免费视频 | 日韩avwww| 老熟妇精品一区二区三区 | 亚洲性色视频 | 久久人人爽人人爽人人片av高清 | 91爱啪| 一区二区三区中文字幕 | 色一情一乱一区二区三区 | 一区不卡在线 | 亚洲九九夜夜 | 国产毛片毛片毛片毛片 | 日韩在线观看你懂的 | 欧美激情一区二区三区免费观看 | 97久久国产亚洲精品超碰热 | 国产又黄又骚 | 天天爽夜夜爽人人爽 | 91福利在线导航 | 黄色一级片在线播放 | 情欲少妇人妻100篇 黄色一级片欧美 | 免费看操片 | 青青草视频黄 | 羞羞网站在线看 | 亚洲AV成人无码精品久久盆瓶 | 久久久久亚洲av无码专区体验 | 亚洲av无码国产在丝袜线观看 | free黑人多人性派对hd | 一区二区三区免费观看 | 国产午夜福利一区 | 啪啪自拍 | 狠狠干2018| 欧美色视频在线观看 | 国产又黄又大又粗视频 | 变态另类一区 | 91丨porny丨国产 | 成人一二三 | 97av超碰 | 欧美三级一级片 | 青青免费在线视频 | 国产中文字字幕乱码无限 | 天天操一操 | 欧美一区二区三区视频 | 国产亚洲精品成人av在线 | 极品少妇av | 久久国产劲爆∧v内射 | 国产视频导航 | 国产精品jizz在线观看美国 | 国产精品xxxx喷水欧美 | 日本亚洲一区二区 | 成人午夜激情视频 | 日本新japanese乱熟 | 欧美少妇一区二区 | 人人干天天操 | 亚洲干干干| 嫩草天堂| 国产三级网站 | 亚洲欧洲av| 澳门黄色 | 美国少妇在线观看免费 | 在线观看视频中文字幕 | 日本三级吹潮 | 国产美女作爱全过程免费视频 | 制服 丝袜 综合 日韩 欧美 |