日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

模型训练

發布時間:2024/1/18 编程问答 35 豆豆
生活随笔 收集整理的這篇文章主要介紹了 模型训练 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1、總訣式——定義問題

What,How,Why。首先要弄清楚自己要干什么,然后調研相關的技術確定怎么解決問題,最后反思自己為什么要用這個方案解決這個問題,有沒有更好的思路方法。

以電商推薦系統中的點擊率預估為例。首先明確我們的目標是優化線上的商品點擊率,其次可以通過點擊率預估算法來離線訓練模型,線上進行預估,將點擊率較高的商品推薦給用戶,這樣做的原因是點擊率預估是目前業界比較成熟的解決方案,且能夠取得不錯的效果,如果在實踐中遇到問題,也便于解決問題。當然也會有一些其他的方案,比如通過深度學習來做CTR,但是使用深度學習成本較大,所以從成熟的基于機器學習的CTR來做,并逐漸過渡到深度學習。

2、破劍式——選定模型

在明確問題之后,要選定用什么算法來解決,在相同的數據特征的前提下,不同的算法帶來的效果是不一樣的,而且應用的成本也是不一樣的。因此選定適合自己業務的算法才是最重要的,而不是選擇最高大上的。

同樣以電商推薦為例,比如進行了綜合考慮,選定了CTR預估中常用的樹模型算法-XGBoost。

3、破刀式——構造數據

確定算法模型之后,則是結合業務特性明確模型所需要的訓練數據。脫離業務的特征數據是沒有靈魂的,比如電商業務中的商品和信息流產品中的新聞背景是不一樣的,很多細節性的數據和特征需要去考慮和構造,因此要構造適合自己業務的數據,才能最大化的發揮算法模型的作用。

比如CTR預估場景中我們要構造的訓練數據為 <features, label>,那么如何去確定label呢?不同的kpi指標對應的label是不一樣的,比如追求點擊率的我們的label可能是0,1;但如果追求的是GMV(商品成交額),制定的label可能是商品下單率。同樣制定features的過程中也要結合用戶在業務內的數據表現。

4、破鞭式——模型訓練

模型是基于基礎數據進行更好的維度的問題抽象和解決,CTR模型旨在構建features和label之間的隱含關系,通過參數調整,特征優化以追求更好的效果表達。在構建好數據之后就是算法模型進行的舞臺了,目前大數據環境下最普遍的則是基于Spark分布式平臺進行模型訓練和調優。

5、破索式——模型評估

訓練模型往往需要擬合的是一個目標函數,以追求最小的誤差,最大的效果。CTR場景下常見的模型評估指標有:準確率、精確率、F值、AUC、NDCG等。同樣是選擇適合自己業務和算法模型的評估指標,通過評估指標來調整模型的參數以達到離線最優的效果,但具體的最終效果還是需要進行模型上線,進行ABTest驗證模型的優劣。

在ABTest過程中,新上的模型往往由于其不確定性,會給予較小的流量進行效果的測試,如果效果優于base組模型,則會分配更多的流量,以追求線上整體效果的最優。

更多關于模型效果的評估可以關注后續章節內容。

6、破槍式——模型優化

模型優化的過程則是對模型和數據進行迭代升級的過程,但是這里需要明確的是影響模型的線上效果的因素有很多,從基礎數據到構造的特征,從算法選擇到實驗策略的影響,從給出的排序結果到前端的位置展示,都可能產生影響。在應用算法模型的整個過程中,發生的每個動作或者做的每個修改都會影響模型的效果表達,因此算法工程師一定要注意的是切勿只重視算法和特征,在出現問題的時候往往要從多方面進行問題的定位和解釋。

為了避免其他非數據算法方面的影響,要充分利用ABTest實驗,即保證其他因素的一致性,通過實驗效果的優劣驗證實驗改進點的有效性。

7、破箭式——模型部署

把模型搞定之后需要考慮的是怎么部署模型,當然不同作用的模型、不同類型的模型部署方式也是不同的。

比如用戶離線計算的用戶偏好模型,則不需要進行線上部署,訓練好模型之后,保存一下,直接對數據集進行偏好預測,當然也可以不保存,直接進行預測。

對于線上使用的排序模型,機器學習和深度學習的主流部署方式也是不同的,比如排序的樹模型,通常情況下會保存成obj文件,然后寫入到固定的地方,線上使用時直接加載到內存進行線上實時的特征拼接和計算即可,對于DL類模型,當然也可以保存成固定格式的文件供線上使用,但更通用的做法是借助于框架本身封裝的服務,比如基于Tensorflow的DL模型,可以借助tf-serving進行部署,線上使用時,直接調相應的API接口,傳入需要的參數進行計算排序。

8、破掌式——效果跟蹤

模型部署上線之后并不是終點,一個更重要的步驟則是對上線之后的效果進行追蹤。

通常情況下,新上模型一般會進行白名單測試(一般是內部人員),測試是否能正常返回數據,返回的數據是否正常、是否可信服,確定沒問題之后會進行小流量的測試(一般在5%左右),觀察一天的效果,如果效果正向,則會擴大流量(一般擴到50%左右),經過一段時間的效果觀察(主要是和base組模型進行效果對比)如果效果正向,則會考慮全擴或者擴充接近100%。

不要小看擴流流程,如果新上模型直接擴充到全量或者大部分流程,是會引起很嚴重的問題的,比如效果不好,性能不好等,所以要謹慎對待。

9、破氣式——數據保存

數據保存是指將線上使用的特征數據通過一定的方式進行保存,目的是方便后續模型的訓練和優化,形成一個完整的數據閉環。

保存數據時需要注意的是每條數據的唯一性,即保證最后關聯特征數據和label的時候保證是對應的,否則會引起樣本誤差,引起模型的訓練效果。

總結

以上是生活随笔為你收集整理的模型训练的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 老司机在线看片 | 无遮挡在线观看 | 国产成人精品视频ⅴa片软件竹菊 | 日韩a级片在线观看 | 国产一区视频在线播放 | 日产精品久久久久久久 | 麻豆视频在线观看免费网站 | 一二三区在线播放 | 女女综合网 | 成人欧美一区二区三区黑人动态图 | 乌克兰av在线 | 少女与动物高清版在线观看 | 精品欧美一区二区三区成人 | 久久国产夫妻 | 少妇人妻偷人精品一区二区 | 在线黄色免费网站 | 深夜激情影院 | 久久黄色网址 | 亚洲精品lv | 最新日韩av | 97香蕉超级碰碰久久免费软件 | 国产另类ts人妖一区二区 | 中文字幕在线一 | 欧美成人精品一区二区 | 欧美福利视频导航 | 日日夜夜噜噜噜 | 亚洲欧洲成人精品久久一码二码 | 岛国精品一区二区 | 91麻豆精品在线观看 | 色窝窝综合色窝窝久久 | 欧美日韩中文字幕视频 | 成人免费视频大全 | 黄色片日韩| av电影免费在线播放 | 久久夜色精品 | 91网址在线播放 | 涩涩视频在线看 | 深夜福利一区二区三区 | 欧美色图一区 | 欧美午夜小视频 | 深夜福利影院 | 国产女人被狂躁到高潮小说 | 成人区人妻精品一区二区网站 | 91精品一区二区三区综合在线爱 | 欧美性猛交xxxx乱大交hd | 喷水视频在线观看 | 思思久久精品 | 乌克兰黄色片 | a免费看| 一级做a爱 | 巨乳女教师的诱惑 | 国产成人a亚洲精品 | 午夜电影在线播放 | 强行糟蹋人妻hd中文字幕 | 午夜久久影院 | 国产做受高潮漫动 | 超碰2021| 日韩中文网 | 在线成人| 成年人看的毛片 | 国产在线精品视频 | 18禁网站免费无遮挡无码中文 | 乳孔很大能进去的av番号 | 国产乡下妇女做爰毛片 | 91精品视频网站 | 毛片福利| 天天视频国产 | 波多野吉衣在线视频 | 欧美顶级少妇做爰hd | 欧美一级在线看 | 欧美日韩 一区二区三区 | 亚洲成a人片 | 欧美大片一区二区 | 亚洲永久精品一区 | 无码人妻精品一区二区蜜桃网站 | xvideos成人免费视频 | 日本高清视频www夜色资源 | 爱豆国产剧免费观看大全剧集 | 日韩精品极品视频 | 亚洲人成一区 | 最近中文字幕在线中文视频 | 免费污视频在线观看 | 蜜臀久久99精品久久久画质超高清 | 亚洲精品小说 | 五月天国产 | 最新av女优 | 健身教练巨大粗爽gay视频 | 久精品在线观看 | 成年人免费高清视频 | 欧美视频在线播放 | 日韩免费久久 | 蘑菇av| 女人高潮被爽到呻吟在线观看 | 亚洲成人福利 | 日韩精品电影一区二区 | 99久久精品国产一区二区成人 | 成人国产视频在线观看 | exo妈妈mv在线播放高清免费 | 波多野吉衣毛片 |