日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统遇到曝光偏差怎么办?用对比学习!

發布時間:2025/3/8 windows 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统遇到曝光偏差怎么办?用对比学习! 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

推薦系統中常常需要在億級別的候選集中找到上百個相關的item,俗稱DCG問題(Deep candidate generation)。通常處理這類問題采用的類似語言建模的方法。然而顯存的推薦系統都存在著曝光偏差,在候選集多的時候這個偏差更加的嚴重,導致模型只學習了曝光多的樣本,因此這篇論文《Contrastive Learning for Debiased Candidate Generation in Large-Scale Recommender Systems》使用了對比學習去解決曝光偏差問題,該方法已經成功部署在淘寶,并且效果有顯著提升。

DCG問題中的對比學習

首先我們可以拿到這樣的數據集和,D={(xu,t,yu,t): u=1,2,...,N, t=1,2,...Tu},xu,t= {yu,1:(t-1)},即我們在預估t時刻用戶要點啥時,用到的是該用戶t時刻前點擊的所有items。在DCG問題中,我們需要學習用戶的encoder和item的encoder把用戶和item映射到一個空間中,并通過cos相似度找到top k的item,典型的學習方式如下,使用最大似然估計(MLE)去擬合上述數據集合:

然而使用觀測到的點擊數據訓練模型會有嚴重的曝光偏差問題,對有潛力但沒機會曝光的item是毀滅性打擊。很多高質量的item但是在訓練數據集中點擊較少,在MLE這種學習方式就很難再曝光。

如何理解對比學習能解決曝光偏差呢?

論文中使用的對比loss類似Sampled Softmax,先看看Sampled Softmax:

L表示負采樣的個數,pn(y|x)是預先定義好的負采樣分布,減去logpn(y|x)是為了讓該loss收斂到和MLE相似的結果。在實踐中pn(y|x)往往就使用pn(y),pn(y)就等同于流行度,使用該流行度加速收斂,在實踐中L取值上千。當候選集巨大時,sampled softmax效果要優于NCE和negative sampling。

接下來我們討論對比學習中的contrastive loss,在負采樣概率分布為pn(y|x),loss如下:

但是我們發現上式中不再減去logpn(y|x),因此該公式不再與MLE一致了,所以對比學習主要是優化pn(y|x)這個分布,使得模型收斂到合適的地方。

對比學習為什么能緩解曝光偏差?

讓我們先看下IPW(inverse propensity weighted) loss:

q(y|x)就是調節loss的權重了,它可以是曝光的分布。實現IPW有兩步,第一步用一個獨立的模型(該模型作用就是得到q(y|x))并通過曝光產生的數據集擬合MLE loss,第二步擬合IPW loss,然而這種方式效率比較低下。

我們可以證明contrastive loss和IPW可以達到同樣的效果,這兩種方法都是最小化KL散度,證明過程可以參考論文附錄。

CLRec

從上圖中,我們可以清晰的看到負采樣的方式,都近似pn(y|x)=pdata(y) (a)就是batch內負采樣,(b)創建了一個固定大小的FIFO隊列存取之前見到過的正例,然后用在當前batch內作為負樣本。(c)和(b)不同在于隊列直接緩存了encoder的結果。

如果是用IPW,很難估計到準確的q(y|x),CLRec就用q(y)代替q(y|x),q(y)和pdata(y)有高度相關性,很容易理解,系統曝光的item是因為這些item點擊率較高,所以q(y)就可以近似pdata(y)。但是簡單的使用pdata(y)進行負采樣雖然可以緩解偏差,但是計算成本很高也不能保證每個item在一個epoch內被采樣到,因此設計了(b)和(c)這種隊列采樣方法。(b)和(c)兩種方法中,如果隊列大小就是batch_size,那就等同于(a)方法。為了使得泛化效果更好,我們需要上千負樣本,因此選擇一個比較大的隊列大小,但是較小的batch size去節約內存。e.g. batch size = 256 queue size = 2560。(b)和(c)本質區別時(c)需要更多steps才能收斂,因為梯度回傳不到負樣本,但是由于訓練速度提升了,整體訓練時間(c)是優于(b)的。論文中還提到了Multi-CLRec,緩解多意圖偏差,感興趣的可以看原文。

實驗

論文中的實驗持續了至少4個月,離線評估糾偏時,比較了sampled softmax和CLRec,在不同loss下我們可以看到CLRec顯著提高了多樣性(提升了1倍),并且從曝光分布我們可以看到sampled softmax更擬合訓練集的分布而CLRec學到了一個相對不同的分布從而緩解了曝光偏差:

如果改變分布就是好的,那隨機出豈不是更好?所以還必須對比點擊率和recall才能真正說明CLRec是有效的,從下圖我們可以看到CLRec提升了點擊率和Recall:

參考文獻

1、Contrastive Learning for Debiased Candidate Generation in Large-Scale Recommender Systems arxiv.org/pdf/2005.1296

總結

以上是生活随笔為你收集整理的推荐系统遇到曝光偏差怎么办?用对比学习!的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 91精品推荐| 日日爱886 | 久久免费毛片 | 欧美精品一区二 | 夜夜伊人 | 狠狠久久久 | 伊朗做爰xxxⅹ性视频 | 伊人中文网 | 成人免费区一区二区三区 | 春色激情 | 黄色成人一级片 | 一区二区在线免费视频 | 国产盗摄一区二区三区在线 | 男生舔女生胸 | 亚洲视频在线观看一区二区 | 五月激情婷婷在线 | 国产又粗又猛又爽 | 视频在线观看你懂的 | 亚洲福利小视频 | 日本动漫艳母 | 亚洲精品永久免费 | 蜜臀精品一区二区三区 | 黄色小说在线看 | 俺去久久 | 捆绑调教在线观看 | 国产老熟妇精品观看 | 国产一极毛片 | 天天综合在线观看 | 中文字幕人妻一区二区 | 国产黄av| 女人的天堂av在线 | 天堂网中文在线观看 | 澳门久久 | 91大神久久 | 日韩视频久久 | zzjj国产精品一区二区 | 免费高清毛片 | 日韩中文字幕有码 | 久久久久免费看 | 国内精品国产成人国产三级 | 色综合加勒比 | 日日射夜夜| 少妇无内裤下蹲露大唇视频 | 成年网站在线播放 | 亚洲国产影院 | 正在播放日韩 | 亚洲av片不卡无码久久 | 在线日韩一区 | 女同hd系列中文字幕 | 欧洲av网站 | 少妇高潮大叫好爽喷水 | 农村少妇久久久久久久 | 日日干夜夜干 | 欧美日韩另类在线 | 国产午夜精品久久久久久久 | 午夜在线观看视频18 | 海角社区id:1220.7126,10. | 国产精品久久久久久一区二区三区 | 日韩精品 欧美 | 一区二区日韩国产 | 一级毛毛片| 国产美女极度色诱视频www | 成年人在线免费观看视频网站 | 粉嫩小箩莉奶水四溅在线观看 | 欧美激情在线播放 | 三级黄毛片 | 18成人免费观看视频 | 性欧美17一18内谢 | 亚洲天堂国产精品 | 99青草 | 国模私拍av | 亚洲精品v天堂中文字幕 | 日本护士取精xxxxxhd | 林雅儿欧洲留学恋爱日记在线 | 欧美极品三级 | 综合网伊人 | 骚婷婷| 老司机av影院| 龚玥菲一级淫片 | 一区二区三区精 | 两个小y头稚嫩紧窄h文 | 日韩怡红院 | 亚洲精品成人久久 | 另类一区 | 成人va视频| 香蕉大人久久国产成人av | 男女瑟瑟视频 | 国产毛片a | 亚洲超碰在线 | 国产黄a三级三级三级看三级男男 | 污片网站| 欧美精品一区二区久久婷婷 | 男人天堂99 | 成人性色生活片 | 高清欧美性猛交xxxx黑人猛交 | 92久久精品一区二区 | 国产欧美精品在线观看 | 理论片午夜 | 免费超碰在线观看 |