搜索推荐炼丹笔记:位置偏差里的惊喜
PAL: A Position-bias Aware Learning Framework for CTR Prediction in Live Recommender Systems (RecSys2019)
作者:一元,公眾號:煉丹筆記準確預測點擊率(CTR)是推薦系統的關鍵。一般來說,CTR模型是基于從流量日志中收集的用戶反饋來訓練的。
然而,位置偏差存在于用戶反饋中,因為用戶點擊某個商品不僅是因為她喜歡它,而且因為它處于一個好的位置。
一種方法是將位置作為訓練數據中的一個特征進行建模,由于其簡單性,在工業應用中得到了廣泛的應用。特別地,由于實際位置信息在那時不可用,因此必須使用默認位置值來預測在線推斷中的CTR。但是,使用不同的默認位置值可能會導致完全不同的推薦結果。因此,這種方法導致次優的在線性能。針對這一問題,本文提出了一種位置偏差感知學習框架(PAL),用于實時推薦系統中的CTR預測。它能夠對離線訓練中的位置偏差進行建模,并在沒有位置信息的情況下進行在線推理。在為期三周的AB測試中,大量的在線實驗證明PAL在CTR和CVR(轉換率)方面比基線高出3%-35%。
一個用戶點擊一個商品不僅僅是因為用戶喜歡該商品,還有可能是因為該商品處在一個非常好的曝光位置。
之前處理該問題一共有兩種方案:
本文提出了一個位置偏差感知學習框架(PAL)來模擬離線訓練中的位置偏差,并在沒有位置信息的情況下進行在線推理。
PAL的思想是基于這樣一個假設:用戶點擊某個商品的概率取決于兩個因素:
- 用戶看到該商品的概率;
- 用戶點擊該商品的概率;
假設用戶看到了該商品。每個因素在PAL中被建模為一個模塊,這兩個模塊的輸出的乘積就是用戶點擊某個項目的概率。
如果對兩個模塊分別進行優化,由于兩個模塊的訓練目標不一致,可能導致整個系統處于次優狀態。為了避免這種局限性,提高CTR預測性能,PAL對兩個模塊同時進行了優化。一旦這兩個模塊通過離線訓練得到很好的訓練,第二個模塊即用戶點擊該項目的概率(假設該項目已被用戶看到)就被部署來預測在線推理中的CTR。
之前處理該方案的策略有:將position-bias當做是一個特征或者似乎一個模塊。
1. 作為特征
將位置信息建模為一個特征, 線下訓練的時候,我們將其作為特征向量并且拼接輸入到模型當中,
這么做就要求我們在在線推理時也需要有輸入,默認值的話會帶來次優的效果,而如果枚舉position信息的話又會導致時間增大,不能接受,所以這么做泛化性會較差。
2. 作為模塊
針對以上以將位置信息作為特征的局限性,本文提出了一種新的以位置信息為模塊的框架,以便在離線訓練中建立位置偏差模型,在沒有位置信息的情況下進行在線推理。
我們的框架是基于這樣一個假設,即一個商品只有在被用戶看到時才被用戶點擊。更具體地說,我們認為商品被用戶點擊的概率取決于兩個因素:
- 商品被用戶看到的概率;
- 用戶點擊商品的概率;
假設商品被用戶看到,那么我們有:
我們做進一步的假設:
- 一個商品被看到的概率只與相關位置被觀察到的概率有關;
- 一個商品被點擊的概率是和位置無關的;
我們提出的框架可以基于上面的等式并且由兩個模塊組成。
- Baseline:The baseline framework refers to “as a feature" strategy
- 不同的位置k對于Base的影響很大。
- 我們注意到線上線下都得到了一直的提升;
我們提出了一個PAL框架,它可以在離線訓練中對訓練數據中的位置偏差進行建模,在在線推理中可以在沒有位置信息的情況下預測CTR。與基線相比,PAL在為期三周的在線AB測試中有更好的結果。大量的在線實驗結果驗證了該框架的有效性。
參考文獻:
總結
以上是生活随笔為你收集整理的搜索推荐炼丹笔记:位置偏差里的惊喜的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐系统避坑指南
- 下一篇: 搜索推荐炼丹笔记:点击位置偏差的经验比较