日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

负样本修正:CVR预估时间延迟问题

發布時間:2025/3/8 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 负样本修正:CVR预估时间延迟问题 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

你的標簽錯了,而且錯了很多!

一元@煉丹筆記

在推薦搜索的建模中,我們經常會使用D+1天的數據作為label,從1~D天的數據中的進行特征抽取等工作,和我們時間序列問題建模類似,但和很多其他的時間序列問題建模不一樣的地方在于,我們的label不一定可靠,比如在傳統的時間序列回歸中,D+1天的銷量是多少就是多少,我們沒有太多的猶豫,因為不大會有其他的情況。但是在電商的問題中,就存在下面這種情況:

D+1天未購買可能并不一定是真正意義上的未購買,而可能是加入購物車或者意愿清單了, 只是沒有在當天下單, 而是過了一天在D+2天的時候下了單, 而這樣的標簽如果我們直接默認其為負樣本就會有較大的問題,因為它并不是真正意義上的負樣本,只是反饋延遲了。

這在搜索推薦系統中,我們稱之為延遲反饋的問題。

那么這個問題嚴重嗎?如果只有1%不到的數據在第二天甚至之后出現了延遲,那么或許并不是一個問題,但實際呢?在Criteo公司早期,

  • 有35%的商品會在點擊后一個小時內得到轉化;
  • 有50%的商品會在點擊后24h內得到轉化;
  • 有13%的商品會在點擊后2周之后才得到轉化。

那么如何解決該問題呢?

對時間延遲建模

這個問題較早在2014文章Modelling Delayed Feedback in Display Advertising中被提出,該文十分經典,同時提出的問題十分具有實踐價值,但是已經過去了6年, 本文我們就研討最新的IJCAI20關于CVR預估標簽延遲的paper.《An Attention-based Model for CVR with Delayed Feedback via Post-Click Calibration》。

最新延遲反饋論文解讀

問題背景

在早期對于標簽反饋延遲的建模都是建立在LR等傳統模型上,會存在模型表示能力欠缺以及需要大量人工專家特征的問題,本文將傳統的模型替換為現在火熱的深度學習模型,從而大大提高模型的表示能力。

但是在深度模型用于推薦問題時,又會出現大量類別特征EMbedding的稀疏性問題,這在CTR建模的時候是很容易得到解決的,因為CTR數據集是非常大的,模型往往可以學習到不錯的Embedding信息,但是CVR的數據集是相對較小的。

所以如何解決數據稀疏性的問題是一個非常大的挑戰;

此外,早期的文章都假設,也就是說,用戶在點擊商品之后到現在的時間是不影響我們商品的最終轉化以及轉化時間,這其實是不對的。

很明顯地,用戶在點擊完某個商品之后對于其他商品的點擊會影響最終是否會購買該商品?

以及最終購買該商品的時間(本文做了一定泛化,依然假設點擊item之后到目前的時間不會影響最終商品是否會轉化,但是會影響商品最終轉化的時間)。

所以本篇文章就是Focus在解決數據稀疏性以及標簽延遲反饋的問題上提出了一種新的解決方案。

下面我們看看本文是如何來解決這兩大挑戰的。數據稀疏性問題&時間延遲建模

模型部分

數據稀疏性問題

為了處理因為數據樣本量稀少而帶來的大量ID特征學習不充分的問題,本文使用預訓練好的Telepath從Item的圖像中學習得到結果替換稀疏的ID特征,以此來緩解該問題。從文章最后的實驗中我們也發現,數據稀疏性帶來的影響是巨大的,具體地可以參見實驗部分。

轉化模型&時間延遲模型

在稀疏ID的Embedding處理完成之后,接下來我們看一下我們的模型框架,

本文的模型框架主要分為左右兩個模塊,左側的轉化模型以及右側的時間延遲模型。

1.左側轉化模型:

我們可以用自己設計的網絡結構來構建自己的轉化模型. 本文的轉化模型的構建主要有三個模塊,我們由后往前看,

2.時間延遲模型

2.1 關系梳理

和《Modeling Delayed Feedback in Display Advertising》論文中類似,我們還需要得到

我們將轉換的延遲時間全部轉化為天的粒度, 在Survival Analysis中我們知道, 只要得到其中任意一個的表示,就可以得到其他的表示,也就是說我們對f(t)或者s(t)進行假設之后,就可以推導得到f(t),h(t)以及s(t)三者的表示.

2.2 網絡表示

那么接下來我們只需要看一下該概率是如何通過網絡層進行表示的,具體可以參考文章給出的右側的網絡大致框架進行解讀。和之前的一樣,我們由后往前看,

實驗結果

1.整體性能比較:

我們看一下本文的實驗結果,

從上面的實驗中,我們發現:

    • Item的Embedding初始化對效果的影響是巨大的;
    • Time Delay模塊的影響僅次于Item的Embedding初始化;
    • SelfAttention的影響是WP1和JD-MP數據集上的影響是相對較小的。

2.Time Delay分析:

我們從Figure2中可以看到,我們的在訓練集和測試集上的時間延遲分布是類似的,此處我們用Jensen-Shannon divergence來刻畫不同模型對于time delay的預測,而從結果上看,本文的算法對于時間延遲的預測也是最好的。

一本有仙氣的筆記,記錄了AI里的不凡

與50位技術專家面對面20年技術見證,附贈技術全景圖

總結

以上是生活随笔為你收集整理的负样本修正:CVR预估时间延迟问题的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 色一情一乱一乱一区91av | 国产免费一区视频观看免费 | 欧美亚州国产 | 国产第一亚洲 | 国产精品日韩 | 黑人精品一区二区三区不 | 女女高潮h冰块play失禁百合 | 久久久久久影院 | bangbros性欧美18 | 日本加勒比一区二区 | 韩国性猛交╳xxx乱大交 | 国产精品三级久久久久久电影 | 俺来也俺也啪www色 欧洲一区二区视频 | 亚洲一级片免费 | 麻豆视频一区二区 | 夜夜骑天天操 | 欧美性猛交xxxx乱大交 | 女人下部全棵看视频 | 亚洲一区免费看 | 国产一级自拍视频 | 黄色免费网站在线观看 | 国产精品视频一区二区三区, | 免费欧美一级片 | 在线观看日韩一区 | 毛片导航 | 国产精伦 | 亚洲午夜久久久久 | 亚洲第一二三四区 | 伊人91在线| av在线首页| 波多野结衣一二三四区 | 精品人妻一区二区三区三区四区 | 久久99精品久久久久久水蜜桃 | 日本亲与子乱ay中文 | 欧美日韩一区二区三区在线电影 | 国产中文欧美日韩在线 | 黄视频在线免费 | 久久亚洲国产精品 | 免费不卡视频 | 国产欧美激情视频 | 国产又黄又猛 | 欧洲做受高潮欧美裸体艺术 | 亚洲成在线 | 久操综合 | 另类ts人妖一区二区三区 | 亚洲蜜桃在线 | 国产69xx| 在线免费看黄 | 91成年视频 | 美女四肢被绑在床扒衣 | 欧美性xxxxxxxxx | 亚洲激情黄色 | 久久福利影视 | 欧美性生活视频 | 人与动物2免费观看完整版电影高清 | 性少妇videosexfre | 日本不卡一区二区三区在线观看 | 欧美不卡二区 | 一区免费观看 | 偷拍女澡堂一区二区三区 | 91精品在线观看视频 | 草草视频在线 | 超碰国产97 | 亚洲欧美日韩精品永久在线 | 深夜激情影院 | 日韩精品视频中文字幕 | 91久久精品国产91性色tv | 一区二区三区四区亚洲 | 三级免费黄 | 男女视频一区二区 | 在线成人免费电影 | 国产情侣一区 | 黄色三级三级三级三级 | 色鬼综合 | 欧美成人一区在线 | 在线观看不卡的av | 日韩一区二区三区不卡 | 97人妻精品一区二区三区视频 | 999视频在线 | 毛片网 | 苍井空浴缸大战猛男120分钟 | 精品国产九九九 | 久久国产精品-国产精品 | 亚洲最大的网站 | 比利时xxxx性hd极品 | 黄色激情在线观看 | 一级做a爱片性色毛片 | 欧美日韩亚洲一区二区 | 日本高清免费看 | 欧美在线免费视频 | 欧美青草视频 | 爱情岛av永久入口 | 一直草| 91久久精品www人人做人人爽 | 国产精品36p | 亚洲精品777| 成人av在线网址 | 成人在线观看91 | 亚洲乱码视频 |