日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【CTR预估】CTR模型如何加入稠密连续型和序列型特征?

發(fā)布時間:2025/3/8 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【CTR预估】CTR模型如何加入稠密连续型和序列型特征? 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

?CTR預(yù)估任務(wù)中除了廣泛使用的稀疏離散型特征外,還會用到稠密連續(xù)型以及一些序列類型的特征,本文為大家簡要梳理幾種特征的處理方式~

稠密連續(xù)類型特征的處理

在點擊率預(yù)估問題中,可以嘗試的幾種方法

  • 歸一化后直接輸入dnn部分,不參與fm部分交叉

  • 不歸一化經(jīng)過bn后輸入dnn,不參與fm部分交叉

  • 離散化后作為id feature, embedding后與其他sparse feature的embedding 一起參與fm的交叉

  • 為每一個field下的dense value??維護一個embedding vector??,取??作為其最終的embedding表示,與其他sparse feature的embedding一起參與fm的交叉,如下圖右側(cè)的Feature field M

  • 3和4的區(qū)別在于3中根據(jù)dense value的取值會分配到不同的embedding vector,而4中的不同的dense value只有一個embedding vector

    整理自淺夢在【數(shù)值類型的特征怎么加入深度模型如nfm,deepfm?】的回答https://www.zhihu.com/question/348103064/answer/878224028

    帶權(quán)重序列類型特征的處理

    這個問題抽象出來就是給定一個由若干個(item_id,weight)組成的列表,如何將這個信息用在模型里面。通常來說這種列表的含義可以是用戶歷史偏好的item_id以及偏好權(quán)重,或者是歷史收藏加購過的商品或者對應(yīng)店鋪的次數(shù)等等。對于問題中的數(shù)據(jù)
    ?

    一般情況有以下兩種做法來使用這個信息:

  • 不考慮上下文因素,直接將這個列表輸入。

    • 回歸到最簡單的情況,給定一個無權(quán)序列,我們一般可以通過sum/mean pooling 的方式將一個變長序列壓縮到一個定長的向量,輸入給我們的模型。

    • 那么對于帶權(quán)序列,其實可以看作是一個weighted sum/mean pooling的過程,其實有點類似引入一個attention機制,只不過attention score是預(yù)先計算好的。

    • 這種方法完整保留了用戶所有的偏好信息,更多的是作為一種用戶側(cè)表征。

    對于上述數(shù)據(jù),我們得到的表示向量為(不考慮score的歸一化)?

  • 考慮上下文因素,根據(jù)當(dāng)前預(yù)估item進行一個查表操作。

    • 比如我們當(dāng)前打分item屬于標簽1,那么直接查表得到('標簽1', 0.8),這個時候我們可以選擇直接使用權(quán)重0.8作為輸入,或者選擇用0.8*emb(標簽1)作為輸入。

    • 這種方法表達的是用戶對于當(dāng)前item的偏好。

    整理自淺夢在【CTR預(yù)估:(標簽-權(quán)重)列表類特征怎么輸入到模型?】的回答

    https://www.zhihu.com/question/352399723/answer/869939360

    普通序列類型特征的處理

    這里就有比較多的方式了,最常用的mean/sum pooling,target attention,self attention以及一些時序建模的方法~ 關(guān)注公眾號,未來會一一為大家介紹

    參考資料

    AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks

    https://arxiv.org/abs/1810.11921

    以上就是常用的CTR模型中對稠密連續(xù)型和序列特征的處理方法,歡迎關(guān)注公眾號淺夢的學(xué)習(xí)筆記,回復(fù)“加群”一起參與討論交流!

    歷史文章

    • 快速掌握TensorFlow中張量運算的廣播機制

    • 【Graph Embedding】DeepWalk算法原理,實現(xiàn)和應(yīng)用?

    喜歡的話點個在看吧????

    ? ? ? ? ? ?

    總結(jié)

    以上是生活随笔為你收集整理的【CTR预估】CTR模型如何加入稠密连续型和序列型特征?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。