日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐系统论文DSIN:Deep Session Interest Network

發布時間:2024/1/23 windows 44 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐系统论文DSIN:Deep Session Interest Network 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、背景

前幾天寫了一篇阿里的論文BST,最后應用在我們自己的新聞推薦場景,離線AUC沒有什么提升,今天分享一篇有收益的文章,同樣出自阿里。

絕密伏擊:推薦系統論文:Behavior Sequence Transformer(https://zhuanlan.zhihu.com/p/96338316)

文章DSIN(Deep Session Interest Network for Click-Through Rate Prediction)發表在IJCAI-2019,主要貢獻在于對用戶的歷史點擊行為劃分為不同session,對每個session使用Transformer學習session embedding,最后使用BiLSTM對session序列建模。這篇文章和阿里的另一篇DIEN( ?Deep Interest Evolution Network ?)很像,「主要區別在于用戶歷史行為序列的刻畫,引入了session,并用transformer學習session表征」?。

二、模型結構

圖1:DSIN模型結果

模型主要由四個部分組成,?「Session Division Layer」?是對用戶的歷史行為劃分到不同session,?「Session Interest Extractor Layer」?是學習session的表征,?「Session Interest Interacting Layer」?是學習session之間的演變,?「Session Interest Activating Layer」是學習當前item和歷史點擊session的相關性。后面會講一下這四個部分的具體實現。

2.1 Session Division Layer

主要是將用戶的歷史點擊行為序列劃分為多個sessions。「這里有一個假設是相同session用戶的行為是接近的,比如都是在點一些和褲子相關的商品,而不同session間的用戶行為是有差異的,比如后面可能是點一些和洗發水相關的商品」。文章將間隔超過30分鐘作為session的劃分,比如將歷史點擊序列 ???轉換為session??,第 ???個session表示為:

?

?

其中 ???是第 ???個session的長度, ?

是輸入item的embedding大小

?

2.2 Session Interest Extractor Layer

這部分主要是獲取session表征。用戶在相同session內的行為是高度相關的,此外用戶在session內的一些隨意行為會偏離整個session表達。為了刻畫相同session內行為間的相關性,同時減小不相關行為的影響,DSIN使用「multi-head self-attention」?對每個session建模。為了刻畫不同session間的順序,DSIN使用了?「Bias Encoding」?。

「2.2.1 Bias Encoding」

為了刻畫不同session的順序關系,使用bias encoding,定義如下:

?

其中 ?表示第 ???個session中,第 ???個物品的embedding向量的第個位置的偏置項。也就是說,對每個session中的每個物品對應的embedding的每個位置,都加入了偏置項。加入bias encoding后,用戶的session表示為:

?

「2.2.2 Multi-head Self-attention」

在推薦系統中,用戶的點擊行為會受各種因素影響,比如顏色、款式和價格。「Multi-head self attention」可以在不同的子空間上建模這種關系。這里將第 ???個session劃分為 ???個??,使用 ?

表示,其中 ??。?可以表示為:

?

?

?

其中 ???是線性矩陣。

然后將 ???的輸出concat到一起,再接入一個FFN網絡:

?

?

其中 ???表示前向神經網絡, ?表示線性矩陣。

經過?「Multi-head self attention」?處理之后,每個session得到的結果仍然是 ?

大小,隨后,經過一個?「avg pooling」?操作,將每個session興趣轉換成一個??維向量:

?

?

2.3 Session Interest Interacting Layer

使用雙向LSTM建模session之間的演變。

?

上式中的兩項分別表示前向的隱藏層狀態和反向的隱藏層狀態。

2.4 Session Interest Activating Layer

這部分主要是通過Attention機制刻畫Item和session之間的相關性。用戶的session與目標物品越相近,越應該賦予更大的權重。使用注意力機制來刻畫這種相關性:

?

?

?

其中 ???是目標item的embedding

三、實驗結果

使用了兩個數據集進行了實驗,分別是阿里媽媽的廣告數據集(Advertising)和阿里巴巴的電商推薦數據集(Recommender)。對比結果如下:

圖2:DSIN模型結果對比

從實驗結果來看,AUC相比DIEN都有?「0.5%」?以上的提升。

四、寫在最后

這篇文章在我們自己的業務場景(新聞推薦場景)上也實驗了,選取了用戶最近的10次點擊session,session長度最大取20,使用7天訓練,1天測試,最后離線AUC相比DIEN大概有「0.46%」的提升,和文章的結果基本吻合。個人感覺這篇文章的設計還是比較巧妙,充分利用了用戶行為的內在結構,使用session劃分用戶的點擊序列,使得在使用LSTM等序列模型對歷史點擊建模的時候,長度大大縮小,而且效果還有所提升。

五、?「Reference」

  • Alex-zhai:阿里Deep Session Interest Network解讀

  • 2. Deep Session Interest Network for Click-Through Rate Prediction

    3. ?Ethan Wong:DSIN(Deep Session Interest Network )分享

    總結

    以上是生活随笔為你收集整理的推荐系统论文DSIN:Deep Session Interest Network的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。