日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 运维知识 > windows >内容正文

windows

如何利用DeepFM算法设计推荐系统

發布時間:2024/1/17 windows 45 豆豆
生活随笔 收集整理的這篇文章主要介紹了 如何利用DeepFM算法设计推荐系统 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

經過了十幾年的發展,推薦系統在互聯網行業已經變得越來越流行。從早年沒有一個合適的產品形態,到如今在今日頭條和抖音等商業產品中發揮重要作用,推薦系統已經越來越受到互聯網公司和研究界學者的重視。

早年的推薦算法主要是各種單模型,例如邏輯回歸、協同過濾、矩陣分解等等。后來推薦算法演化成了混合模型,例如 GBDT + LR , GBDT + FM 等。而隨著深度學習的崛起,深度神經網絡越來越深刻地影響了推薦系統領域的發展。

Huifeng Guo 等中國國內學者在 IJCAI 2017 發表了一篇題為《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction 》的論文,講解了如何將 FM 和深度學習模型進行融合之后進行推薦的算法。

DeepFM 主要有以下三個優點:

  • DeepFM 可以對低階特征交互和高階特征交互進行建模,不需要進行特征工程。
  • DeepFM 可以高效的進行訓練,因為模型寬的部分和深的部分,不僅共享輸入,也共享嵌入式向量。
  • 實驗數據表明 DeepFM 可以在點擊率預估問題上取得優秀的效果。
  • DeepFM 的輸入數據為點擊率預估常見的 (X, y) 元組,其中 X 是表示用戶和物品的特征向量,可能包括非數值數據,y 是點擊數據標簽,y = 1 表示用戶點擊了物品,y = 0 表示用戶沒有點擊物品。

    DeepFM 的預測函數如下:?, 其實是利用 sigmoid 函數對基于 FM 的預測和基于 DNN 的預測進行了融合。算法模型中的 FM 部分算法架構如下圖所示:

    DNN 部分的算法架構如下圖所示:

    在混合模型中,FM 和 DNN 共享同一個特征嵌入層。嵌入層的結構如下圖所示:

    嵌入層得到的向量記為:?, ?該向量參與到后續的DNN計算中:?,以及? 。

    作者隨后在測試數據集合上對近年來的幾種不同的點擊率預估算法進行了測評,選擇的測評標準包括 AUC 和 Log-loss ,測評結果如下圖所示:

    與 DeepFM 相比,其他幾種點擊率預估算法有以下缺點:

  • FNN : FNN 是一個由 FM 初始化的前向神經網絡。FM 預訓練策略有如下兩個問題:1). 嵌入層參數受 FM 影響較大 2). FM 預訓練對算法效率有影響。另外,FM 只包含了高階特征組合。
  • PNN : PNN 及其變種 IPNN 和 OPNN 忽略了低階特征的組合。
  • 寬深網絡:寬身網絡的 FM 部分需要人工處理特征工程。
  • DeepFM 設計思路簡單,源于 2016 年 Google 的寬深網絡方法但是效果出眾。自推薦系統誕生以來,人們便設計了各種不同的模型融合方法。從修改主題模型的 Collaborative Topic Regression ,到基于 blending 的 GBDT + LR 再到后面的寬深網絡方法, 給我們設計算法提供了不同的思路。算法本身是一個既要考慮模型,又要考慮數據和參數的學科,DeepFM 在如何設計模型層面給我們展示了很好的范例。

    原文標題:DeepFM: A Factorization-Machine based Neural Network for CTR Prediction,作者:Huifeng Guo, Ruiming Tang, Yunming Ye, Zhenguo Li, Xiuqiang He?

    總結

    以上是生活随笔為你收集整理的如何利用DeepFM算法设计推荐系统的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。