日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 运维知识 > windows >内容正文

windows

推荐算法炼丹笔记:如何让你的推荐系统具有可解释性?

發(fā)布時間:2025/3/8 windows 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 推荐算法炼丹笔记:如何让你的推荐系统具有可解释性? 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

作者:一元, 公眾號:煉丹筆記

可解釋性和有效性是構(gòu)建推薦系統(tǒng)的兩大關(guān)鍵成份,之前的工作主要關(guān)注通過引入輔助信息來獲得更好的推薦效果。但這些方法會存在下面的兩個問題:

  • 基于神經(jīng)網(wǎng)絡(luò)的embedding方法很難解釋和debug;
  • 基于圖的方法需要人工以及領(lǐng)域知識來定義模式和規(guī)則,并且會忽略商品的相關(guān)類型;(可替代并且互補(bǔ))

本文提出了一種新的聯(lián)合學(xué)習(xí)框架,我們將知識圖中可解釋規(guī)則的歸納與規(guī)則引導(dǎo)的神經(jīng)推薦模型的構(gòu)建相結(jié)合;該框架鼓勵兩個模塊可以互相補(bǔ)并生成有效的可解釋的推薦。

  • 歸納規(guī)則:從商品為中心的知識圖譜中挖掘, 總結(jié)出用于推斷不同商品關(guān)聯(lián)的常見多跳關(guān)系模式,并為模型預(yù)測提供人類可理解的解釋;
  • 通過引入規(guī)則對推薦模塊進(jìn)行擴(kuò)充,使其在處理冷啟動問題時具有更好的泛化能力;

所以本文是希望通過聯(lián)合訓(xùn)練推薦和知識圖譜來給出既準(zhǔn)確又可解釋的推薦。

背景知識

問題定義

1. 商品推薦(Item Recommendation)

給定用戶U和商品I, 商品的推薦任務(wù)就是基于用戶和商品的歷史交互找出最適合每個用戶的商品;用戶會通過購買或者對某個商品打分的形式表述他的喜好, 這些交互可以通過矩陣進(jìn)行表示,最具代表的方法就是:將用戶和商品embed到低維度的潛在空間中,然后使用用戶-商品交互的結(jié)果來進(jìn)行推薦。

2. 知識圖譜(Knowledge graph)

知識圖譜是由實(shí)體(節(jié)點(diǎn))和關(guān)系(邊)構(gòu)成的多關(guān)系圖,我們可以使用多個三元組(頭部實(shí)體E1, 關(guān)系類型r1, 尾部實(shí)體E2)來表示知識圖譜的事實(shí)。

3. 知識圖的歸納規(guī)則

知識圖譜中兩個實(shí)體之間可能有許多路徑,一條路徑由關(guān)系類型構(gòu)成(例如P(k)=E1r1E2r2E3就是兩個實(shí)體E1和的E2路徑);規(guī)則由兩個實(shí)體的關(guān)系序列定義,例如,路徑和規(guī)則的區(qū)別在于規(guī)則更多關(guān)注關(guān)系類型而不是實(shí)體。

4. 問題定義

給定用戶U,商品I,用戶和商品的交互,商品關(guān)聯(lián)以及知識圖譜,我們的聯(lián)合訓(xùn)練框架目的在于:

  • 基于商品的關(guān)系學(xué)習(xí)商品之間的規(guī)則;
  • 學(xué)習(xí)推薦系統(tǒng)推薦對每個用戶基于規(guī)則R以及他的交互歷史Iu推薦商品;

該框架輸出一套規(guī)則R 以及推薦商品的列表I'.

推薦基礎(chǔ)模型

此處介紹兩種基礎(chǔ)的模型。

1. BPRMF:貝葉斯個性化排序矩陣分解

2. NCF(Neural Collaborative Filtering):神經(jīng)網(wǎng)絡(luò)協(xié)同過濾

RULEREC框架

帶有rule learning的推薦主要由下面兩個子任務(wù)組成:(1). 基于商品的關(guān)系從知識圖譜中進(jìn)行規(guī)則學(xué)習(xí); (2). 對每個用戶基于他的購買歷史和得到的規(guī)則推薦商品;我們將其建模為多任務(wù)學(xué)習(xí),于是我們有:

異構(gòu)圖構(gòu)建

我們構(gòu)建異對于推薦和知識圖譜的商品的異構(gòu)圖,具體如下:

規(guī)則學(xué)習(xí)模塊

規(guī)則學(xué)習(xí)模塊的目的是在異構(gòu)圖中找到與給定項(xiàng)目關(guān)聯(lián)A相關(guān)聯(lián)的可靠規(guī)則集。

1. 規(guī)則學(xué)習(xí)

2. 規(guī)則選擇

  • Hard selection method:硬選擇方法通過設(shè)置一個超參數(shù)來決定我們首先要選擇多少條規(guī)則。
  • Soft selection method:利用基于學(xué)習(xí)的目標(biāo)函數(shù)的方法是將每個規(guī)則的權(quán)重作為對推薦模塊中規(guī)則權(quán)重的約束。這樣就不會從規(guī)則集中刪除任何規(guī)則,也不會引入額外的超參數(shù)。
  • Item推薦模塊

    多任務(wù)學(xué)習(xí)

    此處我們采用多任務(wù)目標(biāo)函數(shù)進(jìn)行優(yōu)化:

    模型效果

    • 在加權(quán)的訓(xùn)練中結(jié)合推薦損失和規(guī)則選擇損失可以提高推薦效果;
    • 從知識圖譜中抽取得到的規(guī)則對于商品對的特征向量學(xué)習(xí)是非常有價值的,學(xué)習(xí)得到的向量可以加強(qiáng)多個基本的推薦模型;
    • 多任務(wù)學(xué)習(xí)的方式對于推薦和規(guī)則選擇比規(guī)則加權(quán)學(xué)習(xí)貢獻(xiàn)更多;因?yàn)樘岢隹蚣艿撵`活性,提出的規(guī)則能夠和其它推薦算法結(jié)合進(jìn)一步提升模型的效果.

    案例研究&效果比較

    • 提出的模型比HERec好,但比RippleNet差。
    有兩個原因:1)關(guān)系類型在這個數(shù)據(jù)集中非常有限(只有7個),因此RuleRec中推薦規(guī)則選擇的能力在這種情況下是有限的。2) MovieLens-1M不同于的真實(shí)知識圖數(shù)據(jù)集(它是通過將項(xiàng)目鏈接到Freebase來構(gòu)建的),它的連接覆蓋非常完美,RippleNet從中受益匪淺。結(jié)果表明,所提出的算法能夠在緊湊異構(gòu)圖中取得顯著的性能;

    • 多任務(wù)學(xué)習(xí)方法在所有指標(biāo)上都取得了最好的性能,并且改進(jìn)效果顯著,這表明多任務(wù)學(xué)習(xí)在規(guī)則權(quán)重學(xué)習(xí)中非常有助于獲得更好的推薦結(jié)果。
    • 由于硬過濾方法可能同時忽略負(fù)項(xiàng)目和正項(xiàng)目(從表3中,我們可以看到,有時正項(xiàng)目和項(xiàng)目采購歷史之間沒有規(guī)則)。
    • 雖然選擇權(quán)重有助于推薦(更好同樣的重量),它仍然比一起學(xué)習(xí)模式更糟糕。
    • 對于由四個關(guān)聯(lián)中的任何一個導(dǎo)出的規(guī)則,使用BPRMF的RuleRec_{multi}明顯優(yōu)于BPRMF算法。

    • 使用不同的關(guān)聯(lián)可以得到相似的結(jié)果,但它們對于挖掘項(xiàng)目關(guān)系以提高推薦結(jié)果都是有價值的。
    • 在推薦中當(dāng)我們使用更多規(guī)則的時候,整體效果沒有變得更好;(可能隨著規(guī)則的個數(shù)增加,很多不好的規(guī)則也被帶入到模型中);

    • 由于在多任務(wù)學(xué)習(xí)算法中考慮了規(guī)則的選擇,我們發(fā)現(xiàn)規(guī)則集的性能與隨著規(guī)則數(shù)的增加,BPRMF算法表現(xiàn)出更好的性能;
    • 使用BPRMF的的性能明顯優(yōu)于和BPRMF(對不同規(guī)則計數(shù)的實(shí)驗(yàn)結(jié)果進(jìn)行配對雙樣本t檢驗(yàn))的性能。p<0.01)。結(jié)果表明,基于多任務(wù)學(xué)習(xí)的算法能夠處理大量的規(guī)則,即使存在一些無用的規(guī)則;

    小結(jié)

    本文提出了一種新的、有效的聯(lián)合優(yōu)化框架,用于從包含商品的知識圖中歸納出規(guī)則,并基于歸納出的規(guī)則進(jìn)行推薦。該框架由兩個模塊組成:規(guī)則學(xué)習(xí)模塊和推薦模塊。規(guī)則學(xué)習(xí)模塊能夠在具有不同類型商品關(guān)聯(lián)的知識圖中導(dǎo)出有用的規(guī)則,推薦模塊將這些規(guī)則引入到推薦模型中以獲得更好的性能。此外,有兩種方法來實(shí)現(xiàn)這個框架:兩步學(xué)習(xí)和聯(lián)合學(xué)習(xí)。

    本文研究使用大型知識圖Freebase進(jìn)行規(guī)則學(xué)習(xí)。該框架能夠靈活地支持不同的推薦算法。我們修改了兩種推薦算法,一種是經(jīng)典的矩陣分解算法(BPRMF)和一種基于神經(jīng)網(wǎng)絡(luò)的推薦算法(NCF)。所提出的四種規(guī)則增強(qiáng)推薦算法在多個領(lǐng)域都取得了顯著的效果,并優(yōu)于所有的基線模型,表明了本文框架的有效性。此外,推導(dǎo)出的規(guī)則還能夠解釋我們?yōu)槭裁匆蛴脩敉扑]這個項(xiàng)目,同時也提高了推薦模型的可解釋性。進(jìn)一步的分析表明,我們基于多任務(wù)學(xué)習(xí)的組合方法(帶有BPRMF的和NCF的$RuleRec_{two})在不同規(guī)則數(shù)下的性能優(yōu)于兩步法。不同關(guān)聯(lián)規(guī)則的組合有助于獲得更好的推薦結(jié)果。

    參考文獻(xiàn)

  • Jointly Learning Explainable Rules for Recommendation with Knowledge Graph:arxiv.org/pdf/1903.0371
  • blog.csdn.net/qq_416213

  • 后續(xù)我們會篩選出在我們實(shí)踐中帶來提升或者啟發(fā)的工作進(jìn)行細(xì)致的解讀與探討,歡迎關(guān)注我們的公眾號,也歡迎多交流,我是三品煉丹師: 一元。

    煉丹筆記

    推薦算法煉丹筆記:序列化推薦系統(tǒng)

    推薦算法煉丹筆記:電商搜索推薦業(yè)務(wù)詞匯表

    推薦算法煉丹筆記:推薦系統(tǒng)采樣評估指標(biāo)及線上線下一致性問題

    推薦算法煉丹筆記:CTR點(diǎn)擊率預(yù)估系列入門手冊

    推薦算法煉丹筆記:科學(xué)調(diào)參在模型優(yōu)化中的意義

    推薦算法煉丹筆記:如何讓你的推薦系統(tǒng)具有可解釋性?

    2020年推薦系統(tǒng)工程師煉丹手冊

    與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖

    總結(jié)

    以上是生活随笔為你收集整理的推荐算法炼丹笔记:如何让你的推荐系统具有可解释性?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。