论文笔记(eTrust: Understanding Trust Evolution in an Online World)
eTrust:理解線上信任進化
原文鏈接:eTrust: Understanding Trust Evolution in an Online World, KDD’12
原理:用戶偏好與項的向量內積 + 用戶與朋友相似度權重*朋友對項的時間衰減評分=用戶對項的評分
摘要
大部分關于線上信任的研究都假設用戶之間的信任關系是靜態的。正如社會科學家告訴我們的那樣,信任隨著人類的交互而進化發展。在線信任進化的研究面臨著獨特的挑戰,因為通常情況下可用的數據來自于被動觀察(科學家在現實世界中調查一群人,記錄他們的各種信息)。本文利用社會科學理論開發了研究在線信任發展的方法。我們提出了一個進化信任框架eTrust,它利用了在線產品評審中用戶偏好的動態特性。
介紹
信任被廣泛的用于幫助線上用戶在應用程序中收集可靠的信息,比如高質量評論檢測和產品推薦。
Epinion 1等產品評審站點的一個重要特點是用戶之間存在信任網絡。這些網站為研究線上世界中的信任提供了一個明智的平臺。
圖一展示了在兩個不同時間點的線上評價系統,有兩種物體:users、items。兩種動作:建立用戶之間的信任關系、建立用戶對項的評級。評價系統隨著時間再進化,當新的用戶 u5 和新的項 I5 被加入時,新的信任關系和新的評級關系就會被創建。
Ziegler指出信任和用戶偏好相似性有很強的相關性,兩個用戶越相似,他們之間就越可能存在相似關系。換句話說,用戶之間的信任關系會隨著用戶偏好的變化而發展。
本文首次嘗試在線產品評審的背景下,利用用戶偏好的動態特性來研究網絡信任的演化。這項工作的主要貢獻包括:
- 提供研究線上世界中信任演變的方法
- 提出了一個框架eTrust,通過利用在線產品評審用戶偏好的動態來理解信任的演變
- 介紹了這項關于用戶偏好變化的eTrust研究的結果。
- 通過在線應用程序評估eTrust,例如使用實時數據的評級和信任預測。
問題陳述
t 時刻的用戶集合 Ut = {u1, u2, . . . , unt }
t 時刻的項集合 It = {I1, I2, . . . , Imt }
Ut ? Ut+1 and It ? It+1
t 時刻的信任網絡 Xt ∈ Rnt×nt 【 Xt(i, j) = 1 if ui is trusted by uj at time t)】
t 時刻的評級 Rt ∈ Rnt×mt
用戶可能對不同方面(facets)的項目有不同的偏好,我們假設項有K個潛在面,并且用戶對相同潛在面的項有著相似的偏好。 (這個地方可以用電影推薦來理解,比如:每個電影有3個潛在面:導演、演員、電影類型,對于這三個潛在面相同的電影用戶可能有著相同的喜好)
t 時刻用戶 ui 的偏好向量 pti ∈ RK+
項 Ij 的特征向量 qj ∈ RK
t 時刻多面信任關系 Wt ∈ Rnt×nt×K 【wtivk 表示 t 時刻 ui 對 uv 在 k 面的的信任關系】
則,在動態用戶偏好的情況下的信任進化問題可以被稱述為:給定 T 時刻的切片,用戶 U、項 I、用戶信任網絡 X、用戶評級 R,信任進化 W 可以利用用戶的偏好 P 的變化來學習到。
信任進化框架
eTrust - 模擬信任進化
在評級系統中信任和用戶偏好的相似度有很強的聯系,反映在其評級信息中。本文探索了用戶偏好的動態性,為評級系統建立了信任進化模型。
rtij 為實際的評級,r^tij 為預測的評級,一個基于信任網絡的評級預測的方法,是最近鄰居模型(考慮用戶多方面信任關系)的變體:
Nti 是 ui 在 t 時刻信任的用戶集合
rtvjvj 是 uv 在 t 時刻之前對 Ij的評級(tvj 就是用戶 uv 對項 Ij 進行評價時的時刻)
越早的評級反映的是用戶之前的偏好,應該對當前的評級有更小的影響,因此,我們選擇了指數時間函數。
其中,ηi ≥ 0 繪制 ui 的用戶特定衰變率,應該從data中學習得到
wtivk 是在 t 時刻 ui 和 uv 在 k 面之間的信任強度。
由于信任和用戶偏好相似度之間有強烈而明顯的聯系,我們定義stivk ∈ RL是 t 時刻 ui 和 uv 在 k 面的偏好相似度向量,基于 t 時刻他們在 k 面的偏好 pti (k) 、 ptv(k)
然后可以用 stivk 來定義 wtivk,其中 f 是 sigmoid 激活函數
latent factor model 沒有包含信任網絡的影響,neighborhood model 沒有考慮用戶偏好和項的特征。因此,我們將兩者結合起來,在這個公式中,在 t 時刻 ui 對 Ij 的評級由兩個因素決定,前部分捕獲了 ui 在 t 時刻的偏好和 item 的特征,后部分考慮了用戶信任用戶的影響。α ∈ [0, 1] 來調節兩部分的貢獻。
然后,信任進化問題就被嵌到了評級預測中,可以被下面的最小化問題表達:c(·) 模擬了用戶偏好的變化,λ 控制變化的速度,當 λ → 0,我們不考慮不同時間點用戶偏好的聯系。當 λ → +∞,不同時間點用戶的偏好向量被限制為相同。
由于用戶偏好的變化被認為隨著時間平滑變化,可以如下定義函數c:
eTrust 應用
評分預測
預測 T+1 時刻用戶 ui 對項 Ij 的評分:
其中,w 是從數據中學習得到的,qj 是不隨時間進化的,對于每個用戶,ui,bi,ηi 在時間片上是相互獨立的可以直接應用到 T+1 時刻。
定義用戶 ui 在 k 面的偏好變化速度為 Zik ,則用戶在 T+1 時刻 k 面的偏好 pT+1i(k) 可以用過 T 時刻 k 面的偏好和偏好變化速度計算出來:
在 T+1 時刻,新的用戶和新的項可能被引入,我們使用 Homophily 來解決冷啟動問題:相似的用戶更可能信任彼此。因此,對于一個新的用戶,我們先基于 profile 找到他的 top-l 相似用戶集合,然后通過平均他信任用戶的偏好來估計他的偏好。對于新的項也是同樣的方法。
信任預測
信任傳播模型(Trust propagation model)是一個流行的模型,它基于已知信任關系來得到新的信任關系的。但是用戶的信任關系通常是服從冪律分布 (pow-law distribution) 的,因此,在實際應用中,沒有足夠的信息來應用這一技術。此外,該傳播模型不能直接適用于信息少的新用戶。
eTrust 可以用戶信任預測,給定時間 T 之前的信任網絡和評分,我們想要推薦 T+1 時刻的信任關系。通過優化 eTrust 的目標函數可以得到參數 w(權重),然后用戶 ui 和用戶 uv 在 k 面的信任強度 wivk 便可以計算出來。然后整體的信任強度 wiv 可以如下計算得到:(對于一個新的用戶的偏好,用他關于 profiles 的 top-l 相似用戶的平均偏好來表示)
學習總結
1、作者在考慮用戶與用戶之間的信任關系時,不是簡單的信任和不信任關系,而是考慮了 K 個潛在面,用戶在不同潛在面對別的用戶有不同的信任關系。這樣的好處就是在推薦物品時不是簡單的考慮用戶對鄰居的信任分數大小,也考慮到了推薦商品的特性。(比如說:給用戶 a 推薦運動產品的時候可能更信任用戶 b,推薦電影的時候可能更信任用戶 c )
2、信任和用戶偏好相似性有很強的相關性,同時,用戶之間的信任關系會隨著用戶偏好的變化而發展。
3、在考慮信任用戶對項的評級時,采用指數時間函數,表明時間越久遠的評級的影響程度越小。
4、疑問:最近鄰居模型的分母為什么時那樣的呢?感覺分母應該是鄰居個數。
5、用戶在不同方面的喜歡程度乘以用戶對別的用戶在不同方面的信任程度之和得到用戶對別的用戶的整體信任程度。
6、通過之前的偏好變化計算得到偏好變化速度,再計算得到下個時刻用戶的偏好。這是我覺得這篇論文提出的一個好的角度,但是這樣的計算方式是否合理呢?即每個時刻的偏好減去上一個時刻的偏好值是否穩定,如果波動很大的話,這樣計算就不太合適了,可以考慮換一種計算方式!!!
總結
以上是生活随笔為你收集整理的论文笔记(eTrust: Understanding Trust Evolution in an Online World)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 欺诈检测相关论文
- 下一篇: 事件抽取与事理图谱的N个问题