SIGIR 2021|用于搜索多样化的意图图建模
?PaperWeekly 原創(chuàng) · 作者 |?金金
單位 |?阿里巴巴研究實(shí)習(xí)生
研究方向?|?推薦系統(tǒng)
簡介
本文由中國人民大學(xué)發(fā)表于 SIGIR 2021。搜索結(jié)果的多樣化旨在提供涵蓋盡可能多的意圖的多樣化文檔。大多數(shù)現(xiàn)有的隱式多樣化方法都是通過間接和不自然的文檔表示相似性來建立多樣性模型。為了更準(zhǔn)確地處理多樣性,本文通過意圖覆蓋范圍的相似性來衡量文檔的相似性。
論文標(biāo)題:
Modeling?Intent Graph for Search Result Diversification
論文來源:
SIGIR 2021
論文鏈接:
http://playbigdata.ruc.edu.cn/dou/publication/2021_SIGIR_IntentGraph.pdf
具體來說,作者建立了一個(gè)分類器,根據(jù)文檔的內(nèi)容判斷兩個(gè)不同的文檔是否包含相同的意圖。然后,作者構(gòu)造一個(gè)意圖圖來表示文檔和查詢之間的復(fù)雜關(guān)系。在意圖圖上,如果文檔相似,則將它們連接起來,而根據(jù)文檔選擇結(jié)果,將查詢和文檔逐漸連接起來。然后,作者使用圖卷積網(wǎng)絡(luò)(GCN)通過匯總其鄰居來更新查詢和每個(gè)文檔的表示。通過這種方式,作者可以在文檔選擇過程中通過動(dòng)態(tài)意圖圖獲得上下文感知的查詢表示和意圖感知的文檔表示。
此外,作者將這些表示和意圖圖特征與多樣性特征融合在一起。結(jié)合傳統(tǒng)的相關(guān)性功能,該模型獲得了平衡相關(guān)性和多樣性的最終排名分?jǐn)?shù)。實(shí)驗(yàn)結(jié)果表明,這種隱式多樣化模型明顯優(yōu)于所有現(xiàn)有的隱式多樣化方法,并可以擊敗最新的顯式模型。
模型
本文通過已有的相關(guān)性特征計(jì)算相關(guān)性分?jǐn)?shù),并通過圖神經(jīng)網(wǎng)絡(luò)建模得到候選文檔和已選擇文檔的不相關(guān)性分?jǐn)?shù)(即多樣性分?jǐn)?shù)),并計(jì)算二者加權(quán)和得到文檔最終得分。
具體來說,作者首先使用 BERT 獲得文檔表示,并訓(xùn)練分類器判斷兩個(gè)文檔在圖中是否應(yīng)該存在連邊。
然后作者使用圖神經(jīng)網(wǎng)絡(luò)得到各個(gè)節(jié)點(diǎn)的表示,query 的表示以及整個(gè)圖的表示,從而計(jì)算多樣性得分。另外,在文檔選擇的過程中,采用貪心策略依次選擇得分最高的文檔,每次選擇文檔后,都將該文檔和 query 相連,而斷開和其他文檔的連接,從而更新 query 的表示,來表達(dá)已經(jīng)被覆蓋的 intent。
實(shí)驗(yàn)
經(jīng)實(shí)驗(yàn)證明,本文提出的方法顯著優(yōu)于已有的隱性建模的多樣化算法,而相比于顯性建模的算法,也取得了更好的效果。同時(shí)也通過消融實(shí)驗(yàn),證明了各個(gè)模塊的有效性。
結(jié)論
在本文中,作者提出了一種隱式監(jiān)督方法,該方法可利用圖結(jié)構(gòu)來模擬多個(gè)文檔對的關(guān)系,以實(shí)現(xiàn)搜索結(jié)果的多樣化。作者進(jìn)一步使用圖卷積網(wǎng)絡(luò)來提取包含局部和全局信息的多樣性特征。為了捕獲查詢的動(dòng)態(tài)信息需求,作者為意圖圖設(shè)計(jì)了一種圖更新算法,以便在文檔選擇過程中及時(shí)呈現(xiàn)情況。
實(shí)驗(yàn)結(jié)果證實(shí),本文的動(dòng)態(tài)意圖圖對于在多樣化任務(wù)中為文檔生成多樣性特征是有益且有意義的。將來,作者計(jì)劃通過結(jié)合更多信息來提高分類器的準(zhǔn)確性,并將意圖圖應(yīng)用于明確的搜索結(jié)果多樣化方法。
更多閱讀
#投 稿?通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優(yōu)質(zhì)內(nèi)容以更短路徑到達(dá)讀者群體,縮短讀者尋找優(yōu)質(zhì)內(nèi)容的成本呢?答案就是:你不認(rèn)識(shí)的人。
總有一些你不認(rèn)識(shí)的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學(xué)者和學(xué)術(shù)靈感相互碰撞,迸發(fā)出更多的可能性。?
PaperWeekly 鼓勵(lì)高校實(shí)驗(yàn)室或個(gè)人,在我們的平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是最新論文解讀,也可以是學(xué)術(shù)熱點(diǎn)剖析、科研心得或競賽經(jīng)驗(yàn)講解等。我們的目的只有一個(gè),讓知識(shí)真正流動(dòng)起來。
?????稿件基本要求:
? 文章確系個(gè)人原創(chuàng)作品,未曾在公開渠道發(fā)表,如為其他平臺(tái)已發(fā)表或待發(fā)表的文章,請明確標(biāo)注?
? 稿件建議以?markdown?格式撰寫,文中配圖以附件形式發(fā)送,要求圖片清晰,無版權(quán)問題
? PaperWeekly 尊重原作者署名權(quán),并將為每篇被采納的原創(chuàng)首發(fā)稿件,提供業(yè)內(nèi)具有競爭力稿酬,具體依據(jù)文章閱讀量和文章質(zhì)量階梯制結(jié)算
?????投稿通道:
? 投稿郵箱:hr@paperweekly.site?
? 來稿請備注即時(shí)聯(lián)系方式(微信),以便我們在稿件選用的第一時(shí)間聯(lián)系作者
? 您也可以直接添加小編微信(pwbot02)快速投稿,備注:姓名-投稿
△長按添加PaperWeekly小編
????
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點(diǎn)擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個(gè)推薦、解讀、討論、報(bào)道人工智能前沿論文成果的學(xué)術(shù)平臺(tái)。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號(hào)后臺(tái)點(diǎn)擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
總結(jié)
以上是生活随笔為你收集整理的SIGIR 2021|用于搜索多样化的意图图建模的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 山药的做法大全家常?
- 下一篇: 餐饮非遗保护措施与现实保护成效怎么写?