日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

虚拟专题:知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望

發(fā)布時(shí)間:2025/3/15 编程问答 41 豆豆
生活随笔 收集整理的這篇文章主要介紹了 虚拟专题:知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

來源:《大數(shù)據(jù)


知識(shí)圖譜多跳問答推理研究進(jìn)展、挑戰(zhàn)與展望

杜會(huì)芳1,?王昊奮1,?史英慧2,?王萌3

1?同濟(jì)大學(xué)設(shè)計(jì)創(chuàng)意學(xué)院

2?東南大學(xué)網(wǎng)絡(luò)空間與安全學(xué)院

3?東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院

?摘要近年來,知識(shí)圖譜問答在醫(yī)療、金融、政務(wù)等領(lǐng)域被廣泛應(yīng)用。用戶不再滿足于關(guān)于實(shí)體屬性的單跳問答,而是更多地傾向表達(dá)復(fù)雜的多跳問答需求。為了應(yīng)對(duì)上述復(fù)雜多跳問答,各種不同類型的推理方法被陸續(xù)提出。系統(tǒng)地介紹了基于嵌入、路徑、邏輯的多跳知識(shí)問答推理的最新研究進(jìn)展以及相關(guān)數(shù)據(jù)集和評(píng)測(cè)指標(biāo),并重點(diǎn)圍繞前沿問題進(jìn)行了討論。最后總結(jié)了現(xiàn)有方法的不足,并展望了未來的研究方向。

關(guān)鍵詞?知識(shí)圖譜?;?多跳問答?;?推理

論文引用格式:

杜會(huì)芳, 王昊奮, 史英慧, 等. 知識(shí)圖譜多跳問答推理研究進(jìn)展、挑戰(zhàn)與展望[J]. 大數(shù)據(jù), 2021, 7(3):60-79.

DU H F, WANG H F, SHI Y H, et al. Progress, challenges and research trends of reasoning in multi-hop knowledge graph based question answering[J]. Big Data Research, 2021, 7(3): 60-79.


1 引言

1.1 背景介紹

隨著大數(shù)據(jù)時(shí)代的來臨,幫助用戶在海量信息中快速找到想要的信息尤為重要。知識(shí)圖譜(knowledge graph,KG)以三元組的形式結(jié)構(gòu)化存儲(chǔ)海量信息,一個(gè)三元組可以表示為<eh,r,et>,其中eh表示頭實(shí)體,et表示尾實(shí)體,r表示頭實(shí)體與尾實(shí)體之間存在的關(guān)系。知識(shí)圖譜三元組之間也存在關(guān)聯(lián)關(guān)系,如上述三元組中的頭實(shí)體eh可能是另外一個(gè)三元組的尾實(shí)體。知識(shí)圖譜把海量互聯(lián)網(wǎng)信息表達(dá)成客觀世界可認(rèn)知的語(yǔ)義表示,具有強(qiáng)大的語(yǔ)義表達(dá)、存儲(chǔ)和表達(dá)能力,在工業(yè)界和學(xué)術(shù)界得到了廣泛關(guān)注和研究應(yīng)用。智能問答系統(tǒng)旨在針對(duì)用戶提出的復(fù)雜信息需求,允許用戶用自然語(yǔ)言問句的形式提問,并為用戶直接返回精準(zhǔn)的答案。得益于知識(shí)圖譜技術(shù)的快速發(fā)展,基于知識(shí)圖譜的問答(knowledge graph based question answering,KGQA)技術(shù)利用其豐富的結(jié)構(gòu)化語(yǔ)義信息,能夠深入理解用戶的問題,并給出準(zhǔn)確的答案,為用戶提供7×24小時(shí)的智能問答服務(wù),在醫(yī)療、教育、金融等多個(gè)領(lǐng)域凸顯出重要的應(yīng)用價(jià)值。

傳統(tǒng)KGQA以實(shí)體、屬性等單一具體對(duì)象為主,而在實(shí)際應(yīng)用場(chǎng)景中,用戶不再滿足于單跳的知識(shí)問答,如在醫(yī)療領(lǐng)域中的咨詢問題“常見的治療感冒藥物有哪些?”。用戶更多地傾向表達(dá)復(fù)雜的多跳問答推理問題,如“請(qǐng)問伴有中耳炎并發(fā)癥的感冒能用哪種藥物治療?”。而知識(shí)圖譜多跳問答(以下簡(jiǎn)稱多跳知識(shí)問答)即針對(duì)包含多跳關(guān)系的問題,在知識(shí)圖譜上進(jìn)行多步推理,繼而推斷得到答案的一項(xiàng)任務(wù)。

1.2 多跳知識(shí)問答推理分類

相比單跳問答,多跳知識(shí)問答需要在包含大量知識(shí)的知識(shí)圖譜中找到多個(gè)有關(guān)聯(lián)的三元組,并建模多跳長(zhǎng)路徑,這是更加具有挑戰(zhàn)性的任務(wù)。同時(shí)知識(shí)圖譜又是不完備的,長(zhǎng)路徑中任意一個(gè)三元組的不完整都會(huì)導(dǎo)致找不到正確的答案,這為多跳知識(shí)問答帶來了更大的挑戰(zhàn)。為了解決沒有明顯答案的復(fù)雜多跳查詢問題,模型需要基于知識(shí)圖譜已有知識(shí)進(jìn)行推理。作為多跳知識(shí)問答的關(guān)鍵技術(shù)支撐,推理為知識(shí)圖譜智能問答更快落地實(shí)際應(yīng)用發(fā)揮了重要作用。

本文總結(jié)多跳知識(shí)問答推理的最新研究方法,并將這些方法分為基于嵌入的多跳知識(shí)問答推理、基于路徑的多跳知識(shí)問答推理和基于邏輯的多跳知識(shí)問答推理3類方法。其中,基于嵌入的多跳知識(shí)問答推理方法是將知識(shí)圖譜元素(如實(shí)體、關(guān)系等)關(guān)聯(lián)到低維連續(xù)向量空間,然后通過定義得分函數(shù)或解碼器對(duì)目標(biāo)查詢對(duì)象進(jìn)行排名來得到答案。而基于路徑的多跳知識(shí)問答推理方法首先需要確定問題中的主題實(shí)體,然后在知識(shí)圖譜上隨機(jī)游走找到答案實(shí)體,代表性的工作有路徑排序算法(path ranking approach,PRA)。關(guān)于基于邏輯的多跳知識(shí)問答推理方法,本文將重點(diǎn)介紹以一階邏輯為主的熱點(diǎn)研究方法。圖1所示為基于知識(shí)圖譜的多跳問答推理方法分類,接下來綜述這些分類中最新方法的研究進(jìn)展、基本思路和存在的挑戰(zhàn)等。

圖1???基于知識(shí)圖譜的多跳問答推理方法分類

2 基于嵌入的多跳知識(shí)問答推理

基于嵌入的多跳知識(shí)問答推理方法是將問題和候選答案轉(zhuǎn)化為公共向量空間中的語(yǔ)義向量表示來進(jìn)行操作的方法,基于嵌入的具體操作方法可以分為基于語(yǔ)義匹配的方法、基于圖神經(jīng)網(wǎng)絡(luò)的方法和基于記憶網(wǎng)絡(luò)的方法。

(1)基于語(yǔ)義匹配的方法

本類方法首先計(jì)算問題和候選答案分布式表示之間的語(yǔ)義匹配,然后通過排序候選答案來得到最終答案。Bordes A等人將問題和知識(shí)圖譜三元組用嵌入的方式表示來表達(dá)特征的語(yǔ)義。然而,與翻譯模型TransE、TransH、TransR等關(guān)注嵌入表示的模型類似,這些方法只能回答簡(jiǎn)單問題。為了實(shí)現(xiàn)多跳問答推理以及應(yīng)對(duì)多跳知識(shí)高效建模的挑戰(zhàn),很多基于語(yǔ)義匹配的方法被提出。Bordes A等人在原來三元組表示方法的基礎(chǔ)上做了改進(jìn),通過對(duì)知識(shí)圖譜中的問答路徑和周圍子圖進(jìn)行編碼得到語(yǔ)義更加豐富的表示來推理得到答案。Dong L等人提出的多列卷積神經(jīng)網(wǎng)絡(luò)(multi-column convolutional neural network,MCCNN)模型進(jìn)一步地利用具有更強(qiáng)學(xué)習(xí)能力的神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí)答案路徑、答案背景信息以及答案類型的分布式表示,并理解問題,在不使用手動(dòng)特征及詞庫(kù)等的條件下,在問答數(shù)據(jù)集WebQuestions上取得了不錯(cuò)的結(jié)果。其中,答案路徑是答案節(jié)點(diǎn)和被詢問實(shí)體之間的一組關(guān)系;答案上下文指的是連接到答案路徑的單跳實(shí)體和關(guān)系;答案類型是如人名、日期等的類型。Hao Y C等人認(rèn)為MC-CNN模型沒有充分并合理地考慮候選答案的相關(guān)信息來訓(xùn)練問題嵌入的表示,提出了CrossAttention機(jī)制的神經(jīng)網(wǎng)絡(luò)模型來學(xué)習(xí)知識(shí)圖譜的全局信息,取得了更好的結(jié)果。但是以上幾種方法只能完成淺層多跳知識(shí)問答推理,對(duì)復(fù)雜長(zhǎng)路徑多跳問題的處理能力依然不足。

Saxena A等人提出的EmbedKGQA模型通過基于知識(shí)圖譜嵌入模型進(jìn)行鏈接預(yù)測(cè)來緩解多跳問答面臨的數(shù)據(jù)不完整問題,使其具有可以在復(fù)雜長(zhǎng)路徑上的多跳推理能力。EmbedKGQA模型使用C omplEx模型將知識(shí)圖譜中的實(shí)體和關(guān)系嵌入復(fù)數(shù)向量空間,同時(shí)采用ComplEx的打分函數(shù)φ預(yù)測(cè)答案。具體而言,對(duì)于一個(gè)給定的問題q,首先使用RoBERTa模型編碼初始向量,然后通過一個(gè)前饋神經(jīng)網(wǎng)絡(luò)將該向量表示投射到復(fù)數(shù)嵌入向量空間。問題q和其主題實(shí)體h以及知識(shí)圖譜中的任一實(shí)體a可以構(gòu)成三元組,其嵌入向量分別表示為q、h和a,如果a是q的目標(biāo)答案實(shí)體,則將(h,q,a)視為正樣本,并且使,否則將(h,q,a)視為負(fù)樣本,并使,負(fù)樣本可通過將正樣本中的答案實(shí)體替換為知識(shí)圖譜中其他非答案實(shí)體來獲得。EmbedKGQA使用大量的正負(fù)樣本訓(xùn)練數(shù)據(jù)學(xué)習(xí)問題和實(shí)體的嵌入向量表示,在推理階段則在嵌入空間中通過打分函數(shù)選擇得分最高的實(shí)體作為可能的目標(biāo)答案。

He G L等人認(rèn)為多跳知識(shí)問答推理算法只接收最終答案的反饋會(huì)使學(xué)習(xí)不穩(wěn)定或無效,學(xué)習(xí)推理過程中的監(jiān)督信號(hào)也非常重要,同時(shí)也能提升模型的可解釋性。由此,He G L等人提出了一種創(chuàng)新的Teacher-Student模型。TeacherStudent框架最早由Hinton G等人提出,用來做知識(shí)蒸餾,其中復(fù)雜的Teacher模型的預(yù)測(cè)被視為“軟標(biāo)簽”,一個(gè)輕量級(jí)Student模型被用于訓(xùn)練擬合軟標(biāo)簽。后來,一些Teacher-Student框架的研究逐漸被應(yīng)用到問答任務(wù)中來加快模型的推理速度。在He G L等人提出的模型中, Student網(wǎng)絡(luò)的目標(biāo)是找到問題的正確答案,而Teacher網(wǎng)絡(luò)試圖學(xué)習(xí)預(yù)測(cè)過程中的監(jiān)督信號(hào),以提高學(xué)生網(wǎng)絡(luò)的推理能力。Teacher網(wǎng)絡(luò)利用了正向和逆向雙向推理產(chǎn)生可靠的中間監(jiān)督信號(hào)來增強(qiáng)中間實(shí)體分布表示學(xué)習(xí)。在3個(gè)公開的數(shù)據(jù)集上證明了該模型的有效性。

基于語(yǔ)義匹配的方法多采用弱監(jiān)督學(xué)習(xí),減少了人工標(biāo)注的工作量,同時(shí)該方法能夠反映出用戶問題和知識(shí)圖譜知識(shí)的相似語(yǔ)義,為多跳推理問答的實(shí)現(xiàn)做了很好的基礎(chǔ)。如何讓基于語(yǔ)義匹配的方法學(xué)到更豐富和全面的知識(shí)圖譜信息是這種方法的關(guān)鍵。另外,增強(qiáng)表示方法的可解釋性也是重要的考慮因素。

(2)基于圖神經(jīng)網(wǎng)絡(luò)的方法

圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network,GCN)通過聚合知識(shí)圖譜中每個(gè)實(shí)體的鄰居實(shí)體來傳遞消息。GCN因?yàn)槠湓趫D結(jié)構(gòu)上的有效性和可伸縮性而受到廣泛利用,它是多跳推理方法采用的復(fù)雜圖神經(jīng)網(wǎng)絡(luò)的基礎(chǔ),如圖2所示。Schlichtkrull M等人提出關(guān)系圖卷積網(wǎng)絡(luò)(relational graph convolutional network,R-GCN),最早將圖卷積神經(jīng)網(wǎng)絡(luò)用于知識(shí)圖譜鏈接預(yù)測(cè)的研究任務(wù),通過聚合特定關(guān)系來擴(kuò)展GCN,使其適用于編碼多關(guān)系圖來預(yù)測(cè)多跳問題的答案。R-GCN模型整體是一個(gè)encoderdecoder架構(gòu),encoder通過圖卷積神經(jīng)網(wǎng)絡(luò)將實(shí)體的鄰域信息進(jìn)行聚合,更新實(shí)體的表示;decoder基于更新后的實(shí)體表示,采用打分函數(shù)來預(yù)測(cè)邊。然而,該模型缺乏透明度,無法為關(guān)系選擇提供可解釋的依據(jù)。相比R-GCN,Teru K等人提出的GraIL框架采用一種基于注意力機(jī)制的多關(guān)系圖神經(jīng)網(wǎng)絡(luò)模型來解決在知識(shí)圖譜上進(jìn)行歸納式關(guān)系預(yù)測(cè)的問題。該注意力機(jī)制不僅和兩個(gè)相鄰實(shí)體以及它們之間的關(guān)系有關(guān),也和需要被預(yù)測(cè)的目標(biāo)關(guān)系有關(guān)。最終利用兩個(gè)目標(biāo)實(shí)體的表示、子圖的表示以及預(yù)測(cè)關(guān)系的表示進(jìn)行打分,將最高得分作為預(yù)測(cè)結(jié)果。歸納學(xué)習(xí)方法GraIL顯式編碼知識(shí)圖譜中的規(guī)則以及利用的注意力機(jī)制增強(qiáng)了模型的可解釋性。

圖2???圖卷積神經(jīng)網(wǎng)絡(luò)

近年來,BERT(bidirectional encoder representations from transformers)、 RoBERTa等預(yù)訓(xùn)練語(yǔ)言模型在智能問答等自然語(yǔ)言處理(natural language processing,NLP)任務(wù)中取得了巨大的成功。但是預(yù)訓(xùn)練模型的知識(shí)是隱式學(xué)習(xí)的,無法明確表示出來,因此無法提供可解釋的預(yù)測(cè)。為了利用預(yù)訓(xùn)練模型學(xué)習(xí)到的豐富知識(shí),并且結(jié)合知識(shí)圖譜中的顯式知識(shí)提高可解釋性,許多預(yù)訓(xùn)練模型結(jié)合知識(shí)圖譜的問答模型被提出,Feng Y L等人提出的多跳圖關(guān)系網(wǎng)絡(luò)(multi-hop graph relation network,MHGRN)模型就是其中一種。MHGRN模型是一種新穎的多跳圖關(guān)系網(wǎng)絡(luò)模型,它結(jié)合了基于路徑的模型,具有可解釋性和基于GNN模型擴(kuò)展性強(qiáng)的優(yōu)點(diǎn),利用圖神經(jīng)網(wǎng)絡(luò)通過在實(shí)體之間傳遞消息來編碼結(jié)構(gòu)化信息,同時(shí)為了進(jìn)一步使模型具有顯式建模關(guān)系路徑的能力,將圖分解為路徑,并類似Lin B Y等人提出的知識(shí)感知型圖神經(jīng)網(wǎng)絡(luò)(knowledge-aware graph network, KagNet)采用長(zhǎng)短期記憶(long shortterm memory,LSTM)網(wǎng)絡(luò)對(duì)限定連接長(zhǎng)度的問題實(shí)體和答案實(shí)體的所有路徑進(jìn)行編碼,然后通過注意力機(jī)制聚合所有路徑嵌入來預(yù)測(cè)結(jié)果。

傳統(tǒng)智能問答解決方法是單獨(dú)從知識(shí)圖譜或者文本中推斷出答案。文本雖然是非結(jié)構(gòu)化的知識(shí),但是可以提供豐富的上下文信息,將文本與知識(shí)圖譜結(jié)構(gòu)化的優(yōu)勢(shì)結(jié)合是最新的研究熱點(diǎn)。

GRAFT-Net(graphs of relations among facts and text network)和PullNet(pull network)將外部文本語(yǔ)料庫(kù)和知識(shí)圖譜結(jié)合起來完成多跳問答任務(wù)。GRAFT-Net將Wikipedia語(yǔ)料庫(kù)中的文檔和知識(shí)圖譜中的實(shí)體建模作為節(jié)點(diǎn),將實(shí)體和文檔的鏈接關(guān)系(句子中包含此實(shí)體名詞)以及知識(shí)圖譜中實(shí)體之間存在的關(guān)系建模為邊,構(gòu)建問題子圖,以執(zhí)行多跳推理。具體而言,GRAFT-Net從問題出發(fā),首先由問題主題實(shí)體鏈接一些種子實(shí)體,再以種子實(shí)體為起點(diǎn),通過個(gè)性化頁(yè)面排名(personalized pagerank,PPR)算法從它們的鄰居實(shí)體中取出PPR分?jǐn)?shù)最高的幾個(gè)實(shí)體及相關(guān)聯(lián)的邊,并將它們都加入問題子圖中。同時(shí)從文本語(yǔ)料庫(kù)中檢索出5個(gè)與問題高度相關(guān)的句子,并將可以鏈接到這些句子的實(shí)體一并加入問題子圖中。最終問題子圖由句子節(jié)點(diǎn)、實(shí)體節(jié)點(diǎn)以及句子和實(shí)體之間的鏈接關(guān)系、實(shí)體和實(shí)體之間的關(guān)系構(gòu)成。GRAFT-Net將實(shí)體節(jié)點(diǎn)隨機(jī)初始化為一個(gè)固定長(zhǎng)度的向量,然后基于圖卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和更新問題子圖中節(jié)點(diǎn)的向量表示,最后對(duì)問題子圖中的實(shí)體節(jié)點(diǎn)進(jìn)行二分類來預(yù)測(cè)出哪些是答案實(shí)體,以完成推理過程。GRAFT-Net使用啟發(fā)式算法構(gòu)建的問題子圖規(guī)模過大,并且很多時(shí)候可能不包含答案。PullNet同樣基于圖卷積網(wǎng)絡(luò),但不同于GRAFT-Net, PullNet不要求將整個(gè)子圖一步構(gòu)建完成,而是迭代式學(xué)習(xí)構(gòu)建的過程。PullNet迭代地構(gòu)建問題子圖,初始子圖只包括問題及其中的實(shí)體,每一次迭代時(shí),首先使用圖卷積網(wǎng)絡(luò)計(jì)算將子圖中的實(shí)體節(jié)點(diǎn)加入下一個(gè)迭代過程的概率,確定所有輸出概率大于設(shè)定閾值的實(shí)體,然后對(duì)每一個(gè)被選擇的實(shí)體,從文本語(yǔ)料庫(kù)檢索出相關(guān)的句子集合,從知識(shí)圖譜檢索出相關(guān)的三元組集合,將新檢索到的句子、三元組、句子中的實(shí)體以及三元組的頭實(shí)體和尾實(shí)體都視為新的節(jié)點(diǎn),將新節(jié)點(diǎn)之間的聯(lián)系視為新邊,用新節(jié)點(diǎn)和新邊更新問題子圖。子圖構(gòu)建完成后,PullNet使用與GRAFT-Net相同的方法對(duì)節(jié)點(diǎn)進(jìn)行分類,找出最可能的答案實(shí)體。

基于圖神經(jīng)網(wǎng)絡(luò)的方法在處理知識(shí)圖譜數(shù)據(jù)時(shí)具有更強(qiáng)的表達(dá)力,能夠充分考慮問題中主題實(shí)體在圖譜中的相關(guān)實(shí)體和關(guān)系信息,但是依然存在實(shí)體鄰居信息稀疏時(shí)語(yǔ)義表示效果較差的挑戰(zhàn)。另外,隨著實(shí)體和關(guān)系不斷加入子圖中,計(jì)算成本和內(nèi)存消耗會(huì)迅速增加。盡管基于注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)能夠自適應(yīng)地學(xué)習(xí)鄰居的重要性權(quán)重,但是依然不能完全解決此類問題。

(3)基于記憶網(wǎng)絡(luò)的方法

傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、LSTM網(wǎng)絡(luò)等深度學(xué)習(xí)模型使用隱藏層狀態(tài)作為其記憶模塊,但是這種方法產(chǎn)生的記憶力太短程,無法精確記住被轉(zhuǎn)化為稠密向量的長(zhǎng)路徑知識(shí)。Weston J等人提出了一種可讀寫的外部記憶模塊,聯(lián)合記憶模塊保存場(chǎng)景信息,以實(shí)現(xiàn)長(zhǎng)期記憶的目標(biāo)。該方法中的記憶網(wǎng)絡(luò)包括I(input feature map)、G(generalization)、O(output feature map)、R(response)4個(gè)組件。I用來將輸入轉(zhuǎn)化為內(nèi)部特征向量表示;G用來更新記憶,并插入記憶槽中;O根據(jù)新的輸入和當(dāng)前的記憶狀態(tài)輸出特征映射表示;R把組件O的結(jié)果轉(zhuǎn)化為想要的輸出形式,如文本回答。該模型是本文接下來要介紹的復(fù)雜記憶網(wǎng)絡(luò)多跳知識(shí)問答推理方法的基礎(chǔ),如圖3所示。

圖3???記憶網(wǎng)絡(luò)模型框架

基于Weston J等人提出的記憶網(wǎng)絡(luò)模型,Miller A等人提出了鍵值記憶網(wǎng)絡(luò)(key-value memory network,KVMemNN)模型,通過迭代更新存儲(chǔ)鍵值對(duì)(key-value)的記憶槽來完成多跳推理任務(wù)。此處的key指三元組中頭實(shí)體和關(guān)系的組合,value指尾實(shí)體。與Weston J等人提出的記憶網(wǎng)絡(luò)相比,該模型能夠處理結(jié)構(gòu)復(fù)雜的知識(shí)圖譜知識(shí)。該模型通過以下過程完成一次迭代更新:首先使用向量表示用戶問題和知識(shí)圖譜三元組,通過用戶問題檢索知識(shí)圖譜得到相關(guān)子集,并作為鍵值記憶槽,然后計(jì)算每一個(gè)key和問題的相關(guān)程度評(píng)分,根據(jù)評(píng)分對(duì)每個(gè)value加權(quán)求和,最后用得到的value向量更新問題向量。經(jīng)過以上N步迭代后,對(duì)問題向量進(jìn)行分類,最終得到多跳問題的答案。KV-MemNN模型結(jié)構(gòu)簡(jiǎn)單,通用性強(qiáng),通過向量的迭代更新來進(jìn)行隱式推理。然而,復(fù)雜問題需要進(jìn)行多次迭代表示,同時(shí)需要對(duì)應(yīng)構(gòu)造記憶槽,容易造成內(nèi)存不足以及訓(xùn)練時(shí)間慢等問題?;贙VMemNN模型,Xu K等人提出了一個(gè)新的用戶問題表示更新機(jī)制,即在更新時(shí)不考慮問題中已經(jīng)定位到的key值。該模型將問題分解為針對(duì)記憶的查詢序列,基于上述更新機(jī)制,可以增強(qiáng)多跳復(fù)雜問題的推理能力。但是上述方法對(duì)問題和知識(shí)圖譜三元組分開進(jìn)行編碼,忽略了兩者之間的交互作用。因此,Chen Y等人提出了雙向注意記憶網(wǎng)絡(luò)模型,該模型利用注意機(jī)制捕捉問題與知識(shí)圖譜信息之間的相關(guān)性,并利用此相關(guān)性增強(qiáng)問題的表征來提高推理答案的能力。

Das R等人在2017年提出采用記憶網(wǎng)絡(luò)并基于通用模式在知識(shí)圖譜和文本上進(jìn)行多跳知識(shí)問答推理,該框架通過將結(jié)構(gòu)化知識(shí)圖譜和非結(jié)構(gòu)化文本在一個(gè)公共嵌入空間中對(duì)齊,相比單獨(dú)使用知識(shí)圖譜或文本取得了更好的效果。動(dòng)態(tài)記憶網(wǎng)絡(luò)(dynamic memory network,DMN)模型和動(dòng)態(tài)記憶張量網(wǎng)絡(luò)(dynamic memory tensor network,DMTN)模型采用動(dòng)態(tài)記憶網(wǎng)絡(luò),允許模型將注意力集中在之前迭代的輸入和結(jié)果上,形成情景記憶,然后在一個(gè)層次遞歸序列模型中推理得到答案。兩者不同的是,DMN采用門函數(shù)實(shí)現(xiàn)注意力機(jī)制,而DMTN采用的是神經(jīng)張量網(wǎng)絡(luò),以實(shí)現(xiàn)更好的推理效果。

以上記憶網(wǎng)絡(luò)模型都取得了不錯(cuò)的效果,但是模型依然具有“黑盒”特性,可解釋性差。為了使多跳知識(shí)問答推理過程更加可信,一些方法在保證模型準(zhǔn)確率的同時(shí)也嘗試增強(qiáng)模型的可解釋性。Zhou M T等人提出的解釋推理網(wǎng)絡(luò)(interpretable reasoning network, IRN)是一種新穎的具有可解釋性的記憶網(wǎng)絡(luò)推理模型,它采用可解釋的逐跳推理過程來回答問題。該模型可以動(dòng)態(tài)地決定輸入問題的哪一部分應(yīng)該在哪一跳進(jìn)行分析,預(yù)測(cè)與當(dāng)前解析結(jié)果相對(duì)應(yīng)的關(guān)系,并利用預(yù)測(cè)的關(guān)系更新問題表示和推理過程的狀態(tài),然后驅(qū)動(dòng)下一跳推理。該模型可以為推理分析和故障診斷提供可追蹤和可觀察的中間預(yù)測(cè),從而允許人工操作來預(yù)測(cè)最終答案,這個(gè)過程提高了模型的透明度和可信賴度。

3 基于路徑的多跳知識(shí)問答推理

為了更好地建模多跳知識(shí),基于路徑的方法受到了廣泛關(guān)注。知識(shí)圖譜中的結(jié)構(gòu)化知識(shí)以三元組的形式存在,基于路徑的多跳知識(shí)問答推理以用戶問題中的主題實(shí)體為源實(shí)體,沿著知識(shí)圖譜多個(gè)三元組的頭實(shí)體、關(guān)系、尾實(shí)體的逐跳路徑進(jìn)行搜索,找到答案實(shí)體或者關(guān)系,通常包括3個(gè)階段:處理輸入問題、對(duì)知識(shí)圖譜進(jìn)行推理、預(yù)測(cè)答案。以下將基于路徑的多跳知識(shí)問答推理方法分為基于強(qiáng)化學(xué)習(xí)的方法、基于查詢圖的方法。

(1)基于強(qiáng)化學(xué)習(xí)的方法

路徑排序算法(path-ranking algorithm,PRA)是一種有效的大規(guī)模知識(shí)圖譜推理路徑學(xué)習(xí)方法?;诼窂脚判蛩惴ǖ亩嗵R(shí)問答推理方法的主要思想是利用實(shí)體之間的復(fù)雜路徑特征來學(xué)習(xí)隨機(jī)游走器,進(jìn)而推斷出答案。

與PRA基于隨機(jī)游走的路徑查找模型不同,Xiong W H等人提出的DeepPath是一種創(chuàng)新的可控多跳推理方法。該方法將路徑搜索轉(zhuǎn)化為強(qiáng)化學(xué)習(xí)過程,該過程允許通過控制所找到的路徑的屬性來減小搜索空間。模型如圖4所示,該強(qiáng)化學(xué)習(xí)方法包括兩部分:第一部分是被建模為馬爾可夫決策過程的外部環(huán)境,指定智能體和知識(shí)圖譜之間的動(dòng)態(tài)交互;第二部分是策略網(wǎng)絡(luò)智能體,將狀態(tài)向量映射到隨機(jī)策略中。在每一步中,通過與環(huán)境的交互,智能體學(xué)習(xí)選擇一個(gè)關(guān)系鏈接來擴(kuò)展推理路徑。為了更好地指導(dǎo)強(qiáng)化學(xué)習(xí)智能體學(xué)習(xí)到目標(biāo)關(guān)系路徑,與之前的研究相比,該方法更多地考慮了獎(jiǎng)勵(lì)的設(shè)置,在準(zhǔn)確性、多樣性和精確度3個(gè)方面采用獎(jiǎng)勵(lì)機(jī)制,監(jiān)督每一跳的行動(dòng),具體方式如下。

圖4???DeepPath模型

環(huán)境設(shè)置中,強(qiáng)化學(xué)習(xí)智能體的決策數(shù)量包括正確決策的數(shù)量以及錯(cuò)誤決策的數(shù)量,總體數(shù)量很大。其中,錯(cuò)誤決策序列的數(shù)量會(huì)隨著路徑的長(zhǎng)度呈指數(shù)增長(zhǎng)。鑒于此挑戰(zhàn),DeepPath模型添加的第一個(gè)獎(jiǎng)勵(lì)函數(shù)定義如下:

相比長(zhǎng)路徑,短路徑通常能提供更多可靠的推理證據(jù)。短路徑鏈條通過限制智能體與環(huán)境交互的長(zhǎng)度,提升推理的效率。因此,DeepPath定義高效獎(jiǎng)勵(lì)如下:

其中,p為一個(gè)序列關(guān)系,如。

知識(shí)圖譜中存在很多語(yǔ)義相似的實(shí)體,這導(dǎo)致智能體有可能尋找到具有相似語(yǔ)法和語(yǔ)義的路徑,這些路徑通常包含冗余信息。為了鼓勵(lì)智能體找到多樣化的路徑,DeepPath使用當(dāng)前路徑和已有路徑之間的余弦相似度定義一個(gè)多樣化獎(jiǎng)勵(lì)函數(shù):

其中,表示的嵌入向量,F表示已經(jīng)存在的關(guān)系路徑個(gè)數(shù)。

Meilicke C等人提出的AnyBRUL (reinforced anytime bottom up rule learning)方法同樣利用強(qiáng)化學(xué)習(xí)對(duì)路徑進(jìn)行采樣,基于采樣路徑構(gòu)造基本規(guī)則,并將其推廣為抽象規(guī)則。DeepPath和AnyBRUL都要求首先對(duì)頭實(shí)體和尾實(shí)體之間的所有路徑進(jìn)行取樣,然后利用它們來評(píng)估尾實(shí)體是否為正確的答案,因此,它無法應(yīng)對(duì)找不到尾實(shí)體的情況。與DeepPath和AnyBRUL需要預(yù)先計(jì)算路徑的方式不同,有些方法通過給定的頭實(shí)體和查詢關(guān)系利用訓(xùn)練模型來獲得正確的答案實(shí)體。在這些模型中,Das R等人在2018年提出的MINERVA(meandering in networks of entities to reach verisimilar answer)是一個(gè)代表性模型。與DeepPath不同的是,MINERVA的狀態(tài)由查詢關(guān)系和部分路徑的嵌入組成,在抽樣過程中不需要嵌入答案實(shí)體。

強(qiáng)化學(xué)習(xí)模型通常采用一個(gè)0/1的硬獎(jiǎng)勵(lì)來監(jiān)督抽樣過程,指示抽樣實(shí)體是否為正確的答案實(shí)體。Lin X V等人提出的RS(reward shaping)在最后一步采用基于正確答案實(shí)體和采樣實(shí)體之間的軟獎(jiǎng)勵(lì),而不是使用0/1的硬獎(jiǎng)勵(lì)。此外,受dropout技術(shù)的啟發(fā),RS模型在訓(xùn)練過程中為了避免選擇大量的重復(fù)路徑,緩解過擬合,采用了dropout技術(shù)。Shen Y L等人提出的M-Walk引入了一種基于值的強(qiáng)化學(xué)習(xí)方法,并使用蒙特卡洛樹搜索來克服稀疏正獎(jiǎng)勵(lì)的挑戰(zhàn)。Chen W H等人提出的DIVA將推理任務(wù)當(dāng)作一個(gè)由尋找路徑和答案推理組成的統(tǒng)一模型,其中路徑建模為隱變量,采用AEVB(autoencoding variational Bayes)對(duì)模型進(jìn)行求解。

基于強(qiáng)化學(xué)習(xí)的方法把多跳知識(shí)問答推理任務(wù)當(dāng)作序列決策過程,只需一些目標(biāo)即可得到泛化能力較強(qiáng)的模型,無須大量的標(biāo)注語(yǔ)料。但是在面臨復(fù)雜的多跳知識(shí)推理場(chǎng)景時(shí),智能體的決策能力往往不足。

(2)基于查詢圖的方法

基于路徑排序的方法容易造成搜索空間爆炸,而基于查詢圖的方法是基于路徑方法的擴(kuò)展,與基于路徑的方法生成從主題實(shí)體到答案的路徑方式不同,基于查詢圖的方法使用圖來表示問題,并圍繞主題實(shí)體擴(kuò)展出一個(gè)子圖,基于查詢圖的方法比基于路徑的方法更具表示能力。

早期的基于語(yǔ)義解析的方法 將自然語(yǔ)言問題轉(zhuǎn)換為結(jié)構(gòu)化的查詢(如SPARQL查詢),在知識(shí)圖譜上執(zhí)行查詢可以得到問題的答案。Reddy S等人等人充分使用了組合范疇語(yǔ)法(combinatory categorial grammar,CCG)的表示能力,并提出Graph Parser模型來解析問題,受此啟發(fā),Yih W T等人在2015年定義了查詢圖的概念,并提出了一個(gè)分階段的查詢圖生成(staged query graph generation,STAGG)模型來處理知識(shí)圖譜問答,查詢圖可以直接匹配為問題的邏輯形式,進(jìn)而翻譯成查詢,因此語(yǔ)義解析問題可歸結(jié)為查詢圖生成問題。STAGG定義了3個(gè)階段來生成查詢圖:首先,使用現(xiàn)有的實(shí)體鏈接工具獲取候選主題實(shí)體,并對(duì)其評(píng)分;然后,STAGG探索主題實(shí)體和答案節(jié)點(diǎn)之間的所有關(guān)系路徑,為了限制搜索空間,它僅在下一跳的節(jié)點(diǎn)是一個(gè)復(fù)合類型(compound value type,CVT)節(jié)點(diǎn)時(shí),探索長(zhǎng)度為2的路徑,否則只考慮長(zhǎng)度為1的路徑,使用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)所有關(guān)系路徑進(jìn)行打分,以判斷當(dāng)前選擇的關(guān)系與問題的匹配程度;最后,根據(jù)啟發(fā)式規(guī)則將約束節(jié)點(diǎn)附加到關(guān)系路徑上。在這3個(gè)階段的每個(gè)階段,都使用對(duì)數(shù)線性模型對(duì)當(dāng)前的部分查詢圖進(jìn)行評(píng)分,并輸出最佳的最終查詢圖來查詢知識(shí)圖譜。STAGG有效地使用了知識(shí)圖譜中的信息來裁剪語(yǔ)義解析空間,從而簡(jiǎn)化了任務(wù)難度。

針對(duì)STAGG無法回答涵蓋復(fù)雜約束的問題,Bao J W等人擴(kuò)展了約束類型和運(yùn)算符,新增了類型約束以及顯式和隱式時(shí)間約束等,將多重約束問題轉(zhuǎn)化為多重約束查詢圖(multi-constraint query graph,MulCG)來實(shí)現(xiàn)推理,MulCG仍然遵循STAGG的框架,但提供了更多規(guī)則,以應(yīng)對(duì)復(fù)雜問題。STAGG和MulCG等方法都要求首先將問題中的候選主題實(shí)體鏈接到知識(shí)圖譜的實(shí)體上,實(shí)體鏈接的質(zhì)量將影響后續(xù)的推理效果。Yu M等人將知識(shí) 圖譜問答分為實(shí)體鏈接和關(guān)系檢測(cè)兩個(gè)關(guān)鍵的子任務(wù),并提出了一個(gè)殘差學(xué)習(xí)增強(qiáng)的分級(jí)的雙向LSTM(hierarchical residual bidirectional LSTM,HRBiLSTM)用于關(guān)系檢測(cè)。對(duì)于實(shí)體鏈接,他們觀察到,在SimpleQuestions數(shù)據(jù)集上主題實(shí)體識(shí)別的Top-1準(zhǔn)確率只有72.7%,因此在由實(shí)體鏈接器產(chǎn)生初始的候選主題實(shí)體后,又將問題文本輸入HR-BiLSTM中,HR-BiLSTM對(duì)問題以及在知識(shí)圖譜中與候選主題實(shí)體相關(guān)聯(lián)的關(guān)系進(jìn)行不同抽象級(jí)別的編碼,并計(jì)算兩者的相似度得分,僅保留與那些得分較高的關(guān)系相關(guān)聯(lián)的候選主題實(shí)體。在確定了新的主題實(shí)體后,同樣使用HR-BiLSTM選擇新的關(guān)系,以逐步地生成查詢。在處理問題約束時(shí),HRBiLSTM也遵循STAGG中的慣例。

為了限制搜索空間,STAGG只能探索2跳之內(nèi)的路徑,無法回答涉及更多跳推理的問題。Lan Y S等人改進(jìn)了STAGG方法,使其可以應(yīng)對(duì)更長(zhǎng)的關(guān)系路徑,即在擴(kuò)展路徑的同時(shí)加入約束,而不是只在建立關(guān)系路徑之后再添加約束,如此可以有效地縮減搜索空間,改進(jìn)的分級(jí)查詢圖生成方法可以同時(shí)處理包含約束的問答和涉及多跳的問答,該方法在WebQuestionsSP(WebQSP)系列數(shù)據(jù)集上取得了優(yōu)異的表現(xiàn)。

基于路徑的多跳知識(shí)問答推理方法具有較好的可解釋性。但只能處理關(guān)系型知識(shí),在處理屬性型、事實(shí)型知識(shí)時(shí),建模復(fù)雜。

4 基于邏輯的多跳知識(shí)問答推理

基于符號(hào)邏輯規(guī)則的方法因其準(zhǔn)確率高、可解釋性強(qiáng)等優(yōu)點(diǎn),在多跳知識(shí)問答推理研究中被廣泛探討。其中,作為邏輯規(guī)則的主要方法,或結(jié)合概率邏輯方法,或結(jié)合知識(shí)嵌入方法,一階邏輯近幾年已成為研究熱點(diǎn)。本節(jié)重點(diǎn)介紹基于一階邏輯的多跳知識(shí)推理方法的思路。

結(jié)合一階邏輯的自然性和概率邏輯模型的不確定性優(yōu)點(diǎn),馬爾可夫邏輯網(wǎng)絡(luò)方法已被證明在知識(shí)圖推理上的有效性。然而,在大規(guī)模知識(shí)圖譜上由于三元組之間的復(fù)雜結(jié)構(gòu),以上方法推理過程困難,效率較低?;谧⒁饬C(jī)制的圖神經(jīng)網(wǎng)絡(luò)擅長(zhǎng)處理高度復(fù)雜的圖問題, Vardhan V H等人提出的概率邏輯圖注意力網(wǎng)絡(luò)(probabilistic logic graph attention network,pGAT)用變分EM算法優(yōu)化了由馬爾可夫邏輯網(wǎng)絡(luò)定義的所有可能三元組的聯(lián)合分布。這有助于模型有效地結(jié)合一階邏輯和圖注意力網(wǎng)絡(luò)。該推理模型的提出為多跳知識(shí)問答提供了有利的參考。

近年來,為了解決知識(shí)圖譜存在的規(guī)模龐大和不完整問題,邏輯規(guī)則與知識(shí)嵌入相結(jié)合的研究受到很多關(guān)注。圖查詢嵌入(graph query embedding,GQE)、Query2Box以及BetaE等方法將查詢表示成有向無環(huán)的計(jì)算圖,計(jì)算圖指明了在知識(shí)圖譜上進(jìn)行多跳推理以獲得目標(biāo)答案的步驟。這些方法將一階邏輯運(yùn)算符看作可通過訓(xùn)練習(xí)得的幾何操作,它們都以查詢包含的主題實(shí)體的嵌入向量為起點(diǎn),迭代地使用幾何操作生成查詢的嵌入向量,然后通過在向量空間中計(jì)算實(shí)體嵌入與查詢嵌入的距離來預(yù)測(cè)答案。

GQE主要關(guān)注一階邏輯查詢的一個(gè)子集,即只涉及存在量詞和合取運(yùn)算的查詢。GQE提出了兩個(gè)核心的幾何運(yùn)算符P (projection)和I(intersection),其中P負(fù)責(zé)根據(jù)下一跳的關(guān)系r將當(dāng)前生成的查詢嵌入qq投射為新的查詢嵌入向量,I負(fù)責(zé)聚集計(jì)算圖中出邊指向同一個(gè)節(jié)點(diǎn)的所有頂點(diǎn)的嵌入向量表示,以模擬邏輯合取運(yùn)算。P和I由式(4)實(shí)現(xiàn):

其中,和是關(guān)于關(guān)系r的可訓(xùn)練的參數(shù)矩陣,NNk是一個(gè)k層的前饋神經(jīng)網(wǎng)絡(luò),Ψ是一個(gè)對(duì)稱的向量函數(shù)。

GQE將查詢嵌入為向量空間中的一個(gè)點(diǎn)。Query2Box認(rèn)為復(fù)雜的一階邏輯查詢對(duì)應(yīng)一個(gè)答案實(shí)體集合,但目前一個(gè)點(diǎn)不能有效地建模一個(gè)集合,并且在向量空間中對(duì)兩個(gè)點(diǎn)做邏輯運(yùn)算也不自然,故Query2Box將查詢嵌入為向量空間中的box。box由中心點(diǎn)和偏移兩部分組成,答案實(shí)體嵌入為一個(gè)點(diǎn)應(yīng)包含在對(duì)應(yīng)的box中,關(guān)系嵌入也表示成中心點(diǎn)和偏移項(xiàng)兩部分。查詢包含的實(shí)體節(jié)點(diǎn)的嵌入被初始化為偏移項(xiàng)為0的box,對(duì)于當(dāng)前輸入的box嵌入p和下一跳關(guān)系嵌入r,關(guān)系嵌入也表示成中心點(diǎn)和偏移項(xiàng)兩部分,P操作通過在向量空間中將p和r相加產(chǎn)生新的box,I操作取多個(gè)box的交集作為結(jié)果,按照計(jì)算圖中的運(yùn)算逐步推理,即可生成查詢最終的box嵌入。Query2Box還在GQE的基礎(chǔ)上增加了析取V運(yùn)算,擴(kuò)充了邏輯查詢的功能。GQE和Query2Box等方法將查詢嵌入為閉區(qū)域,比如歐幾里得空間中的一個(gè)點(diǎn)或一個(gè)box,而因?yàn)閷?duì)閉區(qū)域取補(bǔ)并不能得到閉區(qū)域,所以這些方法不能支持邏輯取負(fù)運(yùn)算,并且不能對(duì)不確定性進(jìn)行建模。有別于Query2Box等,BetaE將實(shí)體和查詢嵌入為[0,1]區(qū)間上的𝛃分布,并為𝛃向量定義了概率關(guān)系投射、概率交和概率取負(fù)3個(gè)概率邏輯運(yùn)算符,以支持任何形式的一階邏輯查詢。對(duì)𝛃分布的參數(shù)取倒數(shù)即實(shí)現(xiàn)了取負(fù)運(yùn)算,即將高概率密度區(qū)域轉(zhuǎn)換為低概率密度區(qū)域,反之亦然。對(duì)于概率投射,BetaE為每一種關(guān)系類型學(xué)習(xí)一個(gè)多層感知器,以將一個(gè)𝛃向量通過下一跳的關(guān)系r匹配到另一個(gè)𝛃向量,BetaE將概率交定義為多個(gè)𝛃向量的帶權(quán)積。同樣,按照計(jì)算圖中的推理次序?qū)ζ鹗嫉?#x1d6c3;向量做變換,即可生成查詢對(duì)應(yīng)的𝛃分布,然后在嵌入空間選擇與查詢嵌入概率最相近的實(shí)體集作為答案。

基于一階邏輯查詢的多跳知識(shí)問答推理方法具有嚴(yán)密性、自然性,且準(zhǔn)確率高。為了模擬不確定性,一些研究將邏輯運(yùn)算和概率邏輯結(jié)合,或者將邏輯運(yùn)算轉(zhuǎn)換為嵌入向量空間的幾何操作,理論上可以進(jìn)行任意跳數(shù)的推理。但這些模型都不能很好地處理復(fù)雜知識(shí)查詢。

5 實(shí)驗(yàn)評(píng)測(cè)

對(duì)多跳知識(shí)問答推理模型在現(xiàn)有的數(shù)據(jù)集上進(jìn)行評(píng)估可以驗(yàn)證模型的性能表現(xiàn)。目前常用的自然語(yǔ)言問答數(shù)據(jù)集有MetaQA、WebQuestionsSP和ComplexWebQuestions (CWQ)等,另外,鏈接預(yù)測(cè)領(lǐng)域常用的數(shù)據(jù)集(如FB15k和FB15k-237等)也被用來構(gòu)造查詢形式的問答,實(shí)現(xiàn)在知識(shí)圖譜上的推理。本節(jié)將介紹這些常用的評(píng)測(cè)數(shù)據(jù)集及評(píng)測(cè)指標(biāo),并對(duì)前文所述方法在以上數(shù)據(jù)集上的表現(xiàn)進(jìn)行了對(duì)比分析。

5.1 評(píng)測(cè)數(shù)據(jù)集

(1)MetaQA數(shù)據(jù)集

MetaQA數(shù)據(jù)集是基于WikiMovies數(shù)據(jù)集構(gòu)建的多跳問答數(shù)據(jù)集,它包含超過40萬個(gè)電影領(lǐng)域的多跳問題,這些問題有Vanilla、NTM和Audio 3個(gè)版本。Vanilla版本的MetaQA常被用于多跳知識(shí)問答推理任務(wù),它除了包含1跳、2跳和3跳3種類型的問答數(shù)據(jù),還包含一個(gè)知識(shí)圖譜,其有約135 000個(gè)三元組、43 000個(gè)實(shí)體以及9種關(guān)系。

(2)WebQuestionsSP數(shù)據(jù)集

Yih W T等人對(duì)WebQuestions數(shù)據(jù)集改進(jìn)后提出了WebQuestionsSP數(shù)據(jù)集。WebQuestions是為了解決真實(shí)問題而構(gòu)造的數(shù)據(jù)集,其問題來源于谷歌建議應(yīng)用程序接口(Google suggest API),答案由眾包平臺(tái)Amazon Mechanic Turk通過人工標(biāo)注生成。WebQuestions只包含了問題的答案,沒有提供問題對(duì)應(yīng)的查詢語(yǔ)句,針對(duì)此缺點(diǎn),WebQSP為每個(gè)問題構(gòu)造了其對(duì)應(yīng)的SPARQL查詢表達(dá),并刪除了一些表達(dá)有歧義以及無清晰意圖或答案的問題。WebQSP包含4 737個(gè)1跳或2跳問題,問題的答案可以在Freebase知識(shí)庫(kù)中找到。

(3)ComplexWebQuestions數(shù)據(jù)集

Talmor A等人基于WebQSP構(gòu)建了ComplexWebQuestions數(shù)據(jù)集。首先從WebQSP中采樣問題及其SPARQL查詢,并自動(dòng)地構(gòu)造更復(fù)雜的包含組合、連接、比較級(jí)以及最高級(jí)等形式的SPARQL查詢,最后由Amazon Mechanic Turk眾包平臺(tái)將這些SPARQL查詢重組為自然語(yǔ)言問題,問題的答案通過在Freebase中執(zhí)行SPARQL查詢獲得。CWQ共包含34 689個(gè)問題及其對(duì)應(yīng)的答案和SPARQL查詢。

(4)其他數(shù)據(jù)集

FB15k是Freebase的一個(gè)子集,也是知識(shí)圖譜補(bǔ)全領(lǐng)域的一個(gè)基準(zhǔn)數(shù)據(jù)集,由三元組構(gòu)成。為了解決FB15k測(cè)試集數(shù)據(jù)泄露的問題,Toutanova K等人在FB15k的基礎(chǔ)上構(gòu)建了FB15k-237,并且移除了FB15k中反向的關(guān)系。NELL995數(shù)據(jù)集由NELL系統(tǒng)構(gòu)建而來。

5.2 評(píng)測(cè)指標(biāo)

Hits@1、F1分?jǐn)?shù)、平均倒數(shù)排名(mean reciprocal rank,MRR)和平均精度均值(mean average precision,MAP)是常用來評(píng)估多跳知識(shí)問答模型效果的指標(biāo)。把問答視為問題答案檢索任務(wù),Hits@1是指正確答案是最終排序的第一個(gè)的占比。F1分?jǐn)?shù)是指檢索到的答案的精確率和召回率的調(diào)和平均,取在所有問題上的F1分?jǐn)?shù)的平均作為模型最終的F1結(jié)果。MRR指所有正確答案實(shí)體排名的倒數(shù)的均值。MAP指對(duì)所有查詢的平均正確率(average precision,AP)取均值的結(jié)果。

5.3 實(shí)驗(yàn)結(jié)果及分析

表1列出了部分多跳知識(shí)推理方法在相同實(shí)驗(yàn)數(shù)據(jù)集(MetaQA、WebQSP和CWQ)上Hits@1的結(jié)果,“-”表示在原文獻(xiàn)中對(duì)應(yīng)指標(biāo)的結(jié)果未給出,1-hop、2-hop和3-hop表示由源實(shí)體到目標(biāo)答案實(shí)體推理時(shí)分別需要經(jīng)過1跳、2跳和3跳。

由表1可以看出,在MetaQA數(shù)據(jù)集上,對(duì)于單跳問題,幾個(gè)模型的Hits@1結(jié)果相近,而隨著推理跳數(shù)增加,KVMemNN和GRAFT-Net兩個(gè)模型的性能有了明顯的下降。相較于KV-MemNN和GRAFT-Net,PullNet在3跳問題上仍然取得了不錯(cuò)的表現(xiàn),且PullNet在3個(gè)數(shù)據(jù)集上都取得了顯著的結(jié)果,充分顯示了其提出的迭代構(gòu)建問題子圖方法的有效性以及圖神經(jīng)網(wǎng)絡(luò)在基于知識(shí)圖譜的多跳推理問題上的適用性。相比KV-MemNN、GRAFT-Net和PullNet, EmbedKGQA在MetaQA數(shù)據(jù)集的平均Hits@1值更高,在WebQSP數(shù)據(jù)集上也表現(xiàn)突出,證明了EmbedKGQA基于語(yǔ)義匹配的方法在解決多跳問答問題上的有效性。NSM+h總體上優(yōu)于表1中的其他所有模型,表明了使用Teacher-Student網(wǎng)絡(luò)模型學(xué)習(xí)中間監(jiān)督信號(hào)可以很好地提升推理能力。

表2列出了基于邏輯的模型(GQE、Q2B(Query2Box)、BetaE)在FB15k、FB15k-237和NELL-995 3個(gè)數(shù)據(jù)集上多跳推理的結(jié)果。

對(duì)比它們的結(jié)果可以看出,對(duì)于表2中所有數(shù)據(jù)集,Q2B在1-hop、2-hop、3-hop問題上的表現(xiàn)均優(yōu)于GQE,證明了在理論上將查詢(問題)嵌入為向量空間中的一個(gè)box而不是一個(gè)點(diǎn)的思想更合理,而且在實(shí)際中也能取得更好的結(jié)果。3個(gè)模型中BetaE在多跳推理任務(wù)上的平均MRR最大,顯示了概率嵌入在邏輯查詢領(lǐng)域相對(duì)于傳統(tǒng)方法的有效性。

表3列出了部分基于強(qiáng)化學(xué)習(xí)的多跳知識(shí)問答方法在FB15k、FB15k-237和NELL-995 3個(gè)數(shù)據(jù)集上的結(jié)果,采用的評(píng)測(cè)指標(biāo)有Hits@1和MAP,“-”表示在原文獻(xiàn)中對(duì)應(yīng)指標(biāo)的結(jié)果未給出。由表3可以看出,在FB15k-237數(shù)據(jù)集上,RewardShaping的Hits@1結(jié)果比MINERVA高出了11%,這很可能因?yàn)镸INERVA中的智能體在訓(xùn)練時(shí)會(huì)受到假負(fù)樣本的影響,導(dǎo)致低質(zhì)量的獎(jiǎng)勵(lì),并且由于缺乏正確的動(dòng)作序列用于訓(xùn)練,智能體可能被假搜索軌跡誤導(dǎo)卻偶然地被引向了正確答案。RewardShaping針對(duì)以上問題做了改進(jìn),使智能體探索更廣泛的路徑集合,以抵消對(duì)虛假路徑的敏感度。但在NELL-995數(shù)據(jù)集上,RewardShaping模型的表現(xiàn)并不強(qiáng)于MINERVA,因?yàn)镽ewardShaping適合處理一對(duì)多的關(guān)系類型,而NELL-995數(shù)據(jù)集中的關(guān)系類型大多是一對(duì)一的。從MAP結(jié)果來看,DIVA比DeepPath效果要好,這是因?yàn)镈eepPath關(guān)注于找到實(shí)體對(duì)間的路徑,缺少了對(duì)實(shí)體對(duì)是正樣本還是負(fù)樣本的判斷,導(dǎo)致實(shí)驗(yàn)結(jié)果對(duì)噪聲和對(duì)抗樣本敏感,而DIVA更擅長(zhǎng)處理噪聲和應(yīng)對(duì)更復(fù)雜的推理場(chǎng)景。M-Walk使用RNN編碼狀態(tài),并將蒙特卡洛搜索樹與神經(jīng)策略結(jié)合來應(yīng)對(duì)稀疏獎(jiǎng)勵(lì)的挑戰(zhàn),與DIVA、DeepPath相比,取得了更好的結(jié)果。

6 結(jié)束語(yǔ)

近年來,國(guó)內(nèi)外涌現(xiàn)了很多基于知識(shí)圖譜的多跳問答推理方法,這些方法都取得了一定的進(jìn)展,但仍然存在一些挑戰(zhàn)。

隨著KGQA技術(shù)的不斷發(fā)展,智能問答越來越多地深入人們的日常生活中,為人們的生活帶來便利。而在復(fù)雜的實(shí)際場(chǎng)景中,人們更加傾向表達(dá)更加復(fù)雜的多跳問題,這使得多跳知識(shí)智能問答成為必需,知識(shí)圖譜多跳問答推理方法也得到越來越多的關(guān)注。本文基于3個(gè)主流分類,總結(jié)了近年來多跳知識(shí)問答推理的研究方法。本文中很多方法是多種方式結(jié)合的形式,而分類方法是按照具體研究方法的重點(diǎn)創(chuàng)新和貢獻(xiàn)來劃分的。比如基于邏輯的分類中,BetaE方法雖然將知識(shí)圖譜實(shí)體表示為嵌入的方式,但是該方法表達(dá)的是一階邏輯求解答案的思想,是神經(jīng)網(wǎng)絡(luò)增強(qiáng)符號(hào)邏輯的一種方法體現(xiàn),故本文將該方法歸類為基于邏輯的方法。本文也闡述了常用的公開數(shù)據(jù)集、評(píng)價(jià)指標(biāo),以及不同方法在每個(gè)數(shù)據(jù)集上的最新表現(xiàn)和分析。

本文闡述的方法在實(shí)際應(yīng)用中依然存在瓶頸,主要面臨以下3個(gè)挑戰(zhàn)。

● 多跳知識(shí)問答建模問題:難以充分理解用戶復(fù)雜多跳問題以及建模知識(shí)圖譜中的多跳關(guān)系。

● 小樣本學(xué)習(xí)問題:在知識(shí)資源和訓(xùn)練數(shù)據(jù)有限的條件下,難以有效表征知識(shí)和推理答案。

● 可解釋性:深度學(xué)習(xí)在多跳知識(shí)問答任務(wù)中有卓越的表現(xiàn),但是可解釋性差,導(dǎo)致模型缺少可信度。

各類多跳知識(shí)問答推理方法的優(yōu)點(diǎn)和不足見表4。

未來,將從以下兩方面進(jìn)行更深入的研究。

● 隨著BERT等預(yù)訓(xùn)練模型的出現(xiàn),多項(xiàng)自然語(yǔ)言處理任務(wù)(如智能問答的性能)被刷新紀(jì)錄。隨著各類基于Transformer注意力機(jī)制的預(yù)訓(xùn)練模型層出不窮,很多研究者看好預(yù)訓(xùn)練模型和知識(shí)圖譜結(jié)合的方法。通過兩者結(jié)合,知識(shí)圖譜中的知識(shí)可以顯式指導(dǎo)要學(xué)習(xí)的知識(shí),進(jìn)而增強(qiáng)BERT對(duì)背景知識(shí)或常識(shí)信息的編碼能力,同時(shí)文本上下文和知識(shí)上下文的融合能夠增強(qiáng)多跳推理中長(zhǎng)路徑的特征表示,從而提升多跳知識(shí)問答推理任務(wù)的表現(xiàn)性能 。

● 越來越多的互聯(lián)網(wǎng)數(shù)據(jù)以及行業(yè)數(shù)據(jù)呈現(xiàn)出多模態(tài)的特點(diǎn),表現(xiàn)為對(duì)同一事物采用圖譜知識(shí)、文本描述、圖像、信息圖表以及視頻等多種模態(tài)進(jìn)行表達(dá)。不久的未來將有更多關(guān)于多模態(tài)知識(shí)圖譜多跳問答的研究,滿足人們?nèi)找嬖鲩L(zhǎng)的理解和認(rèn)知服務(wù)需求。多模態(tài)知識(shí)圖譜能夠提升知識(shí)的相關(guān)性和多樣性,從而更完整地表達(dá)對(duì)應(yīng)的圖譜中的知識(shí)。通過多模態(tài)豐富的知識(shí)表示,能夠進(jìn)一步保障多模態(tài)知識(shí)圖譜多跳問答推理的效果。

作者簡(jiǎn)介

杜會(huì)芳(1991-),女,同濟(jì)大學(xué)設(shè)計(jì)創(chuàng)意學(xué)院博士生,主要研究方向?yàn)橹R(shí)圖譜、智能問答。

王昊奮(1982-),男,同濟(jì)大學(xué)設(shè)計(jì)創(chuàng)意學(xué)院特聘研究員,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)理事、計(jì)算機(jī)術(shù)語(yǔ)審定委員會(huì)副主任、CCFTFSIGKG主席,OpenKG聯(lián)合創(chuàng)始人,主要研究方向?yàn)橹R(shí)圖譜、自然語(yǔ)言處理、問答對(duì)話、智能內(nèi)容生成。

史英慧(1998-),女,東南大學(xué)網(wǎng)絡(luò)空間與安全學(xué)院碩士生,主要研究方向?yàn)橹R(shí)圖譜、多模態(tài)數(shù)據(jù)。

王萌(1989-),男,博士,東南大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院講師,CCF會(huì)員,東南大學(xué)“至善青年學(xué)者”支持計(jì)劃獲得者,主要研究方向?yàn)橹R(shí)圖譜、多模態(tài)數(shù)據(jù)、自然語(yǔ)言處理。

聯(lián)系我們:

Tel:010-81055448

? ? ? ?010-81055490

? ? ? ?010-81055534

E-mail:bdr@bjxintong.com.cn?

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

轉(zhuǎn)載、合作:010-81055307

大數(shù)據(jù)期刊

《大數(shù)據(jù)(Big Data Research,BDR)》雙月刊是由中華人民共和國(guó)工業(yè)和信息化部主管,人民郵電出版社主辦,中國(guó)計(jì)算機(jī)學(xué)會(huì)大數(shù)據(jù)專家委員會(huì)學(xué)術(shù)指導(dǎo),北京信通傳媒有限責(zé)任公司出版的期刊,已成功入選中國(guó)科技核心期刊、中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)刊、中國(guó)計(jì)算機(jī)學(xué)會(huì)推薦中文科技期刊,以及信息通信領(lǐng)域高質(zhì)量科技期刊分級(jí)目錄、計(jì)算領(lǐng)域高質(zhì)量科技期刊分級(jí)目錄,并多次被評(píng)為國(guó)家哲學(xué)社會(huì)科學(xué)文獻(xiàn)中心學(xué)術(shù)期刊數(shù)據(jù)庫(kù)“綜合性人文社會(huì)科學(xué)”學(xué)科最受歡迎期刊。

關(guān)注《大數(shù)據(jù)》期刊微信公眾號(hào),獲取更多內(nèi)容

總結(jié)

以上是生活随笔為你收集整理的虚拟专题:知识图谱 | 知识图谱多跳问答推理研究进展、挑战与展望的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。