日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

论文浅尝 | Knowledge Vault: 全网规模的知识概率融合方法

發(fā)布時間:2024/7/5 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 论文浅尝 | Knowledge Vault: 全网规模的知识概率融合方法 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

論文筆記整理:吳桐桐,東南大學博士生,研究方向為自然語言處理。



鏈接:https://www.cs.ubc.ca/~murphyk/Papers/kv-kdd14.pdf

?

基于機器學,Knowledge Vault不僅能從多個來源(文本,表格數(shù)據(jù),構,人工注)中提取數(shù)據(jù),而且可以根據(jù)所有可用數(shù)據(jù)推斷事和關系。網(wǎng)當然包含大量的錯誤數(shù)據(jù),因此框架依現(xiàn)有的知識庫(例如Freebase),以便在程的其中一個步驗證。研究人該過程描述圖中的鏈接預測”,并試圖采用兩種不同的方法來解決它:a)路徑排序算法(PRA)和b)神經(jīng)網(wǎng)模型(MLP)[1]

?

結構

Knowledge Vault主要由以下三個主要構件成:

1.????提取器?- 從大型數(shù)據(jù)集中提取三元(主謂語象)并分配置信度分數(shù)。

2.????基于形的先?- 從現(xiàn)有知識庫中學

3.????融合?- 事概率的最得分

通過結合現(xiàn)有知識庫和自身提取過程中的數(shù)據(jù),研究人員已設法減少事實不確定性的數(shù)量,如下圖所示:

Knowledge Vault 相比于知識圖譜的優(yōu)勢

Knowledge Vault 對當前知識圖的關鍵優(yōu)勢在于其設計允許其擴展。到目前為止,Knowledge Vault設法推斷了大約 271,000,000可信的事實,這些事實被認為是真實的,至少有90%的可能性。為了提煉這些事實,Knowledge Vault 提取了 1,600,000,000 三元組,4469種關系類型和1100種實體。

關于知識圖譜的思考

本文作為知識圖譜領域的核心論文之一,文中所提出的幾點思考放在論文發(fā)表5年之后的今天仍具有借鑒意義。

?

1.如何建模事實之間的互斥性:目前,我們將每個事實視為獨立的二進制隨機變量,無論是真是假。然而在現(xiàn)實中許多三元組之間是互斥的。

2.建模事實之間的軟相關性:對于某些關系,它們的價值將受到軟約束。如某個人物的出生時間一定在其父母出生時間的至少10年之后。

3.值可以在多個抽象層次上表示:我們可以用不同的粒度來表示世界。

4.如何處理相關的數(shù)據(jù)源:當數(shù)據(jù)源數(shù)目較多且相互重疊時,則需要考慮更復雜的數(shù)據(jù)拷貝機制。

5.有些事實只是暫時的事實。在某些情況下,事實的“真相”可能會改變。例如,谷歌目前的首席執(zhí)行官是拉里·佩奇,但從2001年到2011年,他就是埃里克·施密特。這兩個事實都是正確的,但只是在指定的時間間隔內(nèi)。

6.如何發(fā)現(xiàn)并添加新實體和關系。除了遺漏的事實之外,還有許多實體在網(wǎng)絡上被提及,但不在Freebase中,因此也不在 knowledge vault 中。

?



OpenKG


開放知識圖譜(簡稱 OpenKG)旨在促進中文知識圖譜數(shù)據(jù)的開放與互聯(lián),促進知識圖譜和語義技術的普及和廣泛應用。

點擊閱讀原文,進入 OpenKG 博客。

創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎

總結

以上是生活随笔為你收集整理的论文浅尝 | Knowledge Vault: 全网规模的知识概率融合方法的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。