日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

自然语言系列学习之表示学习与知识获取(七)利用关系路径进行关系抽取

發布時間:2024/9/18 编程问答 30 豆豆
生活随笔 收集整理的這篇文章主要介紹了 自然语言系列学习之表示学习与知识获取(七)利用关系路径进行关系抽取 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

接下來介紹另外一個方向是如何更好的利用知識圖庫里關系路徑的信息進行關系抽取。

有一個非常直觀的例子介紹關系路徑的好處,如電影阿甘正傳(上圖),我們如果想要知道阿甘正傳的語言是什么,可以通它的電影導演是某一個人,導演本身的母語是什么? 它可以幫助我們猜測阿甘正傳使用什么語言來拍攝的,這是一個非常直觀的例子,它告訴我們可以利用知識圖譜里面關系路徑預測任意兩個實體之間的關系,這也說明這些關系路徑蘊含了非常豐富的語義信息,可以幫助我們進行這種關系的抽取。

在利用關系路徑進行關系抽取方面,很多年前就有一位著名的華人學者勞逆就研制了非常多基于關系路徑的方法,其中最有名的一個方法叫path ranking algorithm,它基本思想是

當你預測任意兩個實體之間的關系,就可以看兩個實體之間都出現了哪些關系路徑,把每一種不同的關系看成是一個特征,就可以為這兩個實體去構建出一個非常長的關系路徑的特征向量。這個向量里面的每一維反映了一種不同類型的關系路徑。然后可以利用這種特征向量為任意兩個實體進行關系抽取或者關系分類。

這種方法在一些比較小的比較簡單的數據上取得了非常好的效果。但是當你的知識圖譜變得非常的大的時候,比如說當relation有幾千甚至上萬的時候,你可以想象任意兩個實體之間的關系路徑的數量或者這種類型可能變得非常非常大,

那么就可能會有幾萬甚至上千萬的維度,去構建任意兩個實體之間關系的特征向量,那么一方面維度特別高,另一個方面向量非常的稀疏,這樣的話其實極大影響這種方法在大數據上使用的效率和效果。

我們的基本思想是能不能把這種關系路徑也能夠學習到表示的低維向量中去,過去transe直接看任意兩個實體之間的關系,然后學習h+t。現在我們比如兩個實體之間的關系路徑r1和r2(下圖右上),

有沒有可能為h和t之間的關系路徑學習一個向量,這樣就直接用h+(r1 o r2) = t ,這樣就可以建立起更多的三元組來進行學習,那么實際上它就相當于給我們提供了關于這個空間里面有更多的語義信息。


這里面有一個非常重要的問題是如何學習每一個關系路徑的向量表示,這涉及到自然語言處理里非常重要的概念semantic composition組合,它的基本思想是如何利用關系路徑里的每一個關系的向量組合成路徑本身的向量。這個過程很簡單,其實最簡單或者最有效的做法是要把關系路徑里每一個關系的向量直接相加來得到路徑的向量;或者把三個關系按位進行相乘得到路徑的向量;第3種方法,采用循環神經網絡得到路徑的向量。

總之通過語義的組合,根據這些關系得到路徑的表示,那么就可以建立h+r=t的三元組,得到一個優化的目標。


我們用transe去預測任意兩個實體的關系,它的準確率差不多是在84.3%左右(上圖),如果把關系路徑考慮進來,最好的效果能達到94, 然后呢,我們可以看到最好的效果能達到94.0%,那么可以看到這個提升非常明顯。

這說明利用關系路徑可以非常有效的提高知識表示學習的分辨能力。可以得到一個更好的關系抽取的效果。這就是考慮關系路徑的意義所在。


上圖是利用ptranse的方法的樣例,可以看出我們可以很好的建立起在空間里的關聯關系,如place_of_birth,和country是第2個關系這個地點所在的國家,那么實際上這兩個關系組合起來就形成了nationality(上圖第二列中的第三行)關系。

ptranse類似的例子,下圖

contains(第二列第一行)和contains(第二列第二行)組合起來還是contains(第二列第三行),那么它反映了這種包含的關系。

與50位技術專家面對面20年技術見證,附贈技術全景圖

總結

以上是生活随笔為你收集整理的自然语言系列学习之表示学习与知识获取(七)利用关系路径进行关系抽取的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。