知识图谱入门视频(二)
生活随笔
收集整理的這篇文章主要介紹了
知识图谱入门视频(二)
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
學習內(nèi)容
小象學院 b站 第二章
【其實后面的方法學習只是一個框架式的學習,并不明白具體的操作】
第二部 典型知識庫項目簡介
CYC(讀音: 賽克)
-
CYC: 1984年由Douglas Lenat開始創(chuàng)建,最初的目標是建立人類最大的常識知識庫。該知識庫主要由術語Terms和斷言Assertions組成。
-
Cyc的主要特點是基于形式化的知識表示方法來刻畫知識。形式化的優(yōu)勢是可以支持復雜的推理。但過于形式化也導致知識庫的擴展性和應用的靈活性不夠。Cyc提供開放版本的OpenCyc
Wordnet
-
WordNet是最著名的詞典(lexical)知識庫,主要用于詞義消歧,1985年提出的。
-
WordNet主要定義了名詞、動詞、形容詞和副詞之間的語義關系。 例如名詞之間的上下位關系(如: 貓科動物是貓的上位詞),動詞之間的蘊涵關系(如:打鼾蘊含著睡眠)等
-
WordNet已經(jīng)包含超過了15萬個詞和20萬個語義關系。
ConceptNet
- ConceptNet是常識知識庫。來源于OMCS項目。1999年創(chuàng)立
- ConceptNet主要依靠互聯(lián)網(wǎng)眾包、專家創(chuàng)建和游戲三種方法來構建。新版本導入了大量開放的結(jié)構化數(shù)據(jù),如DBPedia、WordNetdeng
- ConceptNet知識庫以三元組形式的關系型知識構成。ConceptNet5版本已經(jīng)包含有2800萬關系描述。與Cyc相比,ConceptNet采用了非形式化、更加接近自然語言的描述,而不是像Cyc那樣采用形式化的謂詞邏輯
- 與鏈接數(shù)據(jù)和谷歌知識圖譜相比,ConceptNet比較側(cè)重于詞與詞之間的關系。從這個角度看,ConceptNet更加接近于WordNet,但是又比WordNet包含的關系多。此外,ConceptNet完全免費開放,并支持多種語言。
Freebase
三元組:我們理解為主謂賓
Wikidata
DBPedia
- DBPedia是早期的語義網(wǎng)項目。DBPedia意指數(shù)據(jù)庫版本的Wikipedia,是從Wikipedia抽取出來的鏈接數(shù)據(jù)集。DBPedia采用了一個較為嚴格的本體,包含人、地點、音樂、電影、組織機構、物種、疾病等類定義
- 此外,DBPedia還與Freebase、OpenCYC、Bio2RDF等多個數(shù)據(jù)集建立了數(shù)據(jù)鏈接。 DBPedia采用RDF語義數(shù)據(jù)模型,總共包含30億RDF三元組。
三元組:我們理解為主謂賓
YAGO
鏈接
我們還添加了各種時間關系,比如奧巴馬是多少年任期的; 鹿晗和關曉彤是多少年在一起的。
BabelNet
- BabelNet是類似于WordNet的多語言詞典知識庫。BabelNet的目標是解決WordNet在非英語語種中數(shù)據(jù)缺乏的問題。BabelNet采用的方法是將WordNet詞典與Wikipedia百科集成
- 首先建立WordNet中的詞與Wikipedia的頁面標題的映射,然后利用Wikipedia中的多語言鏈接,再輔以機器翻譯技術,來給WordNet增加多種語言的詞匯
- BabelNet3.7包含了271中語言,1400萬同義詞組,36,4萬詞語關系和3.8億從Wikipedia中抽取的鏈接關系,總計超過19億RDF三元組。繼承了上面兩個數(shù)據(jù)庫的優(yōu)點,構建了目前最大規(guī)模的多語言詞典知識庫。
我們可以利用同義詞來重構搜索條件
NELL
這里是自動在web上抽取三元組知識;但是需要知識抽取(bootstrap)來進行引導。
Concept Graph
- Concept Graph是以概念層次體系為中心的知識圖譜。與Freebase等知識圖譜不同,Concept Graph以概念定義和概念之間的IsA關系為主
- 給定一個概念如“Microsoft”,Concept Graph返回一組與“微軟”有ISA關系概念組,如“Company”,“Software Company”,這被稱為概念化“Conceptualization”
- Concept Graph可以用于短文本理解和語義消歧。 如“工程師在吃蘋果”,蘋果指的是蘋果還是蘋果公司。
OpenKG:中文知識圖譜資源庫
Zhishi.me
英文很多,中文很少。 包括百度百科
實體抽取,關系抽取 --》 知識抽取
我們獲取知識后再進行整合,進行互補。
cnSchema:開放的中文知識圖譜Schema
可以自行訪問
總結(jié)
以上是生活随笔為你收集整理的知识图谱入门视频(二)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java jsoup获取cookie_j
- 下一篇: 常见报错原因