知识图谱分类
《知識 圖譜:概念技術》一書讀書筆記1。
基本事實,如(柏拉圖,出生地,雅典) 。事實知識是知識圖譜中最常見的
知識類型。大部分事實都是在描述實體的特定屬性或者關系,比如上例中的
“出生地”屬性。需要說明的是,有些實體的相關事實未必存在典型的屬性
或者關系與之對應,只能通過復雜的文本來描述。比如,"亞里士多德是西
方古典哲學的集大成者”這一事實很難找到明確的屬性加以陳述。再比如,
在“柏拉圖繼承和發展了蘇格拉底的哲學思想”這一事實中,顯然柏拉圖與
蘇格拉底之間是有關系的,但這類關系無法簡單陳述。很多以實體為中心組
織的知識圖譜均富含事實知識,比如DBpedia 、Freebase 以及CN-DBpedia
等。本書第6 章將介紹這類知識圖譜的構建。
(2 ) 概念知識( Taxonomy Knowledge ) 。概念知識分為兩類: 一類是實
體與概念之間的類屬關系。sA 關系〉,如(柏拉圖isA 哲學家);另一類是
子概念與父概念之間的子類關系( subclassOO ,如(唯心主義哲學家
subclass Of 哲學家) 。一個概念可能有子概念也可能有父概念,這使得全體
概念構成層級體系。概念之間的層級關系是本體定義中最重要的部分,是構
建知識圖譜的第一步一一模式設計的重要內容。特定領域的概念知識是機器
認知領域的基本框架。典型的概念知識圖譜(有時簡稱“概念圖譜”)包括
YAGO 、Probase 、WikiTaxonomy 等。本書第5 章將介紹這類知識圖譜的構
建。
(3 ) 詞匯知識( Lexical Knowledge )。詞匯知識主要包括實體與詞匯之
間的關系(比如,實體的命名、稱謂、英文名等)以及詞匯之間的關系(包
括同義關系、反義關系、縮略詞關系、上下位詞關系等)。例如,
(“ Plato ”,中文名,柏拉圖)、(趙匡j鼠,遠號,宋太祖〉、(妻子, 同義,老
婆)。一些跨語言知識庫(比如Bab elNet )專注于建立實體和概念在不同語
言中的描述形式。詞匯知識是知識圖譜目前在實際應用中已經取得較好效果
的一類知識。因為領域語料往往是豐富的,所以從這些語料中自動挖掘領域
詞匯,建立詞匯之間的語義關聯以及詞匯與實體之間的關聯, 已經成為構建
知識圖譜最重要的一步。領域詞匯知識也是相對簡單的知識,人類學習某個
領域往往是從該領域的詞匯開始學習的。因此, 讓機器認知領域詞匯是實現
機器認知整個領域知識的第一步。典型的此類知識圖譜有WordNet。本書第
3 章將介紹詞匯知識的挖掘。
( 4 ) 常識知識C Commonsense Knowledge )。常識是人類通過身體與世
界交互而積累的經驗與知識,是人們在交流時無須言明就能理解的知識。例
如,我們都知道鳥有翅膀、鳥能飛等。再比如,如果X 是一個人,那么X
要么是男人要么是女人。常識知識的獲取是構建知識圖譜時的一大難點。常
識的表征與定義、常識的獲取與理解等問題一直都是人工智能發展的瓶頸問
題。常識知識的基本特點是,每個人都知道,所以很少出現在文本里。面向
文本的信息抽取方法對于常識獲取顯得無能為力。典型的常識知識圖譜包括
Cyc 、ConceptNet 等。
? ?除了上述分類,還有一些知識圖譜側重知識表示的不同維度。首先,很
多事實的成立是有時空條件的。有些知識的存在是有時間限制的,必須為這
些知識加上時間維度。例如,(奧巴馬,職業,美國總統, 2009-1 -20 , 2017-
01-20 )這個五元組表示“奧巴馬是美國總統”這一事實從2009 年1 月20
日開始生效,直至2017 年1 月20 日失效。再比如, 在表達某一天的溫度
時. ' (2 019-1-1 ,平均溫度, 16 ℃,上海)和( 2019-1 - 1 ,平均溫度,一5 ℃,
北京)這兩個四元組就分別表示了2019 年1 月1 日這一天上海與北京兩地
不同的溫度。其次, 一些知識含有主觀性因素。比如,對于漢堡是否是健康
的食品這一問題,不同人的認識是不同的。再次,有些知識關注實體的多模
態表示。比如, (柏拉圖,圖片, plato.jpg ) 表達了柏拉圖的適用圖片。
總結
- 上一篇: oracle hugepage设置,Li
- 下一篇: UWP Brush画笔详解