文献阅读:知识图谱数据管理研究综述
目前,知識(shí)圖譜數(shù)據(jù)管理的理論、方法、技術(shù)與系統(tǒng)處于快速發(fā)展和開發(fā)完善階段.數(shù)據(jù)庫學(xué)術(shù)和產(chǎn)業(yè)界對(duì)知識(shí)圖譜數(shù)據(jù)管理研發(fā)投入正在不斷增加.本節(jié)將未來的研究方向歸納如下.
(1) ?知識(shí)圖譜數(shù)據(jù)模型與查詢語言的統(tǒng)一?
(2) ?大規(guī)模知識(shí)圖譜數(shù)據(jù)的分布式存儲(chǔ)方案
知識(shí)圖譜數(shù)據(jù)的分布式存儲(chǔ)面臨的第一個(gè)問題是大規(guī)模圖數(shù)據(jù)的劃分.圖劃分問題本身是一個(gè)經(jīng)典的 NP 完全問題.即使使用公認(rèn)最優(yōu)的 METIS 圖劃分算法,對(duì)于大規(guī)模圖數(shù)據(jù)在單機(jī)上執(zhí)行劃分也幾乎是不可行的.所以,首先需要研究面向大規(guī)模知識(shí)圖譜數(shù)據(jù)的分布式圖劃分算法,該算法既要考慮按照知識(shí)圖譜的圖結(jié)構(gòu)和知識(shí)語義信息作為圖劃分標(biāo)準(zhǔn),盡可能地有利于支持知識(shí)圖譜查詢的快速執(zhí)行,又要避免算法復(fù)雜度過高.其次,在知識(shí)圖譜劃分的基礎(chǔ)上,提出分布式存儲(chǔ)方案.需要考慮:是面向 OLTP 和 OLAP 設(shè)計(jì)兩種不同存儲(chǔ)方案,還是設(shè)計(jì)可以平衡不同類型查詢的統(tǒng)一存儲(chǔ);可選的物理層實(shí)現(xiàn)框架包括分布式關(guān)系數(shù)據(jù)庫存儲(chǔ)層、分布式文件系統(tǒng)、分布式 Bigtable 系統(tǒng)和分布式鍵值存儲(chǔ)庫;擴(kuò)展單機(jī)版的 RDF 圖或?qū)傩詧D存儲(chǔ)方案,使其適應(yīng)分布式物理存儲(chǔ)底層是一種可選思路.再次,還需要面向知識(shí)圖譜查詢處理設(shè)計(jì)不同的索引方案,比如,面向圖模式匹配查詢的索引、面向?qū)Ш绞铰窂讲樵兊乃饕兔嫦蚍治鲂筒樵兊?索引.?
(3) ?大規(guī)模知識(shí)圖譜數(shù)據(jù)的分布式查詢處理?
(4) ?知識(shí)圖譜數(shù)據(jù)管理對(duì)于本體和知識(shí)推理的支持?
(5) ?大規(guī)模知識(shí)圖譜的更新維護(hù)
(6) ?大規(guī)模知識(shí)圖譜的數(shù)據(jù)集成
?
總結(jié)
以上是生活随笔為你收集整理的文献阅读:知识图谱数据管理研究综述的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python面试总结(五)内存管理与MY
- 下一篇: Flask知识点回顾以及重点内容