图形数据库成为主流
圖形數(shù)據(jù)庫(kù)成為主流
圖形技術(shù)正成為主流,而知識(shí)庫(kù)則處于領(lǐng)先地位。
蓋蒂
每十年似乎都有其數(shù)據(jù)庫(kù)。在1990年代,關(guān)系數(shù)據(jù)庫(kù)成為主要的數(shù)據(jù)環(huán)境,它的易用性和表格格式使其成為不斷增長(zhǎng)的為數(shù)據(jù)網(wǎng)絡(luò)提供動(dòng)力的自然需求。雖然關(guān)系數(shù)據(jù)庫(kù)仍然很強(qiáng)大,但2000年代見(jiàn)證了XML數(shù)據(jù)庫(kù)的興起,NoSQL(不需要將數(shù)據(jù)庫(kù)以純表格形式進(jìn)行結(jié)構(gòu)化)的想法開(kāi)始流行起來(lái)。在2010年代,隨著Hadoop作為數(shù)據(jù)平臺(tái)的興起和衰落,JSON數(shù)據(jù)庫(kù)獲得了廣泛的關(guān)注。有鑒于此,有充分的證據(jù)表明圖形數(shù)據(jù)庫(kù)將成為2020年代的首選數(shù)據(jù)庫(kù),
自從早期以來(lái),圖形數(shù)據(jù)庫(kù)就以一種或另一種形式出現(xiàn),但與關(guān)系數(shù)據(jù)庫(kù)相比,它們通常較慢,更復(fù)雜且適用性更受限制。它們也主要被視為 學(xué)術(shù)數(shù)據(jù)庫(kù),因?yàn)榇祟?lèi)數(shù)據(jù)庫(kù)最早的用例之一是建立邏輯分析系統(tǒng),并且由于其學(xué)術(shù)聯(lián)系,該數(shù)據(jù)庫(kù)在相當(dāng)長(zhǎng)的時(shí)間內(nèi)一直處于商業(yè)雷達(dá)之下。
但是,到2014年年中,已經(jīng)取得了幾項(xiàng)關(guān)鍵的進(jìn)步,使圖數(shù)據(jù)庫(kù)技術(shù)成為了幾項(xiàng)先河。Neo4J是一個(gè)早期且仍被廣泛使用的圖形數(shù)據(jù)庫(kù),已經(jīng)開(kāi)始獲得足夠的成熟度和滲透性,開(kāi)始被用于某些類(lèi)別的數(shù)學(xué)圖形處理。硬件(通過(guò)云計(jì)算)也已經(jīng)足夠快,可以克服許多關(guān)鍵的早期性能挑戰(zhàn)。圖查詢(xún)語(yǔ)言(SPARQL)隨第二版發(fā)布,解決了早期版本帶來(lái)的許多問(wèn)題,包括引入了更新功能,這意味著可以出現(xiàn)一種用于動(dòng)態(tài)添加內(nèi)容的一致機(jī)制。 join,這是任何數(shù)據(jù)庫(kù)的核心要求之一,但對(duì)圖形數(shù)據(jù)庫(kù)尤為重要。
重要的是,幾家公司開(kāi)始嘗試使用圖形數(shù)據(jù)庫(kù)來(lái)解決在公司一級(jí)變得煩人的問(wèn)題-企業(yè)元數(shù)據(jù)的管理,主數(shù)據(jù)管理,自然語(yǔ)言處理,知識(shí)導(dǎo)航和其他相關(guān)問(wèn)題,而搜索技術(shù)本身已觸底出來(lái)。具有諷刺意味的是,機(jī)器學(xué)習(xí)通常使用數(shù)據(jù)聚類(lèi)方法進(jìn)行文本分析,作為蠻力替代方案,近來(lái),它已逐漸成為幫助構(gòu)建圖形數(shù)據(jù)庫(kù)的另一種機(jī)制,其程度是,最新的圖形數(shù)據(jù)庫(kù)現(xiàn)在已納入了機(jī)器學(xué)習(xí)算法和工具作為其核心套件的一部分。
圖形數(shù)據(jù)庫(kù)提供了一種按類(lèi)(而不是表)進(jìn)行組織的方法,它們是可感知網(wǎng)絡(luò)的并且是高級(jí)的… [+]
蓋蒂
最后,圖形數(shù)據(jù)庫(kù)越來(lái)越多地利用完全出乎意料的發(fā)展優(yōu)勢(shì)-圖形處理單元或GPU(那些專(zhuān)門(mén)用于創(chuàng)建復(fù)雜的三維圖形的專(zhuān)用多核計(jì)算機(jī))的強(qiáng)大功能和先進(jìn)性。這些GPU通過(guò)創(chuàng)建細(xì)分為三角形的網(wǎng)格來(lái)工作-數(shù)百萬(wàn)甚至數(shù)十億個(gè)三角形。通過(guò)將屬性分配給組成這些網(wǎng)格的點(diǎn)(節(jié)點(diǎn))和線(xiàn)(邊),GPU可以計(jì)算顏色,光照,邊緣的硬度和柔軟度,位移以及許多其他屬性,并且可以非常非??斓貓?zhí)行此操作,因?yàn)樗麄儾捎玫墓艿兰軜?gòu)。
事實(shí)證明,圖數(shù)據(jù)庫(kù)實(shí)際上與圖形處理中使用的網(wǎng)格并沒(méi)有太大的區(qū)別(實(shí)際上它們幾乎相同),特別是從將屬性分配給節(jié)點(diǎn)和邊的角度來(lái)看。每個(gè)節(jié)點(diǎn)代表一個(gè)概念,每個(gè)邊代表一個(gè)關(guān)系。這意味著,尤其是在2010年代末,圖數(shù)據(jù)庫(kù)供應(yīng)商越來(lái)越多地利用GPU遍歷和比較這些圖上的節(jié)點(diǎn)值,從而有效地利用了GPU為圖數(shù)據(jù)庫(kù)提供的強(qiáng)大并行功能。雖然也將繼續(xù)使用更多傳統(tǒng)的CPU,但GPU上的圖形數(shù)據(jù)庫(kù)很可能會(huì)在2020年代真正占據(jù)一席之地。
當(dāng)前,圖數(shù)據(jù)庫(kù)分為兩大類(lèi):屬性圖和語(yǔ)義圖。關(guān)鍵方面有所不同:語(yǔ)義圖將邊緣視為標(biāo)識(shí)關(guān)系的全局命名對(duì)象,而屬性圖將邊緣視為基于周?chē)?jié)點(diǎn)的唯一事物。這意味著可以將文字屬性(例如日期或字符串)分配給屬性圖中的關(guān)系。語(yǔ)義圖形中存在一個(gè)類(lèi)似的屬性,稱(chēng)為reification,在該屬性中,節(jié)點(diǎn)+邊在一起被賦予了一個(gè)標(biāo)識(shí)符,但是目前SPARQL尚未本質(zhì)上支持此功能。
SPARQL的下一個(gè)版本很有可能會(huì)改變,該版本可能會(huì)在2020年代初正式出現(xiàn),同時(shí)還會(huì)對(duì)可變謂詞路徑進(jìn)行一些更改。實(shí)際上,這意味著屬性和語(yǔ)義圖數(shù)據(jù)庫(kù)將在未來(lái)幾年內(nèi)合并為一個(gè)類(lèi)別。除此之外,還將看到圖形數(shù)據(jù)庫(kù)與NoSQL數(shù)據(jù)庫(kù)的合并(采用JSON或XML風(fēng)格,或者在某些情況下都采用)。
圖形數(shù)據(jù)庫(kù)在本質(zhì)上比傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)系統(tǒng)更靈活,因?yàn)榭梢詫⒂嘘P(guān)數(shù)據(jù)庫(kù)的元數(shù)據(jù)視為數(shù)據(jù)本身,并且可以以完全相同的方式進(jìn)行訪(fǎng)問(wèn)。實(shí)際上,可以使用圖輕松表示關(guān)系數(shù)據(jù)庫(kù),因?yàn)殛P(guān)系表/列/行/鍵結(jié)構(gòu)本身就是圖的一種形式。直到最近為止,這種靈活性是以性能為代價(jià)的-但是隨著轉(zhuǎn)向GPU,這種性能優(yōu)勢(shì)已在很大程度上消失了。
越來(lái)越多的系統(tǒng)也啟用關(guān)系填充,以隱藏表格數(shù)據(jù)庫(kù)和圖形數(shù)據(jù)庫(kù)之間差異的詳細(xì)信息,以便它們可以與現(xiàn)有工具集(例如用于數(shù)據(jù)分析或可視化的工具集)一起使用,但是隨著完整圖形功能變得標(biāo)準(zhǔn)化,新工具將會(huì)利用該標(biāo)準(zhǔn)化來(lái)利用靈活性 和性能,這意味著圖形數(shù)據(jù)庫(kù)有潛力在 2030年之前取代 現(xiàn)有的關(guān)系市場(chǎng)。
圖形數(shù)據(jù)庫(kù)的市場(chǎng)在不斷發(fā)展,合并期可能在… [+]
蓋蒂
市場(chǎng)狀況
在大約十年前的某個(gè)時(shí)刻,可能有四個(gè)商業(yè)數(shù)據(jù)庫(kù)和幾個(gè)開(kāi)源圖形數(shù)據(jù)庫(kù),全部共同為一個(gè)與關(guān)系市場(chǎng)相比是微觀(guān)的市場(chǎng)服務(wù)。記得當(dāng)時(shí)在幾個(gè)語(yǔ)義會(huì)議上的貿(mào)易展覽會(huì)上走的時(shí)候,有希望的供應(yīng)商的數(shù)量超過(guò)了參與者。情況已不再如此,在過(guò)去幾年中,供應(yīng)商的數(shù)量和圖數(shù)據(jù)庫(kù)專(zhuān)家的數(shù)量都猛增了,以至于值得討論不同類(lèi)別的供應(yīng)商。
總結(jié)
- 上一篇: GPU上的快速光谱图分区
- 下一篇: 部署可扩展的目标检测管道:推理过程(下)