日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

智慧城市知识图谱模型与本体构建方法

發布時間:2025/3/15 编程问答 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 智慧城市知识图谱模型与本体构建方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

智慧城市知識圖譜模型與本體構建方法

臧根林1,2,?王亞強1,2,?吳慶蓉1,2,?占春麗1,2,?李熠3

1?拓爾思知識圖譜研究院,廣東 廣州 510665

2?廣州拓爾思大數據有限公司,廣東 廣州 510665

3?湘潭大學,湖南 湘潭 411105

??

摘要針對目前智慧城市建設過程中,數據資源共享不足、人工智能應用落地困難等問題,基于知識圖譜的資源描述框架、本體知識體系載體、數字孿生的思路,提出一種以自然人的數據為核心的智慧城市知識圖譜模型,并提出了支撐該模型的多領域知識圖譜本體和子本體的構建思路。創新性地提出了“天地人”的模型思路,為智慧城市的數據如何服務城市居民生活、如何讓更多人工智能算法模型在智慧城市應用中落地提供一定的參考。

關鍵詞?智慧城市?;?知識圖譜?;?多領域?;?本體構建

論文引用格式:

臧根林, 王亞強, 吳慶蓉, 占春麗, 李熠.智慧城市知識圖譜模型與本體構建方法.大數據[J], 2020, 6(2):96-106

ZANG G L, WANG Y Q, WU Q R, ZHAN C L, LI Y.BModel and construction method of the ontology of knowledge graph of smart city.?Big Data Research[J], 2020, 6(2):96-106

1 引言

智慧城市已經成為一種城市發展理念。據統計,目前100%的副省級城市、89%的地級以上城市、49%的縣級城市已經開展智慧城市建設,累計參與的地市級城市數量有300余個。城市管理運營包含民生、交通、教育、醫療、維穩等幾十個方面,在智慧城市概念被提出之前,它已經經歷了電子化階段,被稱為電子政務、電子警務等。IBM公司最早在2009年提出智慧城市的概念,中國于2011年開始在寧波、上海等城市探索智慧城市建設。

隨著物聯網、云計算、大數據等技術的發展,智慧城市建設從感知智能到認知智能逐步提升。5G技術的應用將加快提升城市的感知能力,數據采集更快、更多、更全。數據包含了文字、圖像、音視頻等多模態,要把這些數據用好,需要把這些數據組織成大型的知識庫,并將其作為智慧城市的基礎資源。河南財經政法大學的姬溶婧從中國知網中選取了893篇文章分析后,得出知識圖譜是近10年智慧城市的研究熱點。

由于知識圖譜以資源描述框架(resource description framework,RDF)的形式對知識體系和實例數據進行統一表示,并可以通過對齊、匹配等操作對異構數據進行集成和融合,在語義搜索、問答系統、智能客服、個性化推薦等應用中占有重要地位。知識圖譜技術在商業智能、智慧醫療、智慧司法等智慧城市各領域中具有廣闊的應用前景。

設計一個基于知識圖譜技術的智慧城市數據模型,使城市大數據有效地為城市服務,是很有意義的事情。事實上,現有的智慧城市建設存在很多問題,例如各個部門之間的數據共享問題,雖然大家都希望實現數據集中采集、多處共享,但目前還沒有城市能真正做到這一點。例如,各個醫院的病人化驗數據目前只能保留在本醫院,而從理論上說化驗結果是屬于患者的個人數據,無論患者在哪家醫院就診應該都可以使用,但現實中并沒有做到。政府部門之間的數據“煙囪”現象依然很嚴重,雖然有頂層設計、總體設計,但是大部分還是各自為政,系統之間的協調共享不足。如果建立一層不與具體行業或業務緊密相關的數據層,并用圖結構的數據格式表達,則可以更好地解決城市數據共享問題,更利于人工智能的很多算法模型的應用。

本文針對中國目前智慧城市建設現狀,提出一種智慧城市知識圖譜模型思路,并研究了針對該模型思路的本體(ontology)構建方法。城市數據的核心是關于自然人的數據,城市的智慧教育、智慧醫療、智慧民生等都是圍繞著自然人的數據開展的,因此智慧城市知識圖譜建設的核心問題是構建以城市自然人為核心的本體,同時構建民生、教育、醫療等領域的子本體,形成多領域多模態的知識圖譜結構,實現智慧城市知識圖譜的應用生態。

2 智慧城市知識圖譜模型設計

智慧城市的建設應該將市民對美好生活的需要放在首位,同時積極鼓勵市民參與智慧城市的建設。市民參與有助于提高智慧城市建設政策與規則制定的透明性與可行性,可以在一定程度上減少推行與實施的阻力,有助于準確定位智能服務開發與設計的功能,成功促進市場商業化,幫助智慧城市建設獲取更準確和成本更低的城市信息。

理想的智慧城市模型應該是現實中運行著一個城市,網絡上運行著一個對應的數字城市。現實城市運行中產生的各種數據,都能實時映射到數字城市,即數字孿生。而數字城市通過人工智能的模型算法,及時反饋優化現實城市的運行。目前不少城市已經把數據抽取到城市大數據中心,也實現了局部智慧,但數據結構設計仍模擬現實城市。目前大部分的智慧城市結構如圖1所示。

數字城市應該從具體的事物中抽象出來,重新組合數據,形成新的數據結構S,這種結構可以通過知識圖譜的實體、關系和屬性這3個要素描述和存儲,即S={E,R,F}。

一個自然人的數據如果按照從出生到死亡的垂直時間軸顯示,就像一棵樹,樹根信息是出生之前的數據:父親信息、母親信息、出生地信息等。隨著年齡增加,“樹”同步長高,大的“樹枝”包括上學信息、婚姻信息、子女信息、就業信息等。如果一個城市有500萬人口,每個人對應一棵“信息樹”或者叫“數字人”(數字人示意如圖2所示,數字家庭示意如圖3所示),整個城市形成的數據可以被稱為“數字森林”。

圖1???大部分的智慧城市結構

圖2???數字人示意

圖3???數字家庭示意

“數字森林”是數字城市的核心數據。“數字森林”下方是支撐“數字森林”存活的基礎數據,也就是維持一座城市正常運行的基礎信息,如道路交通、醫院、學校、企業、文化等,如同森林下面的土地;在對森林進行管理和維護時,有的樹木應該多澆水施肥,有的樹木應該除蟲噴藥。同理,城市里有些老弱病殘等群體需要救助,而有些“害群之馬”需要被清除,這些由城市的監管、服務功能形成的數據和事件就相當于數字森林上方的天空。“天人地”3層結構構成了“數字城市”的整體架構,這樣的架構加上相應的人工智能(artificial intelligence,AI)算法,形成了智慧城市的智腦。知識圖譜技術正是實現這個數字城市的最佳技術。知識圖譜本質上是一個以圖數據結構等技術為載體,描述客觀事物及其關系的大型知識庫。在具體實現上,知識圖譜用語義網中的資源描述框架對知識體系和實例數據2個層面的內容進行統一表示,共同構成一個完整的知識系統(KS)。通過城市里面的實體構建城市的知識圖譜,并且在圖譜中描述關系方向、強度、時序等信息。智慧城市知識圖譜模型示意如圖4所示。智慧城市知識圖譜模型與原來系統的關系示意如圖5所示。

圖4???智慧城市知識圖譜模型示意

圖5???智慧城市知識圖譜模型與原來系統的關系示意

圖5中左邊是目前大部分智慧城市的數據結構,通常在智慧城市各具體模塊之外建立大數據資源池,即大數據中心,右邊是本文提出的知識圖譜模型。智慧城市知識圖譜模型并不是取代原來的智慧城市大數據資源池,而是在原來的大數據資源上,經過本體設計,對數據屬性F和關系R進行RDF形式描述,增加一層新的基于知識圖譜結構的數據服務,這層數據將會和人工智能算法模型更緊密地結合。這種知識圖譜模型和一般的智慧城市大數據中心的區別在于以下3點。

● 以人為本的設計思路,讓智慧城市更好地圍繞為人服務展開。一般的大數據中心把自然人信息、法人信息、地理信息、經濟運行信息等都放在一個層面上,沒有形成以人為核心的數據架構。

● 數據不與具體業務掛鉤,而是在對城市大數據進行屬性分類、關系分析之后提取更高層面的知識庫,利于真正的數據共享。

● 結合圖數據庫技術及語義網描述體系、標準和工具,便于計算機系統對大規模知識系統進行存儲與檢索計算,便于人工智能模型之間的有機結合,特別是在語義搜索、智能客服、問答系統等方面的應用。

3 智慧城市知識圖譜的本體構建方法

智慧城市知識圖譜模型需要相應的本體支撐。本體源自西方哲學,描述世界上的客觀存在。比較流行的本體概念是美國斯坦福大學知名學者Gruber提出的,即本體是關于某個實體概念體系的明確規范的說明。知識圖譜對知識數據的描述和定義被稱為知識體系(schema)或者本體。本體是重要的知識庫,知識圖譜的本體O KG包括對象的類型T(E)、屬性的類型T(F)以及關系的類型T(R),具體可表示為:

對象根類型BT(E)的分類是構建領域知識圖譜的基礎工作,而現有流行的公共知識庫并沒有按照領域數據的特點分類,唯一的根類型就是實體,這給領域知識表達帶來了缺陷,無法完整表達文本、視頻圖片等知識和它們的關聯。領域知識圖譜本體的對象根類型BT(E)除了實體類型Tentity,還應增加事件類型Tevent、文本類型Ttext和多媒體類型Tmultimedia,基于上述4種實體類型,對象根類型BT(E)={Tentity,Tevent,Ttext,Tmultimedia}再通過擴展到具體分類表達領域的知識。

智慧城市的知識圖譜不僅是關于城市自然人的描述,還有對企業法人、各種組織、經濟運行、地理信息等方面的描述,同時城市發生的各類事件也需要記錄和關聯,可以用實體、事件、文本和多媒體4種本體的對象根類型BT(E)滿足這樣的要求。

設計一套完整的智慧城市知識圖譜本體OKG是一項巨大的工程,需要將城市所有相關的本體根的屬性、相互之間的關系理清楚,并設計相應的模型完成實體識別、實體擴展、實體消歧、關系抽取等工作。一座城市的所有根類型的本體(包括人、企業、社會組織、道路、樓房等實體,也包括城市里發生的事件、相關的文本和多媒體)數量眾多,僅根類型的數量即可達到上萬個,為了便于敘述,本文只針對城市自然人的本體設計展開,知識圖譜的本體設計也以城市自然人展開。

若自然人在城市中與N個領域(如教育、醫療、交通等)相關聯,則可以由N個領域知識圖譜疊加,構成一個完整的多領域知識圖譜。城市自然人的本體有3種設計思路:單層單領域OKG(ss)、單層多領域OKG(sm)和多層多領域OKG(mm)。

單層單領域OKG(ss)思路(智慧城市知識圖譜單層單領域本體示意如圖6所示)是把整個智慧城市知識圖譜當成一個簡單的垂直領域知識圖譜進行設計。這種設計方式雖然涵蓋了城市管理中各行業領域的本體,能比較方便地對城市宏觀數據進行分析和管理,但是卻無法簡單快捷地從整體轉入局部,例如在這個大的智慧城市知識圖譜OKG(主本體)中快速清晰地獲取教育或醫療行業的知識圖譜Sub(OKG)(子本體)。另外,在建設這種單層單領域知識圖譜初期,需要對城市各行業領域的本體有全面的了解,才能規劃出比較齊備的智慧城市綜合知識圖譜,但這種建設方式無疑難度很大。

圖6???智慧城市知識圖譜單層單領域本體示意

單層多領域OKG(sm)思路(智慧城市知識圖譜單層多領域本體示意如圖7所示)是在單層單領域OKG(ss)知識圖譜的設計思路上,意圖解決在智慧城市知識圖譜中區分出各行業領域知識圖譜的問題,即解決在主本體中快速區分子本體的問題。可以通過為子本體增加邊界屬性記錄這些本體所屬的范圍,但城市行業領域的業務內容實際上是會發生變化的,即本體的內容和范圍會發生變化;另外,不同的城市行業領域也存在公共的元素(例如個人的信息包括電話號碼,城市通信系統中也包括電話號碼),這些公共元素如果在子本體中各自維護,當切換到主本體中時會面臨是否需要融合、如何融合的問題。從這些問題來看,單層多領域思路的應用存在變更困難、冗余過大、從子本體到主本體融合問題較多等困難。

圖7???智慧城市知識圖譜單層多領域本體示意

多層多領域O?KG(m m)思路(智慧城市知識圖譜多層多領域本體示意如圖8所示)是分別設計子本體,將子本體互相疊加,形成完整的主本體。如針對城市居民的醫療情況設計一套醫療人本體Med(OKG),針對交通情況設計一套交通人本體Tra(OKG),將兩個本體進行疊加,經過去重fr和消歧fd后,可以形成一個城市自然人的總本體。由于可以采用動態本體技術,不需要在最開始就設計出完善的總本體,而是在設計好總體架構后,將建設好的子本體逐步疊加完善,最終形成一個完整的本體設計。

圖8???智慧城市知識圖譜多層多領域本體示意

在垂直領域知識圖譜的應用方面,已經有很多成熟的產品,并且在現實應用中,大部分情況是以垂直領域方式進行的(如市民想看病,就用到智慧醫療功能;孩子教育問題則會用到智慧教育功能)。按照上述本體設計,雖然通過圖譜疊加會形成很復雜的多領域知識圖譜,但大部分應用可以通過圖譜分層方式抽取出獨立的一層,形成垂直領域知識圖譜,從而得到強大的應用功能。

4 一個子本體構建的例子

在城市維穩安全領域,城市自然人的子本體Sub(Ocity)被稱為安全人P。通過對維穩安全領域業務知識的分析,將安全人的實體對象E(P)分為個人、組織、證件、虛擬身份、機動車、電話、銀行賬戶、監獄、銀行、賓館酒店、網吧、邊境口岸、網絡場所等,這些實體之間的關系R可以用綜合關系R1、從屬R2、擁有R3、活動R4、軌跡R5以及網絡活動R6描述,安全人的本體設計如圖9所示。

安全人Pi與N個安全人Pn之間存在親屬、鄰居、同事、同乘機、同火車、同住宿等一種或多種綜合關系R1(Pi,Pn)。

安全人Pi與N個組織單位Un之間存在從屬關系R2(Pi,Un),同時這些組織單位Un與其他N個安全人Pn之間同樣也存在從屬關系R2(Pn,Un)。

安全人Pi擁有N個證件A、虛擬身份B、機動車C、電話D以及銀行賬戶G等。其中,通過虛擬身份B與其他同城市的安全人Pj之間存在網絡關系RN(B,Pj);駕駛機動車會產生違章記錄RC1,在各類卡口會產生卡口過車記錄RC2;通過打電話發短信與其他安全人產生通話記錄RD(Pi,Pj),使用手機上網產生電子活動RD(可利用電子圍欄偵測);銀行賬戶與其他安全人的銀行賬戶之間會產生銀行交易記錄RG(Pi,Pj)。因此,擁有關系整體可表示為R3={RN(B,Pj),RC1,RC2,RD(Pi,Pj),RD,RG(Pi,Pj)}。

安全人Pi的行為活動會產生N個違法記錄、服刑記錄和各種案件R4(Pi)。

安全人Pi的移動路線會產生N個軌跡和定位信息R5(Pi)。通過民航訂票和離港信息、鐵路訂票及乘車信息定位安全人移動軌跡的兩端,通過銀行核查信息定位銀行,通過旅客住宿信息定位賓館酒店,通過網吧上網信息定位網吧,通過出入境信息定位邊境口岸。

圖9???安全人的本體設計

安全人Pi的網絡活動R6(Pi)可以由N個網絡場所Pn及N個虛擬身份Vn構成, R6(Pi)={Pn,Vn}。

安全人本體設計完成之后,采用廣州拓爾思大數據有限公司研發的“安拓知識圖譜平臺”進行構建,安全人的構建過程如圖10所示。首先,定義實體,新增個人、組織、證件、虛擬身份、機動車、電話、銀行賬戶、監獄、銀行、賓館酒店、網吧、邊境口岸、網絡場所等實體對象。其次,定義屬性,為各個實體對象添加屬性。個人的屬性包括姓名、身份證號碼、出生日期、民族、戶籍地址、居住地址等,組織的屬性包括名稱、類型、組織機構代碼、稅務登記證號、地址、法定代表人、成立日期等。然后,定義關系及事件,為實體對象之間添加關系或事件。個人之間添加親屬、鄰居或同事等綜合關系,個人與組織之間添加屬于關系,個人與證件之間添加擁有關系,電話之間添加通話事件,銀行賬戶之間添加交易事件等。實體、屬性、關系以及事件定義完畢后,通過“安拓知識圖譜平臺”提供的數據抽取工具對現有的各類數據進行抽取,并導入平臺的知識庫(這一過程也可利用平臺提供的手工劃線提取功能進行抽取),抽取的知識經過實體對齊和屬性填充,最終形成一套完整的安全人知識圖譜。

圖10???安全人的構建過程

通過面向業務的分析,本文提出了這套安全人本體設計方案,并且通過“安拓知識圖譜平臺”在國家部委、全國多省及多個地市的維穩安全領域有成功的應用,同時在應用中不斷改進和完善,切實解決了維穩安全領域的大數據關聯挖掘、分析展現等問題。

5 結束語

本文提出了一種智慧城市知識圖譜的模型思路,并研究了支撐該模型的本體構建方法,提出了介于通用知識圖譜和領域知識圖譜之間的多領域知識圖譜概念,以及城市自然人總本體和子本體的思路,實現了智慧城市的城市級功能和領域級功能。目前業界的知識圖譜研究通常把通用圖譜和領域圖譜分開來看,實際上智慧城市知識圖譜的復雜度已經逼近通用知識圖譜,這樣的多領域圖譜如何實現,如何解決結構復雜、計算量大等問題,是智慧城市知識圖譜建設中迫切需要解決的。另外,城市除了自然人,城市法人和組織的知識圖譜也相當復雜,而且與城市自然人圖譜是立體交叉的密切關聯關系。智慧城市知識圖譜的很多功能必須配合算法模型才能形成強大威力,而建模和模型訓練也將是智慧城市知識圖譜建設的難點,需要進一步深入研究。

作者簡介

臧根林(1963-),男,博士,拓爾思知識圖譜研究院院長,廣州拓爾思大數據有限公司首席營銷官,主要研究方向為知識圖譜、知識工程、大數據應用、企業管理、企業文化 。

王亞強(1971-),男,拓爾思知識圖譜研究院首席科學家,廣州拓爾思大數據有限公司常務副總經理,主要研究方向為領域知識圖譜、知識工程 。

吳慶蓉(1972-),女,拓爾思知識圖譜研究院研究員,廣州拓爾思大數據有限公司第三事業部副總經理,主要研究方向為領域知識圖譜、知識工程 。

占春麗(1975-),女,拓爾思知識圖譜研究院研究員,廣州拓爾思大數據有限公司研發中心總經理,主要研究方向為領域知識圖譜、知識工程 。

李熠(1979-),男,博士,就職于湘潭大學,主要研究方向為領域知識圖譜、物聯網 。

《大數據》期刊

《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的中文科技核心期刊。

關注《大數據》期刊微信公眾號,獲取更多內容

往期文章回顧

政府治理大數據的共享、集成與融合

面向政府治理大數據的高性能計算系統

意圖知識圖譜的構建與應用

基于隱私保護的政府大數據治理研究

大數據驅動鄉村振興共享共治機制研究


總結

以上是生活随笔為你收集整理的智慧城市知识图谱模型与本体构建方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。