几种复杂网络模型的介绍:动态演化网络、社区网络、权重网络、相依网络、多层网络
《復雜網絡與大數據》第二章:復雜網絡模型的學習筆記
目錄
1動態演化網絡
1.1以網絡演化的部件劃分
1.2以是否考慮權重劃分
1.3以演化網絡采用的演化機制劃分
1.4以演化網絡是否動態變化劃分
2社區網絡
2.1復雜網絡中社區結構的分類
2.2社區結構評價標準
3權重網絡
3.1加權網絡的度量
3.2實際加權網絡
3.3加權網絡建模
4相依網絡
4.1相依網絡的子網絡
4.2相依網絡的相依邊
4.3相依網絡的組合方式
?
1動態演化網絡
演化網絡是隨著時間的變化而變化的網絡。
1.1以網絡演化的部件劃分
1.基于點邊的網絡演化模型:顧名思義,基于點邊的網絡演化模型就是指在網絡演化過程中網絡的結點和邊都可以增加或刪除的演化模型。
典型的如BA模型。BA模型是基于增長和擇優連接兩個原理提出的,增長原理強調了網絡節點的演化,擇優連接強調了網絡邊的演化。BA模型具有冪律度分布的特性
目前大多數的網絡演化模型都是基于點邊的網絡演化模型。
2.基于邊的網絡演化模型:即網絡演化過程中,節點數不變,但是邊可以增加或刪除的演化模型。
例如:ER模型在給定的節點之間采用隨機連邊策略產生隨機圖模型;WS模型在給定的節點之間采用邊重連的策略產生小世界網絡模型;NW模型給定的節點之間采用隨機加邊的策略產生小世界模型;
兩種網絡演化模型誰更合理目前并沒有定論。
1.2以是否考慮權重劃分
1.無權網絡演化模型:如果對所研究網絡的邊沒有賦予相應的權值,則該網絡就稱為無權網絡。基本的ER模型、WS小世界模型、NW小世界模型以及BA模型都屬于無權網絡演化模型。目前基于BA模型產生了大量的無權網絡演化模型。根據BA模型的網絡增長和擇優連接兩條規則,這些模型大體可以分為兩類:修改增長規則的無權網絡演化模型和修改連接規則的無權網絡演化模型。
無權網絡演化模型主要針對網絡的拓撲演化機制進行研究,不考慮網絡的功能、承載業務等,演化結論主要也是通過對網絡拓撲結構的評判(是否具有冪律度分布特性、小世界效應等)驗證。因此,無權網絡演化模型與實際網絡演化還有一定差距。
2.含權網絡演化模型:如果對所研究網絡的邊賦予了相應的權值,則該網絡就稱為含權網絡或加權網絡。現實世界的網絡幾乎都是含權網絡。含權網絡演化模型的研究對理解真實網絡的演化過程具有重要意義。具有代表性的含權網絡模型有DW模型, YJ BT模型?, Barrat、Barthelemy和Vespignani提出的簡單加權演化網絡模型(BBV模型) 以及中國科技大學復雜系統研究小組提出的TDE模型及其改進模型。
含權網絡演化模型認為網絡承載的業務與網絡拓撲結構是一種共生演化關系,相互驅動。BBV模型(特別是TDE模型) 通過將網絡業務耦合人網絡拓撲演化過程, 不僅得到網絡的冪律度分布,同時得到網絡強度的冪律分布、網絡權重的冪律分布以及高聚集性和非相稱混合性等特征,更加成功地刻畫出真實技術網絡的特性。
1.3以演化網絡采用的演化機制劃分
1.單一演化機制模型:指演化過程中只采取一種演化機制的模型。ER模型、WS小世界模型、NW小世界模型、BA模型以及眾多基于這些模型的改進模型都是單一演化模型。單一演化機制模型能有效研究某一演化機制對網絡演化性質的影響,但對處于復雜多變環境中的真實網絡而言,采用單一演化機制模型往往太過理想化,因此單一演化機制模型與實際網絡相比還存在一定的差距。
2.混合演化機制模型:混合演化機制模型是指網絡在演化過程中采取多種演化機制的模型。為了描述確定性與隨機性和諧統一的世界以及增長過程的復雜性和多樣性,中國原子能科學研究院網絡科學小組的方錦清等人提出并發展了統一的混合網絡模型,形成網絡理論模型的三部曲。數值模擬和理論分析揭示了統一混合網絡演化模型隨多個混合比變化的若干特性,將其應用于一些現有的無權和含權復雜網絡演化模型,可以得到更接近實際網絡的特性。雖然混合演化機制模型能描述網絡增長過程的復雜性和多樣性,但是真實網絡究竟采用了哪些演化機制以及各種演化機制所占比重的確定仍是一個需要解決的難題。
1.4以演化網絡是否動態變化劃分
1.靜態網絡演化模型:在相鄰兩個時間步內,網絡節點及節點之間的關系一直保持不變,則稱這類網絡為靜態網絡。目前研究的網絡演化模型基本上都屬于此類型。
2.動態網絡演化模型:在相鄰兩個時間步內,網絡節點及節點之間的關系(邊)具有可變性,則稱這類網絡為動態網絡。動態網絡系統中,節點的狀態和拓撲都是動態演化的,節點的狀態和網絡的拓撲之間可能是相互影響的,且系統在整體層面上會展示出各種各樣的集體行為。當前的研究重點主要是系統具有什么樣的集體動力學行為、如何干預或控制此系統等。
2社區網絡
目前,社區還沒有明確的定義。一般而言,社區是指網絡中具有相似屬性的節點集合,社區內部關系緊密,社區之間節點關系稀疏。Fortunato從網絡節點相似度,局部和全局3個角度總結了常見的社區的定義。
綜合以上3中定義可以看出,節點相似度是利用節點屬性對網絡進行劃分,社會網絡分析領域經常采用這種定義。然而,在復雜網絡中,由于節點的屬性非常復雜,很難獲得有效的信息,因此大多數復雜的網絡社區都使用后兩種定義,利用網絡拓撲來發現社區結構。
2.1復雜網絡中社區結構的分類
在復雜網絡中,有兩種類型的社團結構:層次結構和重疊結構,它們可能同時存在于復雜網絡中。
1.層次結構
社區層次結構是對社會網絡中不同層次、不同粒度社區的整合。現實世界中的大多數網絡系統都顯示出層次的形態。真實網絡通常由社區組成,而這樣的社區中包含較小的社區,小社區中可能包含更小的社區等。社區層次結構的意義在于揭示復雜網絡中社區之間的上下包含關系。層次結構在社會網絡中普遍存在,如籃球和羽毛球俱樂部都屬于球類俱樂部,圍棋和象棋俱樂部都屬于棋牌俱樂部,而球類和棋牌類俱樂部都屬于體育俱樂部。發現網絡社區層次結構,可以深人理解不同尺度下網絡結構及網絡結構之間的關系,從而更好地反映真實系統的情況,有利于進行系統分析。目前發現社區層次結構較多采用層次聚類的方法,按照網絡圖中節點之間的距離或者相似度進行聚類,將整個網絡結構構建成為一棵樹狀圖。樹狀圖表示了網絡社區的層次結構,如圖所示,每個節點是樹狀圖中的葉子,然后通過連接構成樹狀圖,組成一個完整的網絡。樹狀圖中的每一層代表不同的社區,從底層到高層社區數量越來越少,社區規模越來越大。
2.重疊結構
研究發現,現實世界中許多網絡社區之間通常并不是彼此獨立的,而是相互關聯的。換言之,網絡由相互關聯,彼此重疊的社區組成,社區之間存在重疊的節點。社區的重疊結構是指社區中每個節點并非只屬于一個獨立的社區,而是存在某些節點可能屬于多個社區。例如,在社會網絡中,根據不同的分類方法,每個人可能會劃分到多個不同的社區(如家庭、公司、興趣小組、學校等):在科學家合作網絡中,一個物理學家同時也可能是一個數學家,因此他將同時處于分別由物理學家和數學家構成的兩個社區中。社區重疊結構更加符合真實世界的社區之間的關系,反映了更加真實的網絡結構。復雜網絡中層次重重社區如圖所示,從圖中可以發現某些節點在不同的社區之間起著橋梁的作用,同時屬于兩個不同的社區。
2.2社區結構評價標準
采用層次聚類算法是針對已知社區數目(層次)的網絡,你需要先構成網絡的層次樹狀圖,每一層對應網絡的一個劃分。但是實際中網絡的社區數目往往是未知的。
如何從樹狀圖中獲得最優的社區劃分,需要一個度量標準。這里介紹一個劃分標準——模塊度。
所謂模塊性,是指在? 一個真實社團內部的節點的邊在該網絡中所占的比例期望值? 與? ?在保持該網絡節點社團屬性不變的情況下,邊根據節點的度隨機鏈接時,社團內部節點的邊占該網絡全部邊的比例期望值? ?的比值。社團結構劃分的越好,該比值越大。通常用Q函數定量描述社團劃分的模塊水平:
Q=(一個真實社團內部的節點的邊在該網絡中所占的比例期望值)/(?在保持該網絡節點社團屬性不變的情況下,邊根據節點的度隨機鏈接時,社團內部節點的邊占該網絡全部邊的比例期望值)
其中,m為邊數,ki,kj為節點vi,vj的度,它們中間有邊的可能性為(ki*kj)/2m,若有邊Aij=1,否則等于0。ci,cj分別是vi,vj所屬的社區,當ci=cj時δ(ci,cj)=1,否則等于0。
Q值范圍【-0.5,1),值越大,社區劃分越準確。在實際中,Q值最高點一般在0.3~0.7之間.
3權重網絡
權重網絡就是帶權重的網絡。之前只討論邊是否存在的二進制網絡只是純粹的拓撲模型,不足以解釋實際系統觀察中的豐富而復雜的性質。
3.1加權網絡的度量
加權圖一般表示為G=(V,E,W)。首要特征是權分布Q(w),即特定邊的權為w的概率。
下面介紹的度量是無權網絡中一些概念的拓展與補充,并將權與拓撲相結合。
1.點的強度,強度分布與相關性
強度是度概念的推廣:由邊的個數推廣為邊權的和。
當權與拓撲結構無關時,度數為k的點的強度S(k)約等于<w>*k,<w>為平均強度。
點vi的邊權可能均勻分布,也可能只有少數權占優勢。權的不等性由度量,它的定義為
?
即每條邊權占強度比值的平方和。如果邊的權值都差不多,則Y(k)=1/k,若只有一條邊起主要作用,則Y(k)=1。
強度分布R(S)度量了點強度為S的概率,和度分布P(K)一起構成了加權網絡的有用信息。點vi的最近鄰度數的加權平均為:
這個量可以刻畫加權網絡的同類匹配性和非同類匹配性。當時,權值大的點傾向于鏈接度大的點,否則相反。
2.加權最短路徑
有些情況下邊的物理長度是有用的,邊的長度L可以定義為vi到vj的歐幾里何空間距離。在一般加權網絡中,邊長可以用權的函數表示,如L=1/wij,盡管此假設不滿足三角不等式。加權最短路徑可以定義為vi到vj中邊長和的最小值,此時最短路徑不再是含有最少邊的路徑。
3.加權聚集系數
之前所說的聚集系數沒有考慮到加權網絡中有些鄰居節點比其他點更重要,這里令vi的加權聚集系數定義為:
?,取值【0,1】
加權聚集系數既考慮了vi的鄰居閉三角形個數,又考慮了總相對權。和(k)分別表示所有點的加權聚集系數均值和所有k度點的加權聚集系數均值。對于大型隨機網絡,有=C,(k)=C(k)。然而實際情況卻可能看到兩種相反的情況,如果>C,則頂點關聯三元組更可能由權高的邊組成;相反如果<C,則表示網絡的拓撲聚集由權低的邊形成。??
3.2實際加權網絡
不同鏈接的權展示了不同的分布和冪律行為等復雜統計特征。權和拓撲的相關性為觀察這類組織結構提供了互補的視角。
1.生物網絡(以代謝網絡為例)
若以E大腸桿菌的新陳代謝反應作為加權網絡研究,節點vi,vj表示代謝物i,j,有向邊eij代表代謝物 i 到 j 的反應,權wij代表從代謝物 i 到 j 的流量。
在最優生長條件下,權分布很好的符合冪律分布:
,其中w0=0.003,rw=1.5。
這代表越高的權出現的概率越小,即流量越高的反應出現的概率越小。
同時在權的不等性方面,我們發現對于E大腸桿菌的代謝,其入度出度都符合
,即權的不等性與成正比。
在之前2.6.1我們定義權的不等性時我們知道,如果權分布平均,則Y(k)越趨近于1/k。因此在E大腸桿菌代謝網絡中,節點的度k越大,其權不等性與1/k的距離越遠。即度越大的節點,權分布越不均勻。即某個代謝物生成或者消耗反應越多,越有可能某個反應攜帶了大多數的反應物。
2.社會網絡(以合作網為例)
合作網是目前擁有廣泛數據庫的社會網絡。以無權科學合作網為例,科學家作為端點,如果兩位科學家合作過文章,則連一條邊。但是合作多的科學家之間明顯比合作少的科學家之間聯系更緊密,為了解釋這一現象,我們需要合作頻數來衡量作者間的關系。比如我們可以定義作者i,j之間相互作用的權為:
,p的定義域為所有的文章,如果作者i是文章p的作者之一,則=1,否則為0 ,np是文章p的作者數。
即合作過的文章越多,合作文章的共同作者越少,兩位科學家之間的權越大,聯系越緊密。
現在我們根據這種權的定義,來研究一個N=12722的,1995-1998年間給凝聚態物理提交論文草稿的科學家的合作網。實際觀察中,該網絡具有以下特征:
3.技術網絡
以世界航空網為加權網并進行分析。節點vi,vj表示機場i,j,權wij為機場i到機場j的航班的有效座位數。該實際網絡展示了小世界和無標度屬性。
3.3加權網絡建模
1.YJBT模型
YJBT模型是加權無標度網絡的最小模型,模型中隨著網絡增長,拓撲和權都受擇優連接規則驅動。
YJBT模型產生了無標度網絡,度為冪律分布P(k)~?,強度也為冪律分布R(S)=?,其中指數強烈依賴于m,漸進的強度分布最終收斂于度分布。
因為YJBT模型生成過程的演示在網絡上沒有找到,所以我自己寫了一個:https://github.com/changyaoxing/ComplexNetworkModel_YJBT
2.ZTZH模型
ZTZH模型是YJBT模型的一般化,在點的度和適應度的權值分配上加入了隨機因素。對于每條新建連接,以概率p按照YJBT模型的形式賦予其權值,以概率1-p按照的形式賦予權值,其中是賦予點vi的適應度參數,服從區間【0,1】上的均勻分布。p=1時,模型就還原成了YJBT模型,p=0時,權值完全有適應度決定。模型產生了強度冪律分布R(S)~,其指數的特征是對概率p高度敏感,從p=0時的值=3隨著p的增加而連續遞減。和YJBT模型一樣,關于P(k)的差異是對數修正項的結果,可以用p調整,當p=0時,差異消失。YJBT模型發現對所有p>0都有依賴m的變化,僅當p=0時,獨立于m在一個依賴于點連接和適應度的邊形成機制模型中也發現了類似的結果。
3.AK模型
AK網絡的結構增長與邊權相耦合。模型定義如下:
所得網絡是樹,其強度分布R(S)當S趨近于無窮時,逼近靜態胖尾分布R(S)~S^(-γ),與邊權分布ρ(w)無關。特別的,當ρ(w)為指數分布時,R(S)為所有的代數分布。
4.BBV模型
之前的YJBT、ZTZH、AK模型都是基于網絡拓撲增長,即產生邊的同時為其賦予一個權值,以后就不再變化。這種模型忽略了新節點和邊的加入可能引發的權的動態變化,忽略了演化和增進的相互作用是自然的網絡的普遍特征。例如,一條新航線的開辟會影響其他航線的流量。
BBV模型是基于加權驅動動力學和與局域網絡增長相結合的權增加機理,這種結合模仿了實際情況中觀察到的相互作用的變化。
BBV模型生成的網絡展示了權、度和強度分布的冪律行為、指數是非平凡的且與w0和相關。若令w0=1,這時的模型只考慮一個單獨參數,即由于添加新邊而增加的點的強度。當時間無窮大,即點無窮多時,權分布呈冪律分布Q(w)~,。點的度數分布和強度分布服從于有相同指數的冪律分布和。
5.DM模型
BBV模型中強度高的點吸引新邊,然后修正這些點的邊權。DM模型中,權高的邊增加權值并吸引新的連接。一種指向強的點,一種指向強的邊。DM模型規則如下:
結果邊權、點的度數、點的強度都成冪律分布,指數分別等于和?。
4相依網絡
現實中的網絡或多或少的都與其他的網絡相關聯,比如物理依附,信息交換等。2003年的意大利停電事故就是因為電網的某個節點故障,導致其相連的計算機控制節點斷電,結構控制網絡無法有效調控電網,造成全國性的斷電。研究相依網絡對設計更健壯的網絡系統,提高網絡設施抵御風險的能力具有重要意義。
相依網絡有三個要素:相依網絡的子網絡,相依網絡的相依邊,相依網絡的組合方式。
4.1相依網絡的子網絡
相依網絡的魯棒性受子網絡的影響很大。子網對相依網絡的魯棒性的影響主要是靠子網絡的類型及節點數、平均度等特性。
子網絡的類型可以是ER網絡、RR網絡、SF網絡、BA網絡、WS網絡等。其他條件相同時,這些網絡作為子網組成的相依網絡的魯棒性表現如下:
RR-RR>ER-ER>SF-ER>SF-SF,這是子網絡節點度分布決定的,子網絡的度分布越均勻,相依網絡的魯棒性越好。
網間相似性:子網絡內部度數高的節點間傾向于產生相依關聯。例如機場網和港口網組成的系統中,令相依關聯為地理位置相同,則重要的港口節點傾向于鏈接重要的機場節點。
在研究港口-機場的相依網絡時發現:網間相似性越高,相依網絡在面臨隨機失效時的魯棒性越好。即我們可以通過提高度高節點間的相依邊的可靠性,增強相依網絡的魯棒性。
4.2相依網絡的相依邊
相依邊是相依網絡的存在基礎,也是影響相依網絡魯棒性的最直接因素。相依邊主要通過其方向、類型以及比例等屬性影響整個網絡的魯棒性。
相依邊分為有向和無向兩種,當其他條件相同時,有向相依邊的相依網絡魯棒性較差。因為有向系統可能產生更長的相依鏈。
相依鏈指在兩個子網A、B組成的相依模型中,A中的節點u支持B的節點v,而v反過來又支持A的節點w,如此循環往復形成的相依節點集。相依鏈上節點的故障會通過相依鏈在子網間傳播,還可能擴散到與相依鏈鏈接的其他節點上,引起故障的級聯,降低系統的魯棒性。
相依邊類型有連接邊(connectivity links)和依賴邊(dependency links)兩種。連接邊的作用是連接不同網絡的節點,使子網絡能夠協同工作;依賴邊表示某個節點的功能依賴于其他節點。據此可以將相依網絡分為三種,即子網絡間只存在依賴邊/只存在連街邊/同時存在連接邊和依賴邊的相依網絡。
相依網絡的相依強度q指的是相依網絡中有相依關系的節點所占的比例:q=0表示子網絡間無相依關系;q=1表示子網絡完全相依,即節點之間具有一一對應的相依關系。當相依強度p由0向1變化時,相依網絡的魯棒性會變差。
4.3相依網絡的組合方式
隨著研究的深入,學者們從子網絡規模和組合方式的角度對相依網絡進行了拓展,目前研究的重點是網絡組成的網絡——多層網絡(network of network,NON)的魯棒性。
目前研究較多的是由ER、RR等網絡作為子網絡,以鏈形、星形、樹形和環形組合方式組成的NON的性質。
?
總結
以上是生活随笔為你收集整理的几种复杂网络模型的介绍:动态演化网络、社区网络、权重网络、相依网络、多层网络的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习建模中的Bagging思想!
- 下一篇: Office WORD EXCEL批量查