Exploratory Social Network Analysis with Pajek(第三版)12
第五部分建模
在??最后一部分,我們將注意力從純粹的網(wǎng)絡(luò)結(jié)構(gòu)探索性描述轉(zhuǎn)移到建模上。介紹了兩種類型的建模:塊模型(第 12 章)和隨機(jī)圖模型(第 13 章)。
內(nèi)聚性、中介和等級(jí)與社會(huì)角色相關(guān):成為團(tuán)體的成員、調(diào)解人或上級(jí)。這些角色中的每一個(gè)都與特定的關(guān)系模式相關(guān)聯(lián)。塊模型描述了整個(gè)網(wǎng)絡(luò)中的社會(huì)角色和相關(guān)聯(lián)的模式。塊模型對(duì)前面章節(jié)中討論的概念提供了不同的視角。
我們的網(wǎng)絡(luò)結(jié)構(gòu)可以是隨機(jī)的嗎?網(wǎng)絡(luò)探索會(huì)產(chǎn)生網(wǎng)絡(luò)結(jié)構(gòu)屬性的值,例如內(nèi)聚性、中心性和排名。我們假設(shè)結(jié)構(gòu)屬性是由網(wǎng)絡(luò)中代表的人做出的選擇產(chǎn)生的——與誰(shuí)聯(lián)系,不與誰(shuí)聯(lián)系——并且結(jié)構(gòu)屬性對(duì)他們的態(tài)度和行為產(chǎn)生影響。網(wǎng)絡(luò)結(jié)構(gòu)的社會(huì)原因和后果賦予結(jié)構(gòu)指數(shù)以意義。隨機(jī)圖模型向我們展示了我們對(duì)網(wǎng)絡(luò)屬性和影響來(lái)自社交而不是隨機(jī)過(guò)程。
十二、Blockmodels
12.1 簡(jiǎn)介
在本書(shū)的前幾部分中,我們介紹了用于分析社會(huì)網(wǎng)絡(luò)的廣泛技術(shù)。我們發(fā)現(xiàn),一個(gè)結(jié)構(gòu)概念通??梢酝ㄟ^(guò)多種方式來(lái)衡量(例如,中心性)。我們還沒(méi)有遇到相反的情況,即一種技術(shù)能夠檢測(cè)不同類型結(jié)構(gòu)(例如,內(nèi)聚性和中心性)。在最后一章中,我們介紹了一種稱為塊建模的技術(shù)。
塊建模是一種分析社會(huì)網(wǎng)絡(luò)的靈活方法。一些網(wǎng)絡(luò)概念對(duì)異常很敏感;例如,單個(gè)弧可以將有等級(jí)變成無(wú)等級(jí)群組(第 10 章)。經(jīng)驗(yàn)數(shù)據(jù)很少是完美的,因此我們需要一個(gè)工具來(lái)檢查允許異?;蝈e(cuò)誤的社會(huì)網(wǎng)絡(luò)的結(jié)構(gòu)特征。密切相關(guān)的塊建模和層次聚類就是這樣的工具。
盡管塊建模是一種能夠檢測(cè)內(nèi)聚力、核心-外圍結(jié)構(gòu)和排序的技術(shù),但它并不能取代前面章節(jié)中介紹的技術(shù)。目前,塊建模僅對(duì)小型密集網(wǎng)絡(luò)可行且有效,而其他技術(shù)在大型或稀疏網(wǎng)絡(luò)上效果更好。此外,塊建?;诓煌慕Y(jié)構(gòu)概念:對(duì)等和位置,這與社會(huì)角色和角色集的理論概念有關(guān)。塊模型將頂點(diǎn)分組并確定這些群組(Cluster)之間的關(guān)系(例如,一個(gè)群組(Cluster)是中心,另一個(gè)是外圍)。相比之下,前幾章討論的技術(shù),例如中心性度量,分別計(jì)算每個(gè)頂點(diǎn)的結(jié)構(gòu)位置。
塊建模使用矩陣作為計(jì)算工具和結(jié)果的可視化。因此,我們先介紹矩陣作為表示社會(huì)網(wǎng)絡(luò)的一種手段,然后再討論等價(jià)的概念和塊建模的技術(shù)。
12.2 矩陣和排列
在社會(huì)網(wǎng)絡(luò)分析中,除了社會(huì)圖之外,矩陣已經(jīng)被使用了很長(zhǎng)時(shí)間。矩陣是表示小型社會(huì)網(wǎng)絡(luò)和計(jì)算其結(jié)構(gòu)結(jié)果的有效工具。此外,矩陣提供了關(guān)于小型和密集網(wǎng)絡(luò)結(jié)構(gòu)的視覺(jué)線索,這就是我們?cè)诒竟?jié)中使用它們的目的。
矩陣是包含行和列的雙向表。行和列的交點(diǎn)稱為矩陣的一個(gè)單元。圖 108 顯示了木材加工廠罷工員工的通信網(wǎng)絡(luò)矩陣(參見(jiàn)第 7 章)。在這個(gè)矩陣中,每一行和每一列都代表網(wǎng)絡(luò)的一個(gè)頂點(diǎn),例如,第一(最高)行和第一(左)列特征為 Xavier。此行或列中的單元格顯示 Xavier 的關(guān)系。在圖 108 中,黑色單元格表示 Xavier 與另一名員工(或與他自己)通信,白色(空)單元格表示沒(méi)有通信。請(qǐng)注意,矩陣通常包含數(shù)字,例如,1 表示存在關(guān)系,0 表示沒(méi)有關(guān)系。在圖 108 中,我們將數(shù)字替換為黑色或白色方塊以突出顯示圖案
這種類型的矩陣稱為鄰接矩陣,因?yàn)槲覀兛梢詮闹锌闯瞿男╉旤c(diǎn)是網(wǎng)絡(luò)中的鄰居(相鄰);例如,第一行的黑色單元格表示 Xavier(頂點(diǎn) 1)與 Wendle(頂點(diǎn) 11)和 Sam(頂點(diǎn) 15)進(jìn)行通信。更準(zhǔn)確地說(shuō),這些黑色單元格表明 Xavier 與 Wendle 和 Sam 之間存在聯(lián)系。行條目包含邊的發(fā)送者,列條目包含其接收者,因此第一行包含來(lái)自 Xavier 的邊,第一列顯示與 Xavier 的邊(例如,來(lái)自 Wendle 和 Sam)。 Xavier 在他的行和列中具有相同的鄰居并非巧合:網(wǎng)絡(luò)是無(wú)向的,因此 Xavier 與 Wendle 的通信意味著 Wendle 與 Xavier 進(jìn)行通信,等等。一條邊相當(dāng)于一條雙向弧,因此一條邊由鄰接矩陣中的兩條弧表示。一般來(lái)說(shuō),無(wú)向網(wǎng)絡(luò)的鄰接矩陣是關(guān)于從矩陣的左上角到右下角的對(duì)角邊對(duì)稱的,該對(duì)角邊通常稱為矩陣的對(duì)角邊。
圖 108 的鄰接矩陣在對(duì)角線上不包含黑色單元格,因?yàn)檫@些單元格表示頂點(diǎn)與其自身的關(guān)系,并且不考慮員工與自己進(jìn)行通信。鄰接矩陣對(duì)角線上的單元格通常會(huì)受到特殊處理,因?yàn)樗鼈兙哂协h(huán)。
因?yàn)橄嗤捻旤c(diǎn)定義了鄰接矩陣的行和列,所以鄰接矩陣根據(jù)定義是正方形的。相比之下,雙模網(wǎng)絡(luò)(例如第 5 章的蘇格蘭董事網(wǎng)絡(luò))由矩形矩陣表示,但不一定是正方形。我們可以將公司放在行中,將董事放在列中,并且仍然包括該矩陣的單元格中的所有關(guān)系,因?yàn)楣局荒芘c董事直接相關(guān)。這樣的矩陣稱為從屬矩陣。在從屬矩陣中,對(duì)角單元格不代表環(huán)。
矩陣中黑色單元格的模式提供了網(wǎng)絡(luò)結(jié)構(gòu)的視覺(jué)邊索,因?yàn)槲覀兛梢钥吹侥男┻叴嬖?#xff08;黑色)或不存在(白色)關(guān)系。然而,就像社會(huì)圖一樣,矩陣只有在仔細(xì)放置其頂點(diǎn)時(shí)才能揭示網(wǎng)絡(luò)結(jié)構(gòu)。例如,圖 108 顯示了看似隨機(jī)的黑色單元格圖案。它不會(huì)揭示網(wǎng)絡(luò)的結(jié)構(gòu),因?yàn)閱T工是按任意順序列出的。如果我們按他們的語(yǔ)言(英語(yǔ)或西班牙語(yǔ))和年齡(小于或大于 30 歲)對(duì)它們進(jìn)行排序,黑色單元格會(huì)顯示出更加規(guī)則的模式(圖 109)。現(xiàn)在,很容易看出這些界邊主要出現(xiàn)在種族和年齡組中:各組之間不超過(guò) 3 條界邊(Karl-Ozzie、Bob-Norm 和 Bob-Alejandro)。
頂點(diǎn)的重新排序或排序稱為網(wǎng)絡(luò)排列。本質(zhì)上,排列是一個(gè)網(wǎng)絡(luò)的每個(gè)頂點(diǎn)都有一個(gè)條目、并指定其新的頂點(diǎn)編號(hào)的列表。換句話說(shuō),排列是網(wǎng)絡(luò)中頂點(diǎn)的重新編號(hào)。
- 網(wǎng)絡(luò)的排列是對(duì)其頂點(diǎn)的重新編號(hào)。
如果我們?yōu)轫旤c(diǎn)分配新的數(shù)字,網(wǎng)絡(luò)的結(jié)構(gòu)不會(huì)改變。例如,比較圖 110 中的網(wǎng)絡(luò) A 和 B。我們交換了頂點(diǎn) 2 和 4 的數(shù)量,但這并不影響網(wǎng)絡(luò)的結(jié)構(gòu):網(wǎng)絡(luò) A 和 B 是同構(gòu)的;也就是說(shuō),它們具有相同的結(jié)構(gòu)。在矩陣中,我們交換了行和列中的頂點(diǎn)數(shù),并對(duì)矩陣進(jìn)行了重新排序,從而為相同的結(jié)構(gòu)獲得了不同的矩陣。
這些矩陣看起來(lái)不同,但它們描述了相同的結(jié)構(gòu)。這意味著我們可以用許多不同的矩陣來(lái)表示同一個(gè)網(wǎng)絡(luò),就像我們可以為一個(gè)網(wǎng)絡(luò)繪制許多不同的社會(huì)圖一樣。置換重新排列矩陣就像能量命令重繪社會(huì)圖。因此,我們可以使用排列來(lái)找到揭示網(wǎng)絡(luò)結(jié)構(gòu)的矩陣。后續(xù)部分將展示如何執(zhí)行此操作。
按種族和年齡組排列的罷工網(wǎng)絡(luò)(圖 109)顯示了表征內(nèi)聚子組的模式:黑色(非空)條目聚集在矩陣的對(duì)角邊周圍,在那里它們形成團(tuán)塊。這些團(tuán)塊確定了主要在其群體內(nèi)保持聯(lián)系的行為者的子群體。在我們的示例中,這些團(tuán)塊很好地反映了種族和年齡組。
應(yīng)用
由于矩陣可以表示網(wǎng)絡(luò),因此可以以矩陣格式存儲(chǔ)網(wǎng)絡(luò)數(shù)據(jù)。對(duì)于小型網(wǎng)絡(luò),矩陣是我們迄今為止用作網(wǎng)絡(luò)數(shù)據(jù)文件格式的弧和邊的傳統(tǒng)且有用的替代方案。 Pajek可以讀取矩陣格式的數(shù)據(jù);有關(guān)詳細(xì)信息,請(qǐng)參閱附錄 1(第 A1.2 和 A1.3 節(jié)),其中還討論了矩陣格式的一些缺點(diǎn)。
在 Pajek 中,您可以通過(guò)在網(wǎng)絡(luò)下拉菜單中雙擊其名稱來(lái)顯示網(wǎng)絡(luò)矩陣。在出現(xiàn)的對(duì)話框中,如果要顯示二值矩陣,請(qǐng)輸入 1,即僅說(shuō)明一條邊是存在 (#) 還是不存在 (.) 的矩陣。圖 111 顯示了原始罷工網(wǎng)絡(luò)的一部分(包含在 Pajek 項(xiàng)目文件strike.paj 中)顯示為二值矩陣。請(qǐng)注意,列表由未格式化的原始文本組成,因此應(yīng)該以固定的寬字體顯示,例如 Courier。如果要在鄰接矩陣中顯示行值,請(qǐng)?jiān)趯?duì)話框中鍵入 2 以獲得值矩陣。在有值矩陣中,缺失的行由單元格中的 0 表示。
在 Pajek 中,不能以這種方式顯示 100 個(gè)或更多頂點(diǎn)的網(wǎng)絡(luò),因?yàn)樗鼈儠?huì)產(chǎn)生巨大的矩陣。因此,選項(xiàng)“二值”和“邊值”不適用于大型網(wǎng)絡(luò),她會(huì)自動(dòng)報(bào)告為弧和邊的列表。在這些列表中,每一行代表一個(gè)頂點(diǎn),由它的編號(hào)和標(biāo)簽標(biāo)識(shí),后跟從它接收一條邊的所有頂點(diǎn)的編號(hào)。這種類型的列表也是顯示小型網(wǎng)絡(luò)的第三個(gè)選項(xiàng)(“列表”)。
原始文本矩陣不適合高質(zhì)量打印。為此,可以使用命令 File> Network> Export as Matrix to EPS> Original in PostScript (EPS是 Encapsulated PostScript的意思)格式保存矩陣。邊值會(huì)自動(dòng)轉(zhuǎn)換為單元格的暗度。可以通過(guò)這種方式導(dǎo)出更大的網(wǎng)絡(luò),但大型矩陣通常對(duì)于可視化檢測(cè)網(wǎng)絡(luò)結(jié)構(gòu)不是很有幫助。
正如我們所論證的,如果對(duì)矩陣進(jìn)行重新排序,它通常會(huì)提供更多信息。在罷工網(wǎng)絡(luò)的示例中,我們必須根據(jù)他們?cè)诜N族和年齡組中的成員資格對(duì)頂點(diǎn)進(jìn)行重新排序,這可以作為一個(gè)partition 提供給我們(strike_groups.clu包含在項(xiàng)目文件strike.paj中)。很容易從一個(gè)partition 派生一個(gè)排列,使得同一類中的頂點(diǎn)接收連續(xù)的數(shù)字:在partition 下拉菜單中選擇partition 并執(zhí)行位于partition 菜單中的 Make Permutation 命令。
鑒于該命令經(jīng)常使用,您也可以通過(guò)按 F3 來(lái)運(yùn)行它。 Pajek 創(chuàng)建一個(gè)新的排列,將最小的頂點(diǎn)數(shù)分配給partition 的第一類中的頂點(diǎn),依此類推。
排列顯示在 Pajek 主屏幕的排列下拉菜單中。您可以以通常的方式檢查和編輯排列。當(dāng)你編輯一個(gè)排列時(shí),你會(huì)看到每個(gè)頂點(diǎn)的一行包含兩個(gè)數(shù)字。第一個(gè)數(shù)字是新的頂點(diǎn)編號(hào),第二個(gè)數(shù)字是原始的頂點(diǎn)編號(hào)。如果網(wǎng)絡(luò)下拉菜單中的適當(dāng)?shù)木W(wǎng)絡(luò)處于活動(dòng)狀態(tài),則還會(huì)顯示頂點(diǎn)標(biāo)簽。
在各自的下拉菜單中選擇網(wǎng)絡(luò)、partition 和排列后,您可以使用命令File> Network>Export as Matrix to EPS> Using Permutation + Partition (或快捷鍵 F4)。一個(gè)對(duì)話框提示輸入矩陣將要保存的文件的名稱。在能夠讀取 PostScript 的查看器中(可下載GhostScrip查看該文件),結(jié)果應(yīng)類似于圖 112。查看File> Network> Export as Matrix to EPS> Options 子菜單中還提供了一些其他選項(xiàng),例如,將負(fù)值繪制為菱形(用于簽名圖)、以灰度繪制、在頂部/右側(cè)顯示標(biāo)簽、使用partition 顏色顯示標(biāo)簽。
種族和年齡組的排列也可以用來(lái)對(duì)網(wǎng)絡(luò)本身進(jìn)行重新排序。如果在其下拉菜單中選擇了網(wǎng)絡(luò)和排列,則Operations> Network + Permutation> Reorder Network命令會(huì)創(chuàng)建一個(gè)新的排列網(wǎng)絡(luò)。通過(guò)雙擊下拉列表中(新生成的network)的名稱,(在彈出的對(duì)話框中填入1)將重新排序的網(wǎng)絡(luò)顯示為二值矩陣,您將看到四名西班牙裔員工收到了從 1 到 4 的頂點(diǎn)編號(hào)(圖 113)。請(qǐng)注意,根據(jù)種族和年齡的原始partition 與排列后的網(wǎng)絡(luò)不兼容,但也可以重新排序:確保原始partition 和排列在其下拉菜單中處于活動(dòng)狀態(tài)并執(zhí)行命令Operations> Partition + Permutation> Reorder Partition 。以同樣的方式向量可以重新排序。
12.3 角色和位置:等價(jià)
在社會(huì)理論中,位置和角色是重要且相關(guān)的理論概念。一個(gè)位置,例如在大學(xué)擔(dān)任導(dǎo)師的位置,通常與社會(huì)角色或角色集相關(guān),即輔導(dǎo)學(xué)生和與同事協(xié)商。假設(shè)這個(gè)角色或角色集涉及與學(xué)生、同事和上級(jí)的特定關(guān)系和關(guān)系模式。社會(huì)學(xué)家、社會(huì)心理學(xué)家和其他社會(huì)科學(xué)家通過(guò)觀察互動(dòng)和采訪人們關(guān)于他們的動(dòng)機(jī)和他們所扮演角色的看法來(lái)研究社會(huì)角色和角色集的性質(zhì)。
在社會(huì)網(wǎng)絡(luò)分析中,我們專注于關(guān)系的模式。我們想識(shí)別具有相似關(guān)系模式的參與者,以發(fā)現(xiàn)他們是否與特定角色或角色集相關(guān)聯(lián),或者我們想檢查具有相似角色集的人是否參與了特征關(guān)系模式。在社會(huì)網(wǎng)絡(luò)分析中,位置等同于特定的關(guān)系模式。具有相似關(guān)系模式的參與者被認(rèn)為是關(guān)系等價(jià)的,構(gòu)成一個(gè)等價(jià)類,或在網(wǎng)絡(luò)中占據(jù)等價(jià)位置。
圖 114 提供了一個(gè)簡(jiǎn)單的示例來(lái)說(shuō)明這些想法。一個(gè)系內(nèi)的兩名導(dǎo)師(i1 和 i2)指導(dǎo)三名學(xué)生(s1 到 s3)。他們聯(lián)系學(xué)生,學(xué)生聯(lián)系他們。教官互動(dòng),所以他們是一個(gè)有內(nèi)聚性的子組,他們間的互動(dòng)可能會(huì)導(dǎo)致他們以類似的方式行事。然而,這三個(gè)學(xué)生并不一定互動(dòng)。盡管如此,他們對(duì)于導(dǎo)師來(lái)說(shuō)處于相同的位置;因此,他們可能會(huì)對(duì)他們采取類似的行動(dòng)。盡管它們不是內(nèi)聚的子群,但它們?cè)陉P(guān)系上是等價(jià)的。重要的是要注意,與其他位置成員的外部聯(lián)系、和“位置跟內(nèi)部的聯(lián)系等價(jià)”的概念同樣重要。
圖 114 是一個(gè)小型核心-外圍結(jié)構(gòu)的示例,其中兩名導(dǎo)師構(gòu)成核心(一個(gè)位置),學(xué)生構(gòu)成外圍(另一個(gè)位置)。聯(lián)系主要發(fā)生在核心內(nèi)部以及核心與外圍之間(外圍之間聯(lián)系不多),因此我們?cè)谂帕芯仃囍锌吹剿胶痛怪钡?strong>關(guān)系帶(是條形,不是矩形)。
到目前為止,我們已經(jīng)大致描述了等價(jià)的概念?,F(xiàn)在讓我們正式定義一種等價(jià),即結(jié)構(gòu)等價(jià):如果兩個(gè)頂點(diǎn)與自身、彼此以及所有其他頂點(diǎn)具有相同的聯(lián)系,則它們是結(jié)構(gòu)等價(jià)的。這個(gè)定義意味著可以交換結(jié)構(gòu)等價(jià)的頂點(diǎn),而不會(huì)對(duì)網(wǎng)絡(luò)的結(jié)構(gòu)產(chǎn)生任何影響。
- 如果兩個(gè)頂點(diǎn)與自身、彼此以及所有其他頂點(diǎn)具有相同的聯(lián)系,則它們是結(jié)構(gòu)等價(jià)的。
在我們的示例中,弧要么存在要么不存在,讓我們比較核心中的兩個(gè)頂點(diǎn)(導(dǎo)師 i1 和 i2)。顯然,這兩位導(dǎo)師與他們自己和彼此之間有著相同的聯(lián)系:他們都沒(méi)有與自己交流(沒(méi)有環(huán)),并且他們之間的聯(lián)系是對(duì)稱的。此外,它們與另一個(gè)位置的頂點(diǎn)——學(xué)生——的聯(lián)系也是相同的。如果導(dǎo)師 i1 連接到學(xué)生(例如,學(xué)生 s2),則另一個(gè)導(dǎo)師也連接到該學(xué)生。結(jié)果,除了對(duì)角邊上的單元格之外,兩位導(dǎo)師的行是相同的,因?yàn)樗麄儾粦?yīng)聯(lián)系自己。他們的列也是如此,它們代表了導(dǎo)師收到的邊。我們可以在不改變網(wǎng)絡(luò)結(jié)構(gòu)的情況下交換兩位導(dǎo)師。
一般來(lái)說(shuō),我們可以說(shuō)結(jié)構(gòu)等價(jià)的頂點(diǎn)在鄰接矩陣中具有相同的行和列(對(duì)角邊上的單元格除外)??紤]到這一點(diǎn),很容易看出外圍的三個(gè)學(xué)生(s1、s2和s3)不是完全結(jié)構(gòu)等價(jià)的,因?yàn)轫旤c(diǎn)s2與頂點(diǎn)s1相關(guān),但反過(guò)來(lái)不成立,所以他們沒(méi)有彼此相同的聯(lián)系。學(xué)生 s3 與 s1 無(wú)聯(lián)系,因此他或她在結(jié)構(gòu)上不等同于 s2。
結(jié)構(gòu)等價(jià)是基于頂點(diǎn)之間關(guān)于它們?cè)卩徑泳仃囍行泻土械男?#xff08; profile)的相似性或不相似性。兩個(gè)頂點(diǎn)的不相似性可以通過(guò)一個(gè)范圍從 0(完全相似)到 1(完全不同)的指標(biāo)來(lái)計(jì)算和表示。在圖 114 中,導(dǎo)師 i1 的行和列與導(dǎo)師 i2 的行和列完全相似,因此它們的不相似性得分為 0(見(jiàn)表 23)。學(xué)生 s1、s2 和 s3 在這方面并不完全相似,因此他們的不相似性得分大于 0(范圍從 0.0625 到 0.125),但他們彼此之間的相似度高于核心導(dǎo)師(不相似性為 0.1875或 0.25)。
知道所有頂點(diǎn)對(duì)之間的不相似性,我們?nèi)绾螌?#xff08;幾乎)結(jié)構(gòu)等價(jià)的頂點(diǎn)在位置上聚集到一起?這可以通過(guò)一種眾所周知的統(tǒng)計(jì)技術(shù)來(lái)實(shí)現(xiàn),這種技術(shù)稱為層次聚類。首先,該技術(shù)將最相似的頂點(diǎn)分組。在我們的示例中,導(dǎo)師 i1 和 i2 的關(guān)系完全相似,它們被合并到一個(gè)群組中。然后,層次聚類對(duì)下一對(duì)最相似的頂點(diǎn)或群組進(jìn)行分組,并繼續(xù)進(jìn)行,直到所有頂點(diǎn)都已連接。
圖 115 被稱為樹(shù)狀圖( dendrogram),可視化了聚類過(guò)程。你必須從左到右閱讀它。首先,導(dǎo)師 i1 和 i2 被加入,因?yàn)樗鼈兺耆嗨?#xff1a;他們的不相似性為 0。然后,學(xué)生 s1 和 s3 被加入(不相似性為 0.06,參見(jiàn)表 23)。第三步,將學(xué)生 s2 添加到 s1 和 s3 的群組中。最后,在群組合并的最后一步中,將該群組與核心頂點(diǎn)群組i1 和 i2)合并。
在樹(shù)狀圖中,水平分支的長(zhǎng)度代表了兩個(gè)頂點(diǎn)或群組在連接時(shí)的相異程度,因此您可以看到最后一步合并了兩個(gè)非常不同的群組。如果要將頂點(diǎn)劃分為兩個(gè)群組,則應(yīng)將導(dǎo)師與學(xué)生分開(kāi)。通常,在分支進(jìn)行大跳躍的地方拆分群組的層次結(jié)構(gòu)。通過(guò)這種方式,您可以檢測(cè)結(jié)構(gòu)等價(jià)或幾乎結(jié)構(gòu)等價(jià)的頂點(diǎn)群組(Cluster)。
應(yīng)用
讓我們將結(jié)構(gòu)等價(jià)的概念應(yīng)用于我們?cè)诘?2 章中介紹過(guò)的世界貿(mào)易網(wǎng)絡(luò)。Pajek 項(xiàng)目文件 world_trade.paj 包含網(wǎng)絡(luò)和標(biāo)識(shí) 1980 年世界系統(tǒng)位置的partition 。圖 116 展示包含1980 年已知世界系統(tǒng)位置的國(guó)家的矩陣(我們從網(wǎng)絡(luò)中提取partition 的第 1 到第 4 類,Operations>Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters。 邊值表示金屬五金制品的進(jìn)口總值;它們由 PostScript 矩陣中單元格的顏色表示:較高的值由較暗的單元格表示。由于幾個(gè)國(guó)家的商品貿(mào)易量非常大,因此進(jìn)口總額的分布高度傾斜。我們將所有超過(guò) 10 億美元的進(jìn)口商品更改為 10 億美元,以便為總價(jià)值較低的貿(mào)易關(guān)系獲得稍暗的單元格。請(qǐng)注意,這些調(diào)整只是為了更好地顯示矩陣。我們?cè)诒竟?jié)的其余部分使用原始貿(mào)易網(wǎng)絡(luò)。
網(wǎng)絡(luò)是有向的,因此矩陣不是對(duì)稱的,盡管進(jìn)口值通常與出口值在同一范圍內(nèi)。該矩陣揭示了我們之前提到的核心-外圍結(jié)構(gòu)的一些特征:核心內(nèi)部以及核心與半外圍之間的許多強(qiáng)聯(lián)系,但半外圍與外圍之間的聯(lián)系很少且弱。結(jié)果,聯(lián)系集中在與核心國(guó)家相關(guān)的水平和垂直條帶上。
Cluster> Create Complete Cluster
現(xiàn)在,讓我們計(jì)算原始貿(mào)易網(wǎng)絡(luò)中國(guó)家的行和列的不相似性。首先,我們必須做一個(gè)預(yù)備步驟。不相似性方法計(jì)算復(fù)雜,因此應(yīng)該用于小型網(wǎng)絡(luò)或大型網(wǎng)絡(luò)的一小部分。因此,該方法要求我們指出它應(yīng)該使用哪些頂點(diǎn)。我們必須在稱為群組的特殊數(shù)據(jù)對(duì)象中識(shí)別它們。在我們的示例中,我們想要包括所有國(guó)家,因此我們使用 Cluster> Create Complete Cluster 命令創(chuàng)建一個(gè)包含所有頂點(diǎn)的群組。網(wǎng)絡(luò)中的頂點(diǎn)總數(shù)默認(rèn)顯示在該命令發(fā)出的對(duì)話框中,因此您只需按 OK 按鈕即可。由該命令創(chuàng)建的群組在群組下拉菜單中列出,并且可以按照通常的方式進(jìn)行編輯。
Partition> Make Cluster> Vertices from selected Clusters
但是,如果要將分析限制在網(wǎng)絡(luò)的一部分,請(qǐng)確定要在partition 中計(jì)算不相似性的頂點(diǎn),并將此partition 中所需的一個(gè)或多個(gè)類轉(zhuǎn)換為使用 Partition> Make Cluster> Vertices from selected Clusters 命令進(jìn)行群組。對(duì)話框?qū)⑻崾灸斎氡仨氝x擇的partition 的類號(hào)或類號(hào)范圍。例如,您可以通過(guò)將世界系統(tǒng)位置partition 的第 1 類轉(zhuǎn)換為群組來(lái)限制對(duì) 1980 年核心國(guó)家的不相似性計(jì)算。在這種情況下,我們接下來(lái)討論的不相似性命令僅計(jì)算核心國(guó)家的不相似性,但它考慮了核心國(guó)家與非核心國(guó)家的聯(lián)系。
因?yàn)槲覀冃枰粋€(gè)網(wǎng)絡(luò)和一個(gè)群組來(lái)計(jì)算 Pajek 中的不相似性,所以 Dissimilarity* 命令位于操作菜單中。不相似性是從網(wǎng)絡(luò)結(jié)構(gòu)中計(jì)算出來(lái)的:如果頂點(diǎn)有許多共同的鄰居,則它們是相似的。另一種可能性是根據(jù)向量值(基于向量)計(jì)算不相似性,這里將不討論。有幾個(gè)不同的指數(shù),但我們只展示和使用指數(shù) d1。查閱數(shù)字分類手冊(cè)以了解有關(guān)其他指數(shù)的更多信息(參見(jiàn)本章末尾的“進(jìn)一步閱讀”)。兩個(gè)頂點(diǎn)的不相似性d1 只是它們不共享的鄰居的數(shù)量(歸一化為 0-1 區(qū)間)。該索引可能僅限于輸入鄰居(輸入;比較列)或輸出鄰居(輸出;比較行),或者它可以同時(shí)考慮輸入和輸出鄰居( All )。除非您有充分的理由專注于輸入或輸出鄰居,否則請(qǐng)選擇 All 命令。
d1 不相似性指數(shù)檢查頂點(diǎn)的鄰居們,因此它不考慮邊的值。如果您希望不相似性分?jǐn)?shù)反映邊值,您應(yīng)該選擇歐幾里得或曼哈頓距離指數(shù)(d5 和 d6)。在世界貿(mào)易的示例中,使用歐幾里得或曼哈頓距離將要求結(jié)構(gòu)等價(jià)國(guó)家不僅要向同一個(gè)國(guó)家出口和從同一個(gè)國(guó)家進(jìn)口,而且除此之外,還需要具有可比強(qiáng)度的貿(mào)易聯(lián)系。然而,這可能是一個(gè)過(guò)于苛刻的標(biāo)準(zhǔn),因?yàn)楦鲊?guó)的進(jìn)口價(jià)值差異很大。因此,我們?cè)谶@里推薦 d1 指數(shù)。
現(xiàn)在執(zhí)行Operations> Network + Cluster> Dissimilarity? > Network based> d1> All 命令。如果先前已選擇選項(xiàng)Operations> Network + Cluster> Dissimilarity? > Network based> Options> Report Matrix ,則 Pajek 計(jì)算不相似性并在報(bào)告屏幕中報(bào)告它們(注意:不要選擇此子菜單中的其他選項(xiàng))。該命令將不同之處存儲(chǔ)為新網(wǎng)絡(luò)中的行值,您可以以通常的方式列出或打印(參見(jiàn)第 12.2 節(jié))。請(qǐng)注意,此網(wǎng)絡(luò)是有向的且非常密集,因?yàn)槊繉?duì)不完全相似的頂點(diǎn)(因此:不相似性大于 0)由一對(duì)弧連接。作為一項(xiàng)規(guī)則,不要對(duì)這個(gè)網(wǎng)絡(luò)嘗試?yán)L制和應(yīng)用彈力布局。
在執(zhí)行一個(gè) dissimilarities 命令時(shí),Pajek 會(huì)自動(dòng)嘗試將層次聚類應(yīng)用于新創(chuàng)建的不相似性網(wǎng)絡(luò)。它提示用戶指定存儲(chǔ)聚類樹(shù)狀圖的文件的名稱。樹(shù)狀圖已保存但未顯示,因?yàn)樗捎肊PS格式。您可以使用 PostScript 解釋器(參見(jiàn)附錄 2)查看它(圖 117),將其插入 Word 或其他文本編輯器,或在 PostScript 打印機(jī)上打印。此外,層次聚類的結(jié)果被保存為排列和層次。
世界貿(mào)易網(wǎng)絡(luò)的樹(shù)狀圖,如圖 117 所示,顯示了貿(mào)易網(wǎng)絡(luò)中兩個(gè)非常不同的群組:10個(gè)西歐國(guó)家、美國(guó)、日本和中國(guó)與其余67個(gè)國(guó)家明顯分開(kāi),其中大部分是較貧窮的國(guó)家。
這也可以從由 Dissimilarity* 命令創(chuàng)建的層次結(jié)構(gòu)中推斷出來(lái),該命令標(biāo)記為“erarchical Clustering [Ward]”。請(qǐng)注意,“Ward”是指 Pajek 中默認(rèn)的層次聚類方法。其他方法可從 Network>Create Hierarchy>Clustering* 對(duì)話屏幕訪問(wèn)。在編輯屏幕中打開(kāi)層次結(jié)構(gòu)(單擊層次結(jié)構(gòu)下拉菜單左側(cè)帶有放大鏡的按鈕),然后通過(guò)單擊展開(kāi)根以及下一層群組以獲得在圖 118 中所描繪的列表。根將兩個(gè)主要群組聯(lián)合起來(lái)。方括號(hào)中的數(shù)字告訴您連接的群組或頂點(diǎn)的不同之處;較大的值意味著它們更不相似。十三個(gè)國(guó)家的群組在內(nèi)部比較大的群組(0.84)更相似(0.64),這對(duì)應(yīng)于樹(shù)狀圖中較大組內(nèi)的第一個(gè)拆分比較小組內(nèi)的拆分更準(zhǔn)確的事實(shí)(圖 117)。
[Hierarchy Edit screen] Edit> Show Subtree
我們?nèi)绾沃滥男﹪?guó)家屬于某個(gè)特定群組?我們可以通過(guò)以下方式在 Hierarchy Edit 屏幕中找到國(guó)家的名稱,前提是網(wǎng)絡(luò)下拉菜單中的適當(dāng)網(wǎng)絡(luò)處于活動(dòng)狀態(tài)。首先,確保在層次結(jié)構(gòu)的編輯屏幕的編輯菜單中選擇了Show Subtree選項(xiàng)。否則,Pajek 僅顯示在當(dāng)前層次聚類步驟中添加到聚類中的頂點(diǎn)的名稱。其次,通過(guò)左鍵單擊(選擇它)并隨后右鍵單擊它,在編輯屏幕中選擇一個(gè)群組。在一個(gè)新窗口中,列出了該群組及其所有子群組中的頂點(diǎn)的數(shù)量和標(biāo)簽。例如,如果將其應(yīng)用于標(biāo)記為“100071”的群組,您將看到它包含奧地利、瑞士、比利時(shí)/盧森堡、荷蘭、瑞典和西班牙。
層次聚類逐漸將頂點(diǎn)合并為群組,將小群組合并為較大的群組。哪些群組代表結(jié)構(gòu)等價(jià)類,哪些不代表?在結(jié)構(gòu)等價(jià)的嚴(yán)格方法下,不相似性為零的頂點(diǎn)是結(jié)構(gòu)等價(jià)的。然而,在真實(shí)的社會(huì)網(wǎng)絡(luò)中,很少發(fā)現(xiàn)這樣的頂點(diǎn),所以我們考慮不是很相似的頂點(diǎn)群組來(lái)表示結(jié)構(gòu)等價(jià)類。
哪些頂點(diǎn)不是很不同?這個(gè)問(wèn)題沒(méi)有一般的答案。由你決定你想要的等價(jià)類的數(shù)量,也就是說(shuō),你想要切割樹(shù)狀圖的次數(shù),但你應(yīng)該總是從“右到左”切割它:首先分離最不相似的群組。在世界貿(mào)易示例中,您應(yīng)該首先將 13 個(gè)富裕國(guó)家與其他國(guó)家分開(kāi)。然后,您可以在新的群組中進(jìn)行細(xì)分,因?yàn)檫@些國(guó)家 (0.84) 比 13 個(gè)富裕國(guó)家 (0.64) 更加不同,依此類推,直到您達(dá)到所需的等價(jià)類數(shù)量或進(jìn)一步細(xì)分似乎是任意或無(wú)意義。
讓我們將貿(mào)易網(wǎng)絡(luò)劃分為四個(gè)結(jié)構(gòu)等價(jià)類,因?yàn)槲覀儎澐譃樗膫€(gè)世界系統(tǒng)位置(核心、強(qiáng)半外圍、弱半外圍和外圍)。我們拆分了 67 個(gè)國(guó)家的群組(相異度為 0.84)及其最大的子群組(相異度為 0.78)?,F(xiàn)在,我們可以從標(biāo)識(shí)這四個(gè)群組的層次結(jié)構(gòu)中創(chuàng)建一個(gè)partition 。這分兩步完成。
首先,我們必須關(guān)閉層次結(jié)構(gòu)中不想進(jìn)一步拆分的群組。通過(guò)在 Hierarchy Edit 屏幕中左鍵單擊群組來(lái)選擇群組,然后從 Hierarchy Edit 屏幕的 Edit 菜單中選擇 Change Type 或按 Ctrl-t?,F(xiàn)在,消息(關(guān)閉)出現(xiàn)在所選群組的后面。對(duì)必須關(guān)閉的其他群組重復(fù)此操作,但不要將其應(yīng)用于任何必須細(xì)分的群組。
其次,從主屏幕的 Hierarchy 菜單中執(zhí)行 Make Partition 命令。此命令創(chuàng)建一個(gè)partition ,其中每個(gè)關(guān)閉的群組都由同一個(gè)類表示。當(dāng)您在原始世界貿(mào)易網(wǎng)絡(luò)中繪制此partition 時(shí),您會(huì)注意到等價(jià)類代表貿(mào)易位置和地理位置的混合;核心國(guó)家是西歐國(guó)家、美國(guó)、日本和中國(guó),從三個(gè)區(qū)域位置劃分:美洲、亞洲與大洋洲、歐洲(包括前殖民地)與中東。
File> Network> Export as Matrix to EPS> Using Permutation + Partition
到目前為止,我們已經(jīng)討論了由 Dissimilarities 命令創(chuàng)建的樹(shù)狀圖和層次結(jié)構(gòu),但沒(méi)有討論排列。該排列被標(biāo)記為“分層聚類排列 [Ward]”,它標(biāo)識(shí)了樹(shù)狀圖中表示的頂點(diǎn)的順序。當(dāng)您要打印由層次聚類結(jié)果重新排序的矩陣時(shí),可以使用此排列。它與 從層次結(jié)構(gòu)中創(chuàng)建的Partition匹配,因此您可以獲得一個(gè)帶有藍(lán)色線的矩陣,指示您在群組層次結(jié)構(gòu)中所做的拆分(請(qǐng)參閱第 12.2 節(jié))。
12.4 塊建模
在前面的部分中,我們用(藍(lán)色)線繪制了鄰接矩陣來(lái)劃分頂點(diǎn)類別,例如,罷工員工中的種族/年齡組(第 12.2 節(jié))、小型網(wǎng)絡(luò)中的導(dǎo)師與學(xué)生以及世界系統(tǒng)位置貿(mào)易網(wǎng)絡(luò)中的國(guó)家位置(第 12.3 節(jié))。至此,我們應(yīng)該注意到,這些線將鄰接矩陣劃分為矩形,這些矩形稱為塊。
- 一個(gè)塊包含屬于一個(gè)或兩個(gè)類的橫截面的鄰接矩陣的單元。
我們可以通過(guò)分析鄰接矩陣的塊來(lái)描述網(wǎng)絡(luò)的結(jié)構(gòu)(在位置內(nèi)和位置之間)。對(duì)角線上的塊表示一個(gè)位置內(nèi)的關(guān)系。在理想的核心-外圍結(jié)構(gòu)中(例如,圖 119),頂點(diǎn)在核心內(nèi)連接(頂點(diǎn) i1 和 i2),而外圍頂點(diǎn)(s1 到 s3)間不直接鏈接。對(duì)角線以外的塊代表類之間的關(guān)系,即核心與外圍之間的關(guān)系。學(xué)生的身份來(lái)自他們對(duì)導(dǎo)師的依賴,而不是來(lái)自他們的內(nèi)在聯(lián)系(實(shí)際上,他們就是基于缺乏內(nèi)在聯(lián)系而被識(shí)別的)
12.4.1 塊模型
包含結(jié)構(gòu)等價(jià)類的網(wǎng)絡(luò)的鄰接矩陣有一個(gè)非常顯著的特征,即如果我們忽略對(duì)角線上的單元,它們的塊要么是完全的要么是空的(空塊)。這源于結(jié)構(gòu)等價(jià)標(biāo)準(zhǔn),即等價(jià)頂點(diǎn)具有相同的行和列。
為了理解這一點(diǎn),假設(shè)圖 119 的學(xué)生之間存在一條聯(lián)系,例如從 s2 到 s1。結(jié)構(gòu)等價(jià)頂點(diǎn)必須彼此具有相同的聯(lián)系,因此 s1 也必須連接到 s2。如果所有學(xué)生都是結(jié)構(gòu)等價(jià)的,則 s3 必須與 s1 和 s2 具有相同的關(guān)系,因此它必須與 s1 和 s2 鏈接?,F(xiàn)在,除了對(duì)角線之外,該塊已完成。這也適用于位置之間的聯(lián)系。
現(xiàn)在我們知道具有結(jié)構(gòu)等價(jià)類的網(wǎng)絡(luò)的鄰接矩陣只包含完全塊和空塊,我們可以通過(guò)將每一類頂點(diǎn)收縮到一個(gè)新頂點(diǎn)(矩陣中的元素)來(lái)簡(jiǎn)化鄰接矩陣并標(biāo)記塊新矩陣中每個(gè)單元格的類型,在結(jié)構(gòu)等價(jià)的情況下,它要么是完全的(com)要么是空的(- 或 null)。這個(gè)壓縮矩陣稱為鏡像矩陣( image matrix),它包含原始鄰接矩陣中存在的所有信息。圖 120 顯示了一個(gè)簡(jiǎn)單的核心-外圍結(jié)構(gòu)的鏡像矩陣和等價(jià)類(位置)內(nèi)部和之間的關(guān)系的圖形表示,其中弧表示完全的塊,而弧的缺失表示空塊。
- 塊模型將網(wǎng)絡(luò)的頂點(diǎn)分配給類,并指定類內(nèi)和類之間允許的關(guān)系類型。
鏡像矩陣是我們定義塊模型所需的最后一個(gè)要素。網(wǎng)絡(luò)的塊模型由partition 和鏡像矩陣組成。partition 將頂點(diǎn)分配給等價(jià)類,并將網(wǎng)絡(luò)的鄰接矩陣劃分為塊。鏡像矩陣指定了類內(nèi)和類之間的關(guān)系類型,因?yàn)樗f(shuō)明了允許哪些類型的塊以及它們可能出現(xiàn)的位置。例如,圖 119 的核心-外圍結(jié)構(gòu)的塊模型由一個(gè)partition 組成,該partition 把導(dǎo)師 i1 和 i2分配到一個(gè)類,把學(xué)生(s1、s2 和 s3)到另一個(gè)類,并指定塊之間關(guān)系的鏡像矩陣,如圖 120 所示。
塊模型描述了網(wǎng)絡(luò)的整體結(jié)構(gòu)以及該結(jié)構(gòu)中每個(gè)頂點(diǎn)的位置。在導(dǎo)師和學(xué)生的示例中,鏡像矩陣顯示了適用于網(wǎng)絡(luò)的等價(jià)類。該網(wǎng)絡(luò)包含結(jié)構(gòu)等價(jià)類,因?yàn)橹挥型耆珘K和空塊。此外,鏡像矩陣揭示了網(wǎng)絡(luò)的核心-外圍結(jié)構(gòu),因?yàn)橥耆珘K排列在一個(gè)水平帶和一個(gè)垂直帶內(nèi)。第 1 類代表核心,它是內(nèi)部鏈接的,第 2 類代表外圍。最后,partition 告訴我們哪些行為人是核心的一部分(兩名導(dǎo)師,他們構(gòu)成類 1),哪些行為人屬于外圍(類 2 的三個(gè)學(xué)生)。塊模型是表征網(wǎng)絡(luò)整體結(jié)構(gòu)和各個(gè)頂點(diǎn)位置的有效設(shè)備。
12.4.2 塊建模
到目前為止,我們假設(shè)我們知道網(wǎng)絡(luò)的塊模型,即頂點(diǎn)劃分為類和指定允許的塊類型的鏡像矩陣。在一個(gè)研究項(xiàng)目中,我們自然而然地反過(guò)來(lái)工作:我們有一個(gè)網(wǎng)絡(luò),我們想找到捕捉網(wǎng)絡(luò)結(jié)構(gòu)的塊模型。
獲得此塊模型的技術(shù)稱為塊建模。一般來(lái)說(shuō),塊建模包括三個(gè)步驟。第一步,我們指定網(wǎng)絡(luò)中類的數(shù)量,例如,如果我們假設(shè)一個(gè)簡(jiǎn)單的核心-外圍結(jié)構(gòu),則為兩個(gè)類或位置。在第二步中,我們選擇允許出現(xiàn)的塊的類型,以及可選的鏡像矩陣中它們可能出現(xiàn)的位置。例如,在結(jié)構(gòu)等價(jià)的情況下,我們只允許出現(xiàn)完全塊和空塊,并且我們期望沿對(duì)角線出現(xiàn)一個(gè)完整塊(核心)和一個(gè)空塊(外圍)。最后,計(jì)算機(jī)根據(jù)模型指定的條件將頂點(diǎn)劃分為指定數(shù)量的類,并在必要時(shí)為模型選擇最終的鏡像矩陣。在第三步中,塊模型完成。
前兩步定義了鏡像矩陣:我們固定了類的數(shù)量和塊(關(guān)系)的類型,但我們還不知道哪些頂點(diǎn)屬于某個(gè)特定的類,有時(shí)我們不確切知道會(huì)找到哪種塊類型在鏡像矩陣的哪一部分。這是在第三步中解決的。不用說(shuō),我們必須對(duì)網(wǎng)絡(luò)有一些了解或期望,才能選擇適當(dāng)數(shù)量的類并指定有意義的類之間的關(guān)系類型。在導(dǎo)師和學(xué)生之間的聯(lián)系的示例中,我們應(yīng)該有理由或線索來(lái)期待一個(gè)核心-外圍結(jié)構(gòu)和結(jié)構(gòu)等價(jià)。
然而,經(jīng)驗(yàn)網(wǎng)絡(luò)很少與鏡像矩陣所代表的構(gòu)想相匹配。會(huì)出現(xiàn)錯(cuò)誤,但可以輕松檢查它們。假設(shè)你知道每個(gè)類有哪些頂點(diǎn),那么你可以根據(jù)鏡像矩陣檢查鄰接矩陣的每個(gè)塊是否屬于正確的類型。事實(shí)上,您將理想矩陣(圖 119)與實(shí)際矩陣(圖 114)進(jìn)行比較。在結(jié)構(gòu)等價(jià)的情況下,計(jì)算應(yīng)該為完全塊中缺少的行(在本例中沒(méi)有),并計(jì)算應(yīng)該為空塊中出現(xiàn)的行數(shù)(一個(gè)錯(cuò)誤:弧從學(xué)生 s1 到學(xué)生 s2,請(qǐng)參見(jiàn)圖 121)以獲得一個(gè)誤差值,該分?jǐn)?shù)表明理想矩陣與真實(shí)網(wǎng)絡(luò)的擬合程度。
在這種方法中,塊建模的第三步歸結(jié)為找到將頂點(diǎn)劃分為產(chǎn)生最低誤差值的等價(jià)類,即最適合理想矩陣。首先,計(jì)算機(jī)將頂點(diǎn)隨機(jī)分配給指定數(shù)量的類。然后,它通過(guò)將實(shí)際矩陣與由鏡像矩陣表示的理想矩陣進(jìn)行比較來(lái)計(jì)算該解決方案的誤差值。接下來(lái),它嘗試通過(guò)將隨機(jī)選擇的頂點(diǎn)從一個(gè)群組移動(dòng)到另一個(gè)群組或通過(guò)交換不同群組中的兩個(gè)頂點(diǎn)來(lái)降低誤差值。它繼續(xù)這個(gè)過(guò)程,直到它不能再提高誤差值。
這種塊建模的優(yōu)化方法具有所有優(yōu)化技術(shù)(例如,Doreian-Mrvar 方法)的優(yōu)點(diǎn)和缺點(diǎn),即如果重復(fù)應(yīng)用,它很可能找到最優(yōu)解,但大多數(shù)時(shí)候你不能確定是否存在更好的解決方案。此外,您必須意識(shí)到,其他數(shù)量的類或其他允許的塊類型可能會(huì)產(chǎn)生更適合的塊模型。通常,值得將幾個(gè)稍微不同的塊模型應(yīng)用于數(shù)據(jù)集,即對(duì)塊內(nèi)或塊之間的關(guān)系具有其他數(shù)量的類或其他約束。這強(qiáng)調(diào)了研究人員對(duì)假設(shè)的鏡像矩陣進(jìn)行仔細(xì)考慮的重要性。此外,樹(shù)在探索性塊建模中很麻煩,因?yàn)樗鼈儼芏囗旤c(diǎn)在類之間交換而不會(huì)對(duì)誤差值產(chǎn)生太大影響,因此僅將塊建模應(yīng)用于相當(dāng)密集的(部分)網(wǎng)絡(luò)。
在這種優(yōu)化技術(shù)中,可以對(duì)誤差進(jìn)行加權(quán)并且可以使用邊值。我們?cè)谶@里不做詳細(xì)介紹,但應(yīng)該注意的是,誤差值越低表示擬合越好,誤差值為 0 始終代表完美擬合。
應(yīng)用
如前所述,塊建模包括三個(gè)步驟。在前兩個(gè)步驟中,指定了鏡像矩陣:類的數(shù)量以及允許的類內(nèi)和類之間的塊或關(guān)系的類型。然后,計(jì)算機(jī)通過(guò)搜索將頂點(diǎn)劃分為與假設(shè)的鏡像矩陣最匹配的類來(lái)完成塊模型。如果可能有多個(gè)鏡像矩陣,它會(huì)選擇最適合的一個(gè)。誤差值顯示所選鏡像矩陣與網(wǎng)絡(luò)的匹配程度。
Pajek 的塊建模命令反映了這三個(gè)步驟。然而,在我們討論這些命令之前,我們必須警告您,該方法與所有優(yōu)化技術(shù)一樣,是耗時(shí)的,因此不應(yīng)將其應(yīng)用于具有超過(guò)數(shù)百個(gè)頂點(diǎn)的網(wǎng)絡(luò),在這種情況下,計(jì)算機(jī)可能需要一個(gè)全天執(zhí)行命令。因此,該命令在菜單中用星號(hào)標(biāo)記。
Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters
在 Pajek 中,有兩種塊建模方法:一種從頭開(kāi)始搜索最佳擬合partition (隨機(jī)開(kāi)始),而另一種只嘗試改進(jìn)現(xiàn)有partition (優(yōu)化partition)。讓我們從后一種方法開(kāi)始,將其應(yīng)用到以 1980 年的世界系統(tǒng)位置為起始partition 的世界貿(mào)易網(wǎng)絡(luò)中。這兩個(gè)文件都在 Pajek 項(xiàng)目文件 world_trade.paj 中可用。從網(wǎng)絡(luò)中刪除 1980 年世界系統(tǒng)位置未知的國(guó)家(Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters classes 1-4,參見(jiàn)第 12.3 節(jié))。因此,我們選擇了 80 個(gè)國(guó)家中的 52 個(gè)(生成新network文件)。該命令還創(chuàng)建了一個(gè)新的partition ,都包含其余 52 個(gè)國(guó)家的世界系統(tǒng)位置。
Network> Create Partition> Blockmodeling? > Restricted Options Network> Create Partition> Blockmodeling? > Short Report Network> Create Partition> Blockmodeling? > Optimize Partition
我們?cè)谶@里只解釋塊建模的基本選項(xiàng)。因此,勾選 Network> Create Partition> Blockmodeling> Restricted Options 和 Network> Create Partition> Blockmodeling* > Short Report 以獲得與本章中重現(xiàn)的相同的對(duì)話框屏幕。
當(dāng)您對(duì)塊建模更加熟悉時(shí),您可以稍后取消選中這些選項(xiàng)。當(dāng)您從 Network> Create Partition> Blockmodeling? 子菜單中選擇 Optimize Partition 命令時(shí),活動(dòng)partition 指定您正在尋找的等價(jià)類的數(shù)量,這是塊建模的第一步。選擇命令后,將打開(kāi)一個(gè)對(duì)話框(圖 122)。選擇框顯示最后選擇的等價(jià)類型。我們是結(jié)構(gòu)等價(jià),因此如果列表框尚未顯示“結(jié)構(gòu)等價(jià)”,請(qǐng)選擇這種類型的等價(jià)。不更改任何其他選項(xiàng);只需按下 RUN – Standard 按鈕即可執(zhí)行命令。我們不會(huì)在這里討論第二種可能性(RUN – Fast)。
Pajek 列出了 Report 屏幕中的初始設(shè)置,以及初始鏡像矩陣、初始誤差矩陣和初始partition 的誤差值。
最終結(jié)果:
在我們的示例中,報(bào)告了 366 個(gè)初始錯(cuò)誤:在(52 × 51 = 2652)中的 366 個(gè)單元格中,導(dǎo)入在它們應(yīng)該存在的地方不存在,反之亦然。默認(rèn)情況下,Pajek 不考慮行值,因此這里不關(guān)注導(dǎo)入的值。接下來(lái),Pajek 嘗試改進(jìn)partition 并創(chuàng)建它找到的最佳擬合partition ,并報(bào)告最終鏡像矩陣、最終誤差矩陣和相關(guān)的誤差值(參見(jiàn)圖 123)。最佳partition 比 1980 年的世界系統(tǒng)位置更適合一點(diǎn),因?yàn)檎`差值已經(jīng)從 366 降低到 339。但是,我們不確定相對(duì)這樣規(guī)模的網(wǎng)絡(luò)、這是一個(gè)小的還是大的誤差值,也許其他數(shù)量的類或其他允許的塊類型會(huì)產(chǎn)生更好的解決方案。
請(qǐng)注意,最終的鏡像矩陣具有非常清晰的結(jié)構(gòu):第一行的單元格都是完全的,而其他所有單元格都是空的。這意味著每個(gè)核心國(guó)家(第 1 類)都向所有其他國(guó)家出口各種金??屬制品,但在塊模型中沒(méi)有其他國(guó)家出口這些產(chǎn)品:它們的行僅包含空(NULL)單元格。誤差值表明其中一些國(guó)家確實(shí)出口了各種金屬制品,但塊模型假設(shè)它們不是。
最佳擬合partition 等于最初的世界系統(tǒng)partition ,除了一個(gè)國(guó)家從核心轉(zhuǎn)移到強(qiáng)外圍。您可以通過(guò)在 Partitions 菜單中分別選擇初始partition 和新partition 作為第一個(gè)和第二個(gè)partition ,并執(zhí)行 Partitions> Info> Cramer’s V, Rajski, Adjusted Rand Index 命令來(lái)檢查這一點(diǎn)。表 24 顯示了原始(列,Partitions下拉菜單中第二個(gè)文件默認(rèn)為列)和優(yōu)化partition (行,Partitions下拉菜單中第二個(gè)文件默認(rèn)為行)的交叉表。幾乎所有國(guó)家都在對(duì)角邊上,表明它們?nèi)蕴幱谠瓉?lái)的類別中。只有第一列中一個(gè)國(guó)家從第一行(核心)移動(dòng)到第二行(強(qiáng)半外圍)。
Network> Create Partition> Blockmodeling* > Random Start
第二種方法在不考慮程序用戶提供的初始partition 的情況下搜索最佳擬合partition 。因此,隨機(jī)啟動(dòng)命令不需要初始partition 。該命令顯示的對(duì)話框提供了指定類數(shù)(第 1 步)、等價(jià)或塊模型類型(第 2 步)和重復(fù)次數(shù)的可能性(參見(jiàn)圖 124)。每次重復(fù)都使用一個(gè)新的隨機(jī)partition 作為起點(diǎn),以避免陷入局部最優(yōu)。通過(guò)單擊按鈕并輸入所需的數(shù)字來(lái)更改這些選擇;例如,將群組(Cluster)數(shù)更改為 4(核心、強(qiáng)半外圍、弱半外圍和外圍)和重復(fù)次數(shù)100.
應(yīng)用于世界貿(mào)易網(wǎng)絡(luò)中的五十二個(gè)分類國(guó)家,尋找四個(gè)聚類和結(jié)構(gòu)等價(jià),隨機(jī)開(kāi)始命令找到一個(gè)有 281 個(gè)錯(cuò)誤的partition 。與 1980 年世界系統(tǒng)位置為等價(jià)類的解決方案相比,這是一個(gè)相當(dāng)大的改進(jìn)?,F(xiàn)在,該過(guò)程并未確定最適合初始partition 的鏡像矩陣(圖 123),但它找到了另一個(gè)鏡像矩陣(表 25;請(qǐng)注意,您可能會(huì)得到該鏡像矩陣的排列),其中 1 類國(guó)家出口向除第 3 類國(guó)家以外的所有其他國(guó)家制造的金屬五金制品,而第 2 類國(guó)家則向所有其他國(guó)家出口。第 3 類和第 4 類國(guó)家只是進(jìn)口而不是出口各種金??屬制品。
12.4.3 正則等價(jià)
結(jié)構(gòu)等價(jià)要求等價(jià)的參與者有相同的鄰居。在社會(huì)網(wǎng)絡(luò)分析的幾個(gè)應(yīng)用中,這個(gè)標(biāo)準(zhǔn)太嚴(yán)格了,因?yàn)樗航M行為人在不同的地方扮演不同的角色,例如,不同大學(xué)的老師有不同的學(xué)生,因此他們與相似的人有聯(lián)系,但不是與同一個(gè)人聯(lián)系。
對(duì)于這些情況,定義了另一種等價(jià)類型:正則等價(jià)。正則等價(jià)的頂點(diǎn)不必連接到相同的頂點(diǎn),但它們必須連接到相同類中的頂點(diǎn)。這聽(tīng)起來(lái)像是一個(gè)循環(huán)論證,但事實(shí)并非如此。例如,在學(xué)生會(huì)討論網(wǎng)絡(luò)(第 10 章)中,所有顧問(wèn)都應(yīng)該選擇部長(zhǎng)來(lái)討論學(xué)生政治,因?yàn)樗麄儜?yīng)該為部長(zhǎng)提供建議。但是,他們不必為相同的部長(zhǎng)提供建議,也不必為所有部長(zhǎng)提供建議(例如,顧問(wèn) 2 選擇部長(zhǎng) 1 到部長(zhǎng) 4,但顧問(wèn) 3 選擇部長(zhǎng) 5 和部長(zhǎng) 7)(圖 125)。相反,每位部長(zhǎng)都應(yīng)該使用至少一名顧問(wèn)的服務(wù),但他或她沒(méi)有義務(wù)聽(tīng)取所有顧問(wèn)的建議。這也適用于班級(jí)內(nèi)的關(guān)系:如果一位部長(zhǎng)選擇另一位部長(zhǎng),則每位部長(zhǎng)必須選擇一位同級(jí),并且必須由一位同級(jí)選擇。然而,一個(gè)對(duì)等點(diǎn)就足夠了:它們不必與所有對(duì)等點(diǎn)相關(guān),因此它們的塊不一定是完全的。
我們可以通過(guò)塊建模來(lái)檢測(cè)正則等價(jià),因?yàn)橛幸环N特殊的塊類型與正則等價(jià)相關(guān)聯(lián),稱為正則塊。一個(gè)正則塊在每一行(每個(gè)人至少選擇一個(gè)行為人)和每一列(每個(gè)人至少被選擇一次)中包含至少一個(gè)弧。正則等價(jià)允許正則塊和空塊。請(qǐng)注意,完全塊始終是正則塊,所以,結(jié)構(gòu)等價(jià)是一種特殊的正則等價(jià),或者換句話說(shuō),正則等價(jià)比結(jié)構(gòu)等價(jià)更普遍。
- 一個(gè)正則塊在每一行和每一列中至少包含一個(gè)弧。
在具有三個(gè)班級(jí)(每個(gè)正式位置一個(gè)班級(jí)——見(jiàn)圖 125)的學(xué)生會(huì)網(wǎng)絡(luò)中,有兩個(gè)塊是正則的:部長(zhǎng)與顧問(wèn)之間的選擇和部長(zhǎng)之間的選擇。如果部長(zhǎng) 3 和部長(zhǎng) 6 也選擇了主席,那么包含從部長(zhǎng)到主席的選擇的塊將是完全的(因此是常規(guī)的)。兩個(gè)缺失的選項(xiàng)在圖 125 中用黑色十字表示;他們?yōu)樵摼W(wǎng)絡(luò)的正則等價(jià)模型的誤差值貢獻(xiàn)了兩個(gè)單位。
在圖 125 中,有兩個(gè)塊是空的:從顧問(wèn)到主席的選擇,反之亦然。這兩個(gè)階層之間的社會(huì)距離似乎太大,無(wú)法通過(guò)直接協(xié)商來(lái)跨越。其余三個(gè)塊既不是空也不是正則,因此它們至少包含一個(gè)違反正則等價(jià)模型的行為。如果我們假設(shè)這些塊是空的,那么誤差的值是最小的,所以這些塊中的所有六個(gè)選擇都是誤差(白色十字),我們假設(shè)理想矩陣在這里包含空塊。在我們的鏡像矩陣中,我們只是指定所有塊都應(yīng)該是空的或正則的。在評(píng)估誤差值時(shí),我們發(fā)現(xiàn)在這里期望空塊的錯(cuò)誤最小。因此,我們將這些塊的類型固定為空塊。
圖 126 顯示了鏡像矩陣和每個(gè)塊中的誤差數(shù)(誤差矩陣),它總結(jié)了結(jié)果。第 1 類包含主席,第 2 類包含部長(zhǎng),而顧問(wèn)被分組在第 3 類中。
學(xué)生會(huì)討論網(wǎng)絡(luò)是一個(gè)包含特定區(qū)塊類型位置的等級(jí)結(jié)構(gòu)的示例。在等級(jí)結(jié)構(gòu)中,行為人應(yīng)該向上選擇。如果等級(jí)是這樣排序的,最高排名在第一行(和列),最低排名在最后一行(和列),我們應(yīng)該不會(huì)遇到矩陣對(duì)角線上方的塊的選擇,因?yàn)樗鼈儠?huì)從較高等級(jí)(行)指向較低等級(jí)(列)。實(shí)際上,我們僅在學(xué)生會(huì)網(wǎng)絡(luò)的鏡像矩陣中的對(duì)角邊上方發(fā)現(xiàn)空(null)塊,這是等級(jí)結(jié)構(gòu)的一般屬性。
除了使用特定類型的等價(jià)來(lái)定義允許的塊類型,我們可以使用允許的塊類型的任何組合來(lái)通過(guò)指定每個(gè)單獨(dú)塊允許的類型來(lái)表征網(wǎng)絡(luò),例如,一個(gè)部長(zhǎng)到主席的完全塊,部長(zhǎng)自己的正則塊,以及部長(zhǎng)到顧問(wèn)塊的空塊。這稱為廣義塊建模。請(qǐng)注意,塊類型比這里介紹的三種類型要多。已知某些塊類型模式包含網(wǎng)絡(luò)類別,即核心-外圍模型和等級(jí)模型。這些類具有特定的實(shí)質(zhì)性含義,因此很容易解釋它們。在不久的將來(lái),經(jīng)驗(yàn)社會(huì)網(wǎng)絡(luò)的進(jìn)一步應(yīng)用可能會(huì)揭示更多類別的塊模型。
在探索性社會(huì)網(wǎng)絡(luò)分析中,我們主要對(duì)檢測(cè)適合特定網(wǎng)絡(luò)的塊模型感興趣。塊模型告訴我們網(wǎng)絡(luò)的一般結(jié)構(gòu),我們找到的等價(jià)類可以用作進(jìn)一步統(tǒng)計(jì)分析中的變量。我們應(yīng)該在這里發(fā)出警告。即使在不應(yīng)該包含正則模式的隨機(jī)網(wǎng)絡(luò)上,我們也總能找到最合適的塊模型。因此,我們應(yīng)該將自己限制在理論或先前結(jié)果支持的塊模型上。我們應(yīng)該從關(guān)于網(wǎng)絡(luò)中塊的數(shù)量和類型的動(dòng)機(jī)假設(shè)開(kāi)始。與探索性網(wǎng)絡(luò)分析的其他情況一樣,我們應(yīng)該嘗試驗(yàn)證結(jié)果,例如通過(guò)將等價(jià)類鏈接到外部數(shù)據(jù),例如參與者屬性。如果參與者的等價(jià)類具有不同的屬性、任務(wù)或態(tài)度,這證實(shí)了塊模型識(shí)別社會(huì)角色或角色集的解釋。
應(yīng)用
在 Pajek 中,滿足正則等價(jià)的塊模型同樣滿足結(jié)構(gòu)等價(jià)塊模型(參見(jiàn)上一節(jié)):只需在equivalence type下菜單將等價(jià)類型中的結(jié)構(gòu)等價(jià)替換為正則等價(jià)(參見(jiàn)圖 122 和 124)。如果我們將 Random Start 塊建模過(guò)程應(yīng)用于學(xué)生會(huì)討論網(wǎng)絡(luò)(可在 Pajek 項(xiàng)目文件 student_government.paj 中獲得),我們會(huì)找到 8 個(gè)具有 7 個(gè)誤差的解決方案(在具有三個(gè)類和數(shù)百次重復(fù)的正則等價(jià)條件下)。與前面討論的將正式角色作為等價(jià)類的解決方案相比,這是一個(gè)最小的改進(jìn),并且它的缺點(diǎn)是必須在七個(gè)替代解決方案中做出選擇。沒(méi)有一個(gè)方案匹配正式角色,但鏡像矩陣類似于圖 126 中的鏡像矩陣或其排列之一。
請(qǐng)注意,其他數(shù)量的類和另一種類型的等價(jià)可能會(huì)產(chǎn)生更好的解決方案,例如,我們?cè)诰哂袃蓚€(gè)類的正則等價(jià)解決方案中發(fā)現(xiàn)了四個(gè)誤差,但解釋很困難:在一個(gè)解決方案中,advisor2 與網(wǎng)絡(luò)的其余部分分離,這似乎是一個(gè)微不足道的解決方案;在另一個(gè)解決方案中,advisor1 和 advisor2 加入了 Minister4。因此,我們更傾向于根據(jù)學(xué)生會(huì)中的正式角色進(jìn)行原始分類。
在塊建模中,Structural Equivalence 選項(xiàng)告訴 Pajek 每個(gè)塊必須是完全的(com)或空的(null)。在正則等價(jià)中,每個(gè)塊必須是完全的、空的或正則的。用戶無(wú)法控制鏡像矩陣中完全塊、空塊和規(guī)則塊的位置。相比之下,廣義塊建模提供了指定(和固定)鏡像矩陣中每個(gè)塊的等價(jià)類型的可能性。例如,我們可能想要測(cè)試一個(gè)正則等價(jià)塊模型是否與學(xué)生會(huì)討論網(wǎng)絡(luò)匹配三個(gè)類,其中每個(gè)類都向更高的征求意見(jiàn)(如果有的話),并且除了最低類之外的所有類都向他們自己類的成員建議。
所需的鏡像矩陣如圖 127 所示;如果在選擇框中選擇了用戶定義選項(xiàng),它會(huì)顯示在“另存為 MDL 文件”按鈕下方。如果單擊該矩陣的其中一個(gè)單元格(塊),則會(huì)打開(kāi)一個(gè)列表,其中顯示了 13 種等價(jià)項(xiàng)。在此列表中,您可以選擇一個(gè)或多個(gè)(按 Alt 鍵添加另一個(gè))類型的、您為所選單元格規(guī)定的等價(jià)性。在示例中,五個(gè)單元格被強(qiáng)制為正則等價(jià),其余四個(gè)單元格必須為空。此外,如果您認(rèn)為一個(gè)單元格中的誤差比另一個(gè)單元格中的誤差更重要或更不重要,您可以提高或降低所選單元格中的誤差的約束。只需點(diǎn)擊“Penalty”后的數(shù)字并輸入一個(gè)新數(shù)字。
在圖 127 的右上角,您可以看到可以向塊模型添加額外的約束。約束涉及關(guān)于頂點(diǎn)或頂點(diǎn)對(duì)的先驗(yàn)知識(shí),您可以將其分配給特定塊或禁止包含在特定塊中,以及對(duì)塊(群組)的最小和最大大小的約束。要添加約束,請(qǐng)?jiān)诳捎眉s束下拉菜單中雙擊它。您必須為覆蓋約束提供參數(shù)和數(shù)值,之后約束將添加到 In Model Constraints 下拉菜單中。有關(guān)詳細(xì)信息,請(qǐng)參閱進(jìn)一步閱讀部分中有關(guān)廣義塊建模的參考。
當(dāng)您定義了自己的塊模型后,您可以保存它以備將來(lái)使用。按“另存為 MDL 文件”按鈕并輸入必須存儲(chǔ)模型的文件的名稱。默認(rèn)情況下,Pajek 為這些文件提供擴(kuò)展名 .mdl(模型),我們強(qiáng)烈建議使用此文件擴(kuò)展名。在另一個(gè)塊建模會(huì)話中,您可以通過(guò)在選擇框中選擇 Load MDL File 選項(xiàng)來(lái)打開(kāi)此文件。加載模型后,您可以通過(guò)再次選擇“用戶定義”選項(xiàng)來(lái)檢查它。最后,您可以運(yùn)行塊建模命令。
您可以嘗試適應(yīng)網(wǎng)絡(luò)的塊模型的數(shù)量是巨大的,尤其是當(dāng)您設(shè)計(jì)自己的通用塊模型時(shí)。因此,我們建議采用以下探索性塊建模策略:(1)使用其他分析和理論考慮的結(jié)果來(lái)組裝鏡像矩陣; (2)先嘗試更嚴(yán)格的塊模型和塊類型(結(jié)構(gòu)等價(jià)比正則等價(jià)更嚴(yán)格); (3) 先嘗試較少數(shù)量的類。選擇誤差值最低的塊模型,但如果誤差值稍高的模型產(chǎn)生易于解釋的單一解決方案,您應(yīng)該更喜歡后者。
12.5 小結(jié)
本章再次回顧了本書(shū)前面部分介紹的網(wǎng)絡(luò)家庭:內(nèi)聚子網(wǎng)、核心-外圍結(jié)構(gòu)(經(jīng)紀(jì))和等級(jí)制度。我們提出了一種能夠檢測(cè)這些結(jié)構(gòu)中的每一個(gè)的技術(shù),即塊建模。
在塊建模的情況下,我們需要一個(gè)新的網(wǎng)絡(luò)表示:矩陣。網(wǎng)絡(luò)的鄰接矩陣包含它的結(jié)構(gòu);每個(gè)頂點(diǎn)由一行和一列表示,弧位于矩陣的單元格中:第一行和第一列屬于第一個(gè)頂點(diǎn),第二行和列屬于第二個(gè)頂點(diǎn),依此類推。當(dāng)以正確的方式排序時(shí),鄰接矩陣提供了網(wǎng)絡(luò)結(jié)構(gòu)的視覺(jué)線索。這種排序稱為網(wǎng)絡(luò)排列,實(shí)際上是對(duì)頂點(diǎn)的重新編號(hào)。
塊建模不是一種容易理解的技術(shù)?;旧?#xff0c;該技術(shù)將社會(huì)網(wǎng)絡(luò)與具有特定結(jié)構(gòu)特征的理想社會(huì)網(wǎng)絡(luò)(即模型)進(jìn)行比較。研究人員必須提供模型,計(jì)算機(jī)檢查該模型與實(shí)際數(shù)據(jù)的擬合程度。
該模型稱為塊模型,包含兩部分:partition 和鏡像矩陣。partition 將網(wǎng)絡(luò)的頂點(diǎn)分配給類,這些類也稱為等價(jià)類或位置。在網(wǎng)絡(luò)的鄰接矩陣中,類劃分塊:單元組成的矩形。沿鄰接矩陣對(duì)角線的塊包含類內(nèi)的聯(lián)系,而非對(duì)角線的塊表示類之間的關(guān)系。
在作為塊模型的第二部分的鏡像矩陣中,每個(gè)單元代表鄰接矩陣的一個(gè)塊。它是鄰接矩陣的壓縮和簡(jiǎn)化模型。如果一個(gè)類中的頂點(diǎn)在結(jié)構(gòu)上相似——我們說(shuō)是等價(jià)的——鄰接矩陣中的塊具有特定的特征:它們是空的、完全的正規(guī)則的,這意味著在一個(gè)類中的每個(gè)頂點(diǎn)之間至少有一個(gè)聯(lián)系。存在更多類型的塊,但我們不在這里展示它們。
鏡像矩陣顯示了允許的塊類型,以及可能的預(yù)期位置。此外,鏡像矩陣中非空塊的分布揭示了網(wǎng)絡(luò)的整體結(jié)構(gòu)。如果網(wǎng)絡(luò)包含內(nèi)聚子組,則沿鏡像矩陣的對(duì)角線找到非空塊。如果網(wǎng)絡(luò)以核心-外圍結(jié)構(gòu)為主,我們會(huì)在鏡像矩陣的一個(gè)水平和一個(gè)垂直條帶中找到所有非空塊。最后,如果有一個(gè)等級(jí)群組系統(tǒng),并且頂點(diǎn)根據(jù)它們的等級(jí)排序,我們?cè)阽R像矩陣的下半部分或上半部分找到非空塊。
在探索性塊建模中,我們搜索最適合社會(huì)網(wǎng)絡(luò)的partition 和鏡像矩陣。經(jīng)驗(yàn)社會(huì)網(wǎng)絡(luò)很少與塊模型完美匹配:應(yīng)該存在的弧不存在,或者應(yīng)該存在一些不存在的弧。誤差的數(shù)值表達(dá)了一個(gè)塊模型擬合網(wǎng)絡(luò)的狀況。此誤差值用于評(píng)估同一網(wǎng)絡(luò)的不同塊模型。
塊建模是一種用于分析相當(dāng)密集的網(wǎng)絡(luò)的強(qiáng)大技術(shù),但它需要研究人員的正確輸入才能產(chǎn)生有趣的結(jié)果??赡苓m合社會(huì)網(wǎng)絡(luò)的塊模型的數(shù)量很大,因此在對(duì)網(wǎng)絡(luò)的整體結(jié)構(gòu)沒(méi)有明確概念和期望的情況下著手進(jìn)行塊建模是不明智的。研究人員需要一個(gè)關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)的知情假設(shè)塊建模的卓有成效的應(yīng)用。從這個(gè)意義上說(shuō),塊建模用于假設(shè)檢驗(yàn),而不是探索。
總結(jié)
以上是生活随笔為你收集整理的Exploratory Social Network Analysis with Pajek(第三版)12的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【Linux】/lib64/libstd
- 下一篇: teamviewer早期版本11-14