日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

CS224W-图神经网络 笔记5.3:Spectral Clustering - 谱图聚类的具体操作步骤

發(fā)布時(shí)間:2024/1/8 编程问答 40 豆豆
生活随笔 收集整理的這篇文章主要介紹了 CS224W-图神经网络 笔记5.3:Spectral Clustering - 谱图聚类的具体操作步骤 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

CS224W-圖神經(jīng)網(wǎng)絡(luò) 筆記5.3:Spectral Clustering - 譜圖聚類的具體操作步驟

本文總結(jié)之日CS224W Winter 2021只更新到了第四節(jié),所以下文會(huì)參考2021年課程的PPT并結(jié)合2019年秋季課程進(jìn)行總結(jié)以求內(nèi)容完整

課程主頁(yè):CS224W: Machine Learning with Graphs

視頻鏈接:【斯坦?!緾S224W:圖機(jī)器學(xué)習(xí)( 中英字幕 | 2019秋)

文章目錄

  • CS224W-圖神經(jīng)網(wǎng)絡(luò) 筆記5.3:Spectral Clustering - 譜圖聚類的具體操作步驟
    • 引言
    • 1 譜聚類流程
      • 1.1 譜聚類步驟
      • 1.2 如何實(shí)現(xiàn) K 分類呢?
      • 1.3 如何選擇社區(qū)的數(shù)量 K?
        • 1.3.1 特征間距
    • 2 基于motif 的圖劃分
      • 2.1 Motif Conductance
      • 2.2 Motif Spectral Clustering
      • 2.3 基于motif的譜聚類案例
    • 參考文章

引言

通過(guò)前一篇文章介紹,我們知道如何評(píng)價(jià)圖劃分的好壞;和為什么能根據(jù)圖拉普拉斯矩陣的第二小特征值對(duì)應(yīng)的特征向量對(duì)圖進(jìn)行近似分割。前面算是理論部分,下面進(jìn)入實(shí)踐部分。

1 譜聚類流程

1.1 譜聚類步驟

譜聚類過(guò)程分為三個(gè)步驟。

第三步劃分組,對(duì)倒數(shù)第二小特征向量進(jìn)行升序排列后,如何確定分割的點(diǎn)呢?

  • 基礎(chǔ)操作

    • 取 0點(diǎn) 作為分割點(diǎn),(正負(fù)號(hào))
    • 取 中位數(shù)作為分割點(diǎn)
  • 其他 (相對(duì)復(fù)雜方法)

    • 逐步計(jì)算,選擇使得Normalied cut 最小的分割點(diǎn)。(Sweep procedure)

1.2 如何實(shí)現(xiàn) K 分類呢?

上面介紹的都是二分的情況,如何推廣到多(K)分的情況呢?

具體,有2個(gè)基本的方法:

  • 以分層劃分的方式遞歸地調(diào)用二分類算法

    • 缺點(diǎn)是效率低,不穩(wěn)定(每一次都是近似,誤差會(huì)放大)。
  • 采用多個(gè)特征向量的譜聚類

    • 按照 λ \lambda λ的值(排除最小的 λ)從小到大依次取 m 個(gè)特征向量,將節(jié)點(diǎn)嵌入到低維空間中,每個(gè)節(jié)點(diǎn)通過(guò) m 維數(shù)據(jù)表示,之后通過(guò) K-means 算法進(jìn)行聚類。通常也不需要取很大的值。多個(gè)特征向量,減少信息丟失,并已被證明能夠近似地逼近最優(yōu)劃分。

    1.3 如何選擇社區(qū)的數(shù)量 K?

    1.3.1 特征間距

    可將特征值從大到小排序后,兩個(gè)連續(xù)的特征值之間的差被稱為特征間距(Eigengap)。

    通常來(lái)說(shuō),通過(guò)選取最大化特征差距的 K 大概率能獲得穩(wěn)定的劃分結(jié)果。如下圖對(duì)應(yīng)的K=2是特征間距最大。

    2 基于motif 的圖劃分

    第三節(jié)中有介紹到motif,將圖拆解為一個(gè)個(gè)子圖來(lái)重新看待網(wǎng)絡(luò),motif給了網(wǎng)絡(luò)一個(gè)新的定義方式,可以考慮從motif的角度(而不是上述邊的角度)出發(fā)來(lái)進(jìn)行譜圖聚類。

    具體操作過(guò)程與基于邊分割類似,不同的是需要對(duì)于劃分標(biāo)準(zhǔn),拉普拉斯矩陣進(jìn)行轉(zhuǎn)換。

    2.1 Motif Conductance

    對(duì)于最優(yōu)劃分標(biāo)準(zhǔn)類比edge cut和conductance,針對(duì)motif思想也是同樣,就是要組內(nèi)motif盡可能多,組間motif盡可能少。具體對(duì)比定義如下

    所以問(wèn)題就變成了,給定motif M和圖G,如何劃分節(jié)點(diǎn),使motif conductance最小。但找到最小motif conductance也為np問(wèn)題,也需要采用算法近似估算

    2.2 Motif Spectral Clustering

    類比一般譜圖聚類,基于motif的譜聚類也分為三步:

    1. 數(shù)據(jù)預(yù)處理:基于motif對(duì)圖邊權(quán)重進(jìn)行重新定義,每個(gè)邊權(quán)重為出現(xiàn)過(guò)的motif次數(shù).得到權(quán)重矩陣和拉普拉斯矩陣。

    2. 分解:類似于標(biāo)準(zhǔn)的譜圖聚類方法,計(jì)算拉普拉斯矩陣和對(duì)應(yīng)的特征值特征向量

    3. 分組:利用Sweep procedure方法,對(duì)第二小的特征值對(duì)應(yīng)的特征向量x的元素從小到達(dá)排列,計(jì)算每一種劃分下的motif conductance,選擇使motif conductance最小的劃分。

    如下圖左下角所示,當(dāng)r=5時(shí),motif conductance最小。

    此外,最小 motif conductance 也可以根據(jù)cheeger 不等式。

    基于motif 的譜聚類算法的價(jià)值:

    • 它提供了從更高維度去觀察網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的新角度。
    • 算法簡(jiǎn)單、快速和靈活,便于應(yīng)用。

    2.3 基于motif的譜聚類案例

    課上老師給了一個(gè)食物鏈網(wǎng)絡(luò)中基于motif的譜圖聚類結(jié)果??梢钥闯?#xff0c;基于motif的聚類在每一類結(jié)果中捕捉了特定的motif的結(jié)構(gòu),在每一類內(nèi)部有較多的給定motif,而類與類之間這種motif較少。

    參考文章

  • https://blog.csdn.net/klcola/article/details/104800804
  • 圖網(wǎng)絡(luò)機(jī)器學(xué)習(xí) | 社區(qū)發(fā)現(xiàn) — 譜聚類算法
  • 斯坦福CS224W 圖與機(jī)器學(xué)習(xí)5】Spectral Clustering
  • 譜聚類方法推導(dǎo)和對(duì)拉普拉斯矩陣的理解
  • https://linalg.apachecn.org/#/docs/chapter21
  • https://www.cnblogs.com/xingshansi/p/6702188.html?utm_source=itdadao&utm_medium=referral
  • http://www.cs.yale.edu/homes/spielman/sgta/SpectTut.pdf
  • http://www.math.ucsd.edu/~fan/wp/cheeger.pdf
  • 總結(jié)

    以上是生活随笔為你收集整理的CS224W-图神经网络 笔记5.3:Spectral Clustering - 谱图聚类的具体操作步骤的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。