日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计IV Lipschitz组合11 社区发现 Spectral Clustering容许的最大随机噪声

發(fā)布時(shí)間:2025/4/14 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计IV Lipschitz组合11 社区发现 Spectral Clustering容许的最大随机噪声 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

UA MATH567 高維統(tǒng)計(jì)IV Lipschitz組合11 社區(qū)發(fā)現(xiàn) Spectral Clustering容許的最大隨機(jī)噪聲

    • 社區(qū)發(fā)現(xiàn)的Spectral Clustering算法復(fù)習(xí)
    • 用矩陣Bernstein不等式推導(dǎo)Spectral Clustering的理論性質(zhì)

社區(qū)發(fā)現(xiàn)的Spectral Clustering算法復(fù)習(xí)

我們?cè)谏弦徊糠纸榻B隨機(jī)矩陣的時(shí)候介紹了stochastic blocking model以及community detection的spectral clustering算法。

假設(shè)這個(gè)網(wǎng)絡(luò)有nnn個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)中有兩個(gè)社區(qū),它們的規(guī)模相當(dāng),各擁有n/2n/2n/2個(gè)節(jié)點(diǎn),記這兩個(gè)社區(qū)為C1,C2C_1,C_2C1?,C2?,我們用G(n,p,q)G(n,p,q)G(n,p,q)表示這個(gè)隨機(jī)網(wǎng)絡(luò),其中ppp表示某條邊連接的兩個(gè)點(diǎn)屬于同一個(gè)社區(qū)的概率,qqq表示某條邊連接的兩個(gè)點(diǎn)屬于不同社區(qū)的概率,假設(shè)p>qp>qp>q,用AAA表示這個(gè)網(wǎng)絡(luò)的伴隨矩陣,顯然它是一個(gè)隨機(jī)矩陣,
P(Aij=1∣i,j∈C1ori,j∈C2)=pP(Aij=1∣i∈C1,j∈C2ori∈C2,j∈C1)=qP(A_{ij}=1|i,j \in C_1\ or\ i,j \in C_2)=p \\ P(A_{ij}=1|i \in C_1,j \in C_2\ or\ i \in C_2,j \in C_1)=qP(Aij?=1i,jC1??or?i,jC2?)=pP(Aij?=1iC1?,jC2??or?iC2?,jC1?)=q

我們可以將AAA分解為它的期望與殘差矩陣:
A=E[A]+RA = E[A]+RA=E[A]+R

Community detection in networks的目標(biāo)是給定一個(gè)某個(gè)隨機(jī)矩陣的樣本數(shù)據(jù)集,要還原隨機(jī)矩陣的期望的特征向量,下面是Spectral clustering的算法描述:

我們?cè)谏喜糠值诎酥v用Davis-Kahan定理說明了它的理論性質(zhì):考慮隨機(jī)網(wǎng)絡(luò)G(n,p,q)G(n,p,q)G(n,p,q),如果min?(q,p?q)=μ>0\min(q,p-q)=\mu>0min(q,p?q)=μ>0,則?c>0\exists c>0?c>0,Spectral Clustering最多搞錯(cuò)c/μ2c/\mu^2c/μ2個(gè)節(jié)點(diǎn)的概率至少是1?4e?n1-4e^{-n}1?4e?n。這個(gè)結(jié)論的條件是
∥D∥~n,P(∥R∥=O(n))≥1?4e?n\left\| D\right\| \sim n,P(\left\| R \right\| =O(\sqrt{n})) \ge 1-4e^{-n}Dn,P(R=O(n?))1?4e?n


用矩陣Bernstein不等式推導(dǎo)Spectral Clustering的理論性質(zhì)

注意到∥D∥=(p+q)n/2≥μn\left\| D\right\|=(p+q)n/2 \ge \mu nD=(p+q)n/2μn,所以之前得到的結(jié)果需要的條件是
μn>>O(n)\mu n >> O(\sqrt{n})μn>>O(n?)

也就是∥D∥>>n\left\| D\right\|>>nD>>n,但是用矩陣Bernstein不等式,我們可以把這個(gè)條件弱化為∥D∥>>log?n\left\| D\right\|>>\log nD>>logn

d=∥D∥d=\left\| D\right\|d=D,定義A=∑1≤i<j≤nZijA = \sum_{1 \le i< j \le n}Z_{ij}A=1i<jn?Zij?,其中ZijZ_{ij}Zij?n×nn \times nn×n的矩陣,除了(i,j)(i,j)(i,j)(j,i)(j,i)(j,i)這兩個(gè)位置為Bernoulli變量外,其他位置均為0,我們可以說明
E∥R∥=E∥A?EA∥?dlog?n+log?nE \left\| R \right\| = E \left\| A - EA \right\| \lesssim \sqrt{d \log n}+\log nER=EA?EA?dlogn?+logn

證明思路
R=A?EA=∑1≤i<j≤n(Zij?EZij)R = A - EA = \sum_{1 \le i< j \le n}(Z_{ij}-EZ_{ij})R=A?EA=1i<jn?(Zij??EZij?)

這里的Zij?EZijZ_{ij}-EZ_{ij}Zij??EZij?是有界(算子范數(shù)小于1)、獨(dú)立、零均值、對(duì)稱的隨機(jī)變量,計(jì)算
σ2=∥∑E(Zij?EZij)2∥≈d\sigma^2 = \left\| \sum E(Z_{ij}-EZ_{ij})^2 \right\| \approx dσ2=?E(Zij??EZij?)2?d

根據(jù)矩陣Bernstein不等式的推論

E∥R∥?σlog?n+log?nE \left\| R \right\| \lesssim \sigma\sqrt{\log n}+\log nER?σlogn?+logn

總結(jié)

以上是生活随笔為你收集整理的UA MATH567 高维统计IV Lipschitz组合11 社区发现 Spectral Clustering容许的最大随机噪声的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。