日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析

發布時間:2025/4/14 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

UA MATH567 高維統計III 隨機矩陣8 社區發現 Spectral Clustering的理論分析

上一講我們完成了Stochastic Block Model與社區發現問題的建模,并描述了目標:Community detection in networks的目標是給定一個某個隨機矩陣的樣本數據集,要還原隨機矩陣的期望的特征向量。同時我們明確了算法分析的基本方法是攝動方法,這里描述一個大致思路:

我們對社區發現算法進行理論分析的目的是說明這樣的算法能夠提供一個一致的、誤差可以被控制的輸出,也就是要說明算法還原出來的特征向量(算法輸出)與隨機矩陣期望的特征向量(理論結果)之差的范數足夠小,在理論分析的時候,我們可以認為算法與理論的區別在于算法計算特征向量時用的是帶噪聲的數據,因此我們需要能分析矩陣噪聲對特征值的影響的工具,于是我們選擇了攝動方法。


Davis-Kahan定理 假設S,TS,TS,T是對稱矩陣,假設min?j≠i∣λi(S)?λj(S)∣=δ>0\min_{j \ne i}|\lambda_i(S)-\lambda_j(S)| = \delta>0minj?=i?λi?(S)?λj?(S)=δ>0,用vi(S)v_i(S)vi?(S)表示矩陣SSS的第iii個特征值對應的標準化的特征向量,用θi(S,T)\theta_{i}(S,T)θi?(S,T)表示矩陣S,TS,TS,T的第iii個特征值對應的特征向量形成的夾角,則
sin?θi(S,T)≤2∥S?T∥δ\sin \theta_i(S,T) \le \frac{2\left\| S-T \right\|}{\delta}sinθi?(S,T)δ2S?T?

評注
i) 雖然這個結果看起來只能說明當S,TS,TS,T兩個矩陣相差不大時,它們的特征向量的夾角也不大,但我們可以進一步得到它們特征向量之差的范數的結果:

因為θi(S,T)∈[0,π/2]\theta_i(S,T) \in [0,\pi/2]θi?(S,T)[0,π/2],于是
1≤∥vi(S)?vi(T)∥2sin?θi(S,T)≤21 \le \frac{\left\|v_i(S) - v_i(T) \right\|_2}{\sin \theta_i(S,T)} \le \sqrt{2}1sinθi?(S,T)vi?(S)?vi?(T)2??2?

所以
∥vi(S)?vi(T)∥2≤22∥S?T∥δ\left\|v_i(S) - v_i(T) \right\|_2 \le \frac{2\sqrt{2}\left\| S-T \right\|}{\delta}vi?(S)?vi?(T)2?δ22?S?T?


Spectral Clustering
假設我們使用Spectral Clustering來做Community detection in networks,根據上一講的簡單分析:

如果AAA表示一個隨機網絡,計算它的v2(A)v_2(A)v2?(A),則v2(A)v_2(A)v2?(A)的某個元素的符號表示對應節點所屬的社區。

定理 考慮隨機網絡G(n,p,q)G(n,p,q)G(n,p,q),如果min?(q,p?q)=μ>0\min(q,p-q)=\mu>0min(q,p?q)=μ>0,則?c>0\exists c>0?c>0,Spectral Clustering最多搞錯c/μ2c/\mu^2c/μ2個節點的概率至少是1?4e?n1-4e^{-n}1?4e?n

證明
AAA表示這個隨機網絡的伴隨矩陣,做分解
A=D+RA = D+RA=D+R

其中DDD是一個不含隨機性的矩陣,rankD=2rank D=2rankD=2, ∥D∥=λ1=(p+q)n2\left\| D \right\|=\lambda_1 = \frac{(p+q)n}{2}D=λ1?=2(p+q)n?并且λ2=(p?q)n2\lambda_2 = \frac{(p-q)n}{2}λ2?=2(p?q)n?P(∥R∥≤2CKn)≥1?4e?nP(\left\| R \right\| \le 2CK\sqrt{n}) \ge 1-4e^{-n}P(R2CKn?)1?4e?n

δ=min?(λ1?λ2,λ2)=nμ>0\delta = \min(\lambda_1-\lambda_2,\lambda_2)=n\mu>0δ=min(λ1??λ2?,λ2?)=nμ>0,于是我們可以使用Davis-Kahan定理以及上面這個概率不等式:?C′>0\exists C'>0?C>0
∥v2(D)?v2(A)∥2≤22C′nμn\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'\sqrt{n}}{\mu n}v2?(D)?v2?(A)2?μn22?Cn??

這個不等式成立的概率是1?e?4n1-e^{-4n}1?e?4n,要考慮搞錯的節點個數,需要考慮n\sqrt{n}n?乘以特征向量,于是
n∥v2(D)?v2(A)∥2≤22C′μn∥v2(D)?v2(A)∥22≤8C′2μ2\sqrt{n}\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'}{\mu} \\ \sqrt{n}\left\| v_2(D)-v_2(A) \right\|^2_2 \le \frac{8C'^2}{\mu^2}n?v2?(D)?v2?(A)2?μ22?C?n?v2?(D)?v2?(A)22?μ28C2?

c=8C′2c = 8C'^2c=8C2,則定理得證。

總結

以上是生活随笔為你收集整理的UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。