日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

无监督分类:聚类分析(K均值)

發布時間:2025/3/15 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 无监督分类:聚类分析(K均值) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

1.K均值聚類

K均值聚類是最基礎的一種聚類方法。K均值聚類,就是把看起來最集中、最不分散的簇標簽分配到輸入訓練樣本{xi}中。具體而言就是通過下式計算簇y的分散狀況:
在這里,∑i,yi=y表示的是滿足yi=y的y的和。
μy是指簇y的中心。ny為屬于簇y的樣本總數。利用上述定義,對于所有的簇y=1,2,3,..,c的下式和最小時,決定其所屬的簇標簽。
然而,上述的最優化過程的計算時間隨著樣本數目n的增加呈現指數級的增長,當n為較大的數值的時候,很難對其進行高精度的求解。因此在實際應用中,一般將樣本逐個分類到距離最近的聚類中,并重復這一操作,直到最終求得其局部最優解。
K均值聚類的算法流程如下所示:
K均值聚類的一個實例:
K均值聚類算法的實例。方框表示的是簇中心

2.核K均值聚類

由于K均值聚類是依據歐氏距離||x-μy||的大小來決定樣本所屬的簇,因此只能處理線性可分得聚類問題。 同理,我們可以采用核映射的方法,可以處理非線性可分的聚類問題(核K均值聚類算法)。具體而言,就是把上市的歐式距離的平方用樣本間的內積來表示,如下:
接著,把上式的內積置換為核函數K(x,x'),就變成了核K均值聚類算法。
在這里,與(x,x')相對應的K(x,x')是與最小化無關的常數,因此實際計算過程中可以忽略。 利用核K均值聚類可以得到非線性的簇的分類結果。然而,采用核函數的非線性核K均值聚類的方法,最終的聚類結果強烈依賴于初始值的選取,因此在實際應用中想要得到理想的解并非易事。

3.譜聚類

核K均值聚類方法,最終的聚類結果強烈以來與初始值的選取,當由核函數決定的特征空間的緯度比較高的時候,這種依賴尤其明顯。對此,可以使用降維的方法來解決這個問題,這種方法稱為譜聚類。 前面也介紹了很多的無監督聚類方法。其中也包括可以很好地保護原始數據中的簇構造的局部保持投影法,作為聚類分析的前處理是一種很好的選擇。譜聚類,首先在核特征空間中應用局部保持投影法,然后直接應用常規的K均值聚類方法(并非核函數的方法)。 譜聚類的具體算法流程如下:
利用譜聚類的一則實例如下:
a表示的原始二維數據應用拉普拉斯特征映射法向一維部分空間進行映射,就可以得到b所示的只有兩點的數據結果。對得到的b結果,利用K均值聚類處理后,就可以得到c那樣的兩個點分別代表一個聚類結果,再把得到的簇標簽映射到原始的二維數據中,就可以得到d所示的自然地聚類結果。

4.調整參數的自動選取

核K均值聚類法和譜聚類的結果依賴于高斯核函數的帶寬等核參數的選擇。這一塊重點討論聚類方法中根據更重客觀條件自動決定這些參數的方法。 聚類算法中,通過d次維的實向量樣本{xi},求得c中標量值1,...,c對應的簇標簽{yi}。這一操作可以被理解為將d次維的實向量中包含的信息,通過標量c進行壓縮。如下所示:
基于這樣的觀點,一般認為簇標簽{yi}比原始的樣本{xi}包含更多的信息,可以得到更好的聚類結果。 簇標簽{yi}包含的樣本{xi}的信息量,可以通過互信息來進行測算。互信息是信息論中的一個基本概念定義如下:
互信息一般為非負的數值,只有當變量在統計上相互獨立的時候,互信息為0.因此,可以通過互信息的大小推導出x,y的從屬性的強弱。綜上可知,互信息越大,簇標簽{yi}包含樣本{xi}的信息越多。 互信息的值,可以采用KL散度密度比估計法進行高精度的計算。但是由于互信息的計算公式中包含對數函數,對異常值的反應相當的明顯,所以經常采用沒有對數的平方損失互信息來加以替換(泰勒公式)
接下來主要討論樣本{xi}和簇標簽{yi}之間的平方損失互信息的最小二乘互信息估計法。平方損失互信息最小二乘互信息估計法,不需要計算p(x,y)/p(x)/p(y)等概率,而是對將其組合而成的密度比函數進行學習。
為了對上述的密度比函數進行近似,采用與參數相關的線性模型:
然后對下式的J(a)為最小時對應的參數a進行最小二乘學習:
上式中,C是無關的常數,計算過程可以忽略。然后,對第一項和第二項中包含的期望值進行樣本平均近似,再加上L2正則化項,就可以的帶下面的學習規則:
其中,G是b*b階矩陣;h是b次維向量:
對于上面的凸的二次式,進行簡單的偏微分求導即可得到最優解:
將上面得到的密度比估計量,帶入與平方損失互信息等價的下式:
就可以得到如下的平方損失互信息的估計量:
正則化參數λ和基函數中包含的參數,可以通過與規則J相關的交叉驗證法加以確定。 下面是與各個簇的高斯模型相對應的最小二乘互信息估計法的實例:
使用k近鄰相似度的譜聚類中,當k=10的時候平方損失互信息的估計值達到最大值 由此可以得到最優的聚類效果

總結

以上是生活随笔為你收集整理的无监督分类:聚类分析(K均值)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 久久精品国产视频 | 国产福利一区二区三区在线观看 | 久草蜜桃 | 中文字幕一区二区三区在线不卡 | 黑鬼大战白妞高潮喷白浆 | 国产一级黄色片子 | av男人在线 | www.av88 | 久草中文在线 | 在线成人免费电影 | 先锋影音制服丝袜 | 亚洲少妇毛片 | 轻轻色在线观看 | 日韩精品一级 | av国产免费 | 在线免费av观看 | 日本高清不卡在线 | 韩国毛片一区二区三区 | 少妇久久久久久久 | 在线观看的av网站 | www.成人免费 | 91在线免费观看网站 | 亚洲图色av| 国产精品无码一区二区无人区多人 | 亚洲无码精品国产 | 久久精品中文字幕 | 中国超碰 | 欧美图片一区二区 | 欧美日韩在线视频免费观看 | 午夜tv影院 | 久久精品国产精品 | 精品人妻一区二区三区换脸明星 | 成年人在线网站 | 天天草天天爽 | 欧美日韩网站 | 三级大片在线观看 | 日本a∨视频 | 国产一区日韩 | 精品人妻一区二区三 | 少妇裸体挤奶汁奶水视频 | 波多野结衣亚洲天堂 | 蜜臀av性久久久久蜜臀aⅴ四虎 | 中文视频一区二区 | 18在线观看免费入口 | jvid乐乐 | 麻豆免费电影 | 日本一区二区三区免费在线观看 | 成人做爰免费视频免费看 | 中文字幕福利视频 | 少妇大叫太粗太大爽一区二区 | 国产一区二区网址 | 婷婷精品在线 | 91精东传媒理伦片在线观看 | 日本黄色xxxx | 国产美女无遮挡永久免费 | 兔费看少妇性l交大片免费 日韩高清不卡 | 中文字幕被公侵犯的漂亮人妻 | 高清av免费观看 | 99产精品成人啪免费网站 | 99极品视频| 一级黄色片视频 | 色网在线看| 午夜伦伦| 国产真实乱 | 五月天婷婷丁香花 | 日韩av成人网 | 黄色免费网站在线看 | 亚洲欧美精品一区二区 | 91蜜臀精品国产自偷在线 | 69pao| 玉足脚交榨精h文 | 成人依依网| 久久久久人妻一区 | 国产盗摄一区二区三区在线 | 日本理伦片午夜理伦片 | 三级黄色免费 | 国产精品夜色一区二区三区 | 黄色片aa | 丁香婷婷一区二区三区 | 青青草福利视频 | 中文字幕日本一区 | 日韩极品少妇 | 不卡中文字幕在线观看 | 国产专区一区二区 | 中文字幕 日本 | 国产在线视频自拍 | 精品一区二区免费视频 | 成人免费视频久久 | 奇米二区 | 久久a毛片 | 亚洲精品一区二区三区四区 | 最新中文字幕av专区 | 波多野结衣喷潮 | 久操新在线 | 国产黄色成人 | 在线观看成人av | 久久精品视频2 | 国产一区二区99 | 69av视频在线观看 |