机器学习(17)无监督学习 -- K-means算法与性能评估
生活随笔
收集整理的這篇文章主要介紹了
机器学习(17)无监督学习 -- K-means算法与性能评估
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
一、K-means
1、概念?
2、過程
3、API(K-means)
二、K-means性能評估
1、輪廓系數
2、API(輪廓系數)
一、K-means
1、概念?
無監督學習:沒有目標值(沒有標簽)。
(聚類一般在分類之前,沒有目標值的時候使用聚類)
采用迭代式的算法,直觀易懂且實用。
缺點:容易受到局部最優解(避免:多次聚類,取多次聚類中心)。
最優解:k個中心點擠在一起。
?
例:對這些人物的分類,沒有目標值,就是無監督學習。?
?
2、過程
例:對該無規則點圖片進行分類,無監督學習分成3個區域(無目標值):?
?
?
1、先選擇K個特征點作為特征中心;(這里分成3堆,3個特征點)
2、分別計算每個點到K個聚類中心的距離,選擇最近的一個中心,標記類別與其一致;
3、接著對著標記的聚類中心之后,重新計算出每個聚類的新中心點(平均值);
4、如果計算得出的新中心點與原中心點一樣,那么結束,否則重新進行第2步過程。
求解中心點:?
?
3、API(K-means)
?
?
二、K-means性能評估
1、輪廓系數
ai:內部距離;
bi:外部距離。?
輪廓系數分析:?
?
?效果好的指標:高內聚,低耦合。(內部聚合,外部分開)
可以看出:
輪廓系數Sc =1時,聚類效果最好(bi>>ai,即外部距離遠大于內部距離);
輪廓系數Sc=-1時,聚類效果最差(bi<<ai,即外部距離遠小于內部距離)。
2、API(輪廓系數)
?
總結
以上是生活随笔為你收集整理的机器学习(17)无监督学习 -- K-means算法与性能评估的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习(16)ROC曲线与AUC指标(
- 下一篇: 深度学习(1)基础1 -- 深度学习与神