唐宇迪学习笔记19:聚类算法——Kmeans
生活随笔
收集整理的這篇文章主要介紹了
唐宇迪学习笔记19:聚类算法——Kmeans
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
目錄
?
一、KMEANS算法概述
聚類概念
k-means算法
二、KMEANS工作流程
工作流程
優缺點
優點
缺點
三、KMEANS迭代可視化展示
一、KMEANS算法概述
聚類概念
- 無監督問題:我們手里沒有標簽了
- 聚類:相似的東西分到一組
- 難點:如何評估,如何調參
k-means算法
- 基本概念:要得到簇的個數,需要指定K值
- 質心:均值,即向量各維取平均即可
- 距離的度量:常用歐氏距離和余弦相似度(先標準化)
- 優化目標:
二、KMEANS工作流程
工作流程
優缺點
優點
- 簡單,快速,適合常規數據集
缺點
- K值難確定
- 復雜度與樣本呈線性關系
- 很難發現任意形狀的簇 ,聚類效果不好。
三、KMEANS迭代可視化展示
可視化展示
????????????????Visualizing K-Means Clustering
對初始值影響大
總結
以上是生活随笔為你收集整理的唐宇迪学习笔记19:聚类算法——Kmeans的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: xunsearch安装使用
- 下一篇: jQuery_基本选择器