sklearn自学指南(part37)--DBSCAN
生活随笔
收集整理的這篇文章主要介紹了
sklearn自学指南(part37)--DBSCAN
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
學習筆記,僅供參考,有錯必糾
聚類
DBSCAN
DBSCAN算法將簇視為由低密度區域分隔的高密度區域。由于這種相當通用的觀點,DBSCAN發現的簇可以是任何形狀,而k-means假設集群是凸形的。
DBSCAN的核心組件是核心樣本的概念,即在高密度區域內的樣本。因此,聚類是一組彼此接近的核心樣本(通過一些距離度量度量)和一組接近核心樣本(但本身不是核心樣本)的非核心樣本。
該算法有兩個參數, min_samples 和 eps,它們定義了dense(密集)的含義。更高的 min_samples 或更低的 eps 表明需要更高的密度來形成簇。
更正式的定義是,我們將核心樣本定義為數據集中的一個樣本,在eps距離內存在min_samples其他樣本,它們被定義為核心樣本的鄰居。這告訴我們,核心樣本是向量空間的密集區域。
一個簇是核心樣本的集合,它可以通過遞歸地獲取一個核心樣本,或找到它(它們)的所有鄰居是核心樣本,等等來構建。
一個簇也有一組非核心樣本,這些樣本是簇中核心樣本的鄰居,但它們本身不是核心樣本。直觀地說,這些樣本是在一個簇的邊緣。
根據定義,任何核心樣本都是集群的一部分。任何不是核心樣本的樣本&#x
總結
以上是生活随笔為你收集整理的sklearn自学指南(part37)--DBSCAN的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: flash引导图层怎么用 flash用引
- 下一篇: sklearn自学指南(part38)-