日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Canopy聚类算法分析

發布時間:2023/12/31 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Canopy聚类算法分析 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

????? 原文鏈接:http://blog.csdn.net/yclzh0522/article/details/6839643

????? Canopy聚類算法是可以并行運行的算法,數據并行意味著可以多線程進行,加快聚類速度,開源ML庫Mahout使用。

一、概念 ? ?

?????? 與傳統的聚類算法(比如 K-means )不同,Canopy 聚類最大的特點是不需要事先指定 k 值( 即 clustering 的個數),因此具有很大的實際應用價值。與其他聚類算法相比,Canopy聚類雖然精度較低,但其在速度上有很大優勢,因此可以使用 Canopy 聚類先對數據進行“粗”聚類,(摘自于Mahout一書:Canopy算法是一種快速地聚類技術,只需一次遍歷數據科技得到結果,無法給出精確的簇結果,但能給出最優的簇數量。可為K均值算法優化超參數..K....)得到 k 值后再使用 K-means 進行進一步“細”聚類。這種Canopy + K-means的混合聚類方式分為以下兩步:


?Step1、聚類最耗費計算的地方是計算對象相似性的時候,Canopy 聚類在第一階段選擇簡單、計算代價較低的方法計算對象相似性,將相似的對象放在一個子集中,這個子集被叫做Canopy ,通過一系列計算得到若干Canopy,Canopy 之間可以是重疊的,但不會存在某個對象不屬于任何Canopy的情況,可以把這一階段看做數據預處理;

?Step2、在各個Canopy?內使用傳統的聚類方法(如K-means),不屬于同一Canopy 的對象之間不進行相似性計算。

????? 從這個方法起碼可以看出兩點好處:首先,Canopy 不要太大且Canopy 之間重疊的不要太多的話會大大減少后續需要計算相似性的對象的個數;其次,類似于K-means這樣的聚類方法是需要人為指出K的值的,通過Stage1得到的Canopy 個數完全可以作為這個K值,一定程度上減少了選擇K的盲目性。


二、聚類精度

????? 對傳統聚類來說,例如K-means、Expectation-Maximization、Greedy Agglomerative Clustering,某個對象與Cluster的相似性是該點到Cluster中心的距離,那么聚類精度能夠被很好保證的條件是:

????? 對于每個Cluster都存在一個Canopy,它包含所有屬于這個Cluster的元素。

????? 如果這種相似性的度量為當前點與某個Cluster中離的最近的點的距離,那么聚類精度能夠被很好保證的條件是:

????? 對于每個Cluster都存在若干個Canopy,這些Canopy之間由Cluster中的元素連接(重疊的部分包含Cluster中的元素)。

????? 數據集的Canopy劃分完成后,類似于下圖:

三、Canopy算法流程

????? (1)將數據集向量化得到一個list后放入內存,選擇兩個距離閾值:T1和T2,其中T1 > T2,對應上圖,實線圈為T1,虛線圈為T2,T1和T2的值可以用交叉校驗來確定;

????? (2)從list中任取一點P,用低計算成本方法快速計算點P與所有Canopy之間的距離(如果當前不存在Canopy,則把點P作為一個Canopy),如果點P與某個Canopy距離在T1以內,則將點P加入到這個Canopy;

????? (3)如果點P曾經與某個Canopy的距離在T2以內,則需要把點P從list中刪除,這一步是認為點P此時與這個Canopy已經夠近了,因此它不可以再做其它Canopy的中心了;

????? (4)重復步驟2、3,直到list為空結束。

?????? 注意:Canopy聚類不要求指定簇中心的個數,中心的個數僅僅依賴于舉例度量,T1和T2的選擇。



Python代碼:

#-*- coding:utf-8 -*- ''' ''' import numpy as np import matplotlib as nlp#The first op import scipy as sp import scipy.sparse.linalg import time from Old_regression import crossValidation#使用K均值 import kMeans as kmdef canopyClustering(datalist):state =[];#交叉驗證獲取T1和T2;T1,T2 = crossValidation(datalist);#canopy 預聚類canopybins= canopy(datalist, T1 , T2);#使用K均值聚類k =len(canopybins);createCent = [canopy[0] for canopy in canopybins];#獲取canopybins中心dataSet = datalist;centroids, clusterAssment =km.kMeans(dataSet, k, distMeas=distEclud, createCent);return clusterAssment;#得到一個list后放入內存,選擇兩個距離閾值:T1和T2,其中T1 > T2 #Canopy聚類不要求指定簇中心的個數,中心的個數僅僅依賴于舉例度量,T1和T2的選擇。 def canopy(datalist, T1 , T2):#state = [];datalist = [];#初始化第一個canopy元素canopyInit = datalist.pop();canopyCenter= calCanopyCenter([canopyInit] );canopyC = [canopyInit];#建立第一個canopycanopybins = [];canopybins.append([canopyCenter,canopyC ] );while not(len(datalist) ==0 ):PointNow =datalist[len(datalist)-1 ];#PointNow =datalist.pop();counter = 0;for canopy in canopybins:dis =calDis(PointNow, canopy[0]);#如果點P與某個Canopy距離在T1以內,則將點P加入到這個Canopy;if dis<T1:canopy[1].append(PointNow);counter +=1;#break;if dis<T2:#點P曾經與某個Canopy的距離在T2以內,則需要把點P從list中刪除,#這一步是認為點P此時與這個Canopy已經夠近了,因此它不可以再做其它Canopy的中心了if not(counter ==0):#保證必須率屬于一個canopydel list[len(datalist)-1 ];break;else:#建立一個新的CanopycanopyC = [PointNow];canopyCenter= PointNow;canopybins.append([canopyCenter,canopyC ] );return canopybins;def calDis(va,vb):dis =0;for i in range(len(va) ):dis += va[i]*va[i]+ vb[i]*vb[i];return dis;#計算canopy中心 def calCanopyCenter(datalist):center =datalist[0];for i in len(range(center) ):center[i]=0;for data in datalist:center +=data;center /= len(center);return center;

總結

以上是生活随笔為你收集整理的Canopy聚类算法分析的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国产亚洲精品女人久久久久久 | 亚洲成人精品在线观看 | 欧美黄页网站 | 免费看片网站91 | 国产又黄又硬又粗 | 欧美高清hd | 成人在线视频在线观看 | 国产中文网| 日本大尺度吃奶做爰久久久绯色 | 草草影院在线观看视频 | 性无码专区无码 | 国产成人精品无码片区在线 | 日韩视频在线观看一区二区三区 | 懂色视频在线观看 | a毛片在线免费观看 | 蜜桃av噜噜一区二区三区麻豆 | 美女福利在线视频 | 中文视频一区 | 国产成人主播 | 黄频在线看| 在线免费观看小视频 | 中文字幕一区二区三区av | 午夜狠狠干 | 天天躁狠狠躁 | 久久黄色精品视频 | 特色特色大片在线 | 91亚洲精品国偷拍自产在线观看 | 先锋影音av中文字幕 | 男人的天堂中文字幕 | 亚洲天天影视 | 福利视频网址 | 男男巨肉啪啪动漫3d | 91漂亮少妇露脸在线播放 | 亚洲欧美在线视频观看 | 黄色国产一区二区 | 超清纯大学生白嫩啪啪 | 国产精品久久久一区二区三区 | 中文字幕成人动漫 | 婷婷五月色综合 | 蜜臀av性久久久久蜜臀aⅴ四虎 | 亚洲免费观看在线 | 少妇毛片一区二区三区粉嫩av | 久久er99热精品一区二区 | 男女羞羞动态图 | 亚洲精品视频一区二区 | 久久久一区二区 | av播放在线 | www国产亚洲精品 | 午夜插插插 | 永久免费av在线 | 91九色在线播放 | 樱桃成人精品视频在线播放 | 亚洲精品乱码久久久久久黑人 | 天天躁日日躁狠狠躁伊人 | 国产黄色片免费 | 亚洲图片激情小说 | aaa特级毛片 | 国产suv一区二区 | 欧洲精品码一区二区三区免费看 | 俄罗斯av片| 蜜臀久久99静品久久久久久 | 伊人色图 | 日本中文字幕高清 | 久久精品香蕉视频 | 在线看片中文字幕 | 国产精品变态另类虐交 | 成人午夜激情视频 | 亚洲涩涩网 | 中文字幕33页| 国产9区 | 中文在线观看免费 | www四虎com | 日本人毛片 | ass亚洲尤物裸体pics | 老王66福利网 | 羞辱狗奴的句子有哪些 | 国产九九热视频 | 中文在线观看免费 | 我们俩电影网mp4动漫官网 | 日韩精品在线视频 | 精品久久不卡 | 男人天堂网在线视频 | 98久久久 | 国产真实老熟女无套内射 | 亚洲经典一区二区三区 | 91人人草 | 欧美性色黄 | 亚洲国产无码久久 | 色国产精品| 麻豆91精品91久久久 | 亚洲欧美综合另类 | 一级日韩片 | 午夜伦理视频 | 国产亚洲一区二区不卡 | 亚洲色图综合网 | 俺去久久 | 国产精品麻豆入口 | 中文字幕丝袜诱惑 | 五月综合在线 |