日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

sklearn聚类模型评估代码_sklearn之聚类评估指标---轮廓系数

發布時間:2023/12/10 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 sklearn聚类模型评估代码_sklearn之聚类评估指标---轮廓系数 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

'''輪廓系數:-----聚類的評估指標

好的聚類:內密外疏,同一個聚類內部的樣本要足夠密集,不同聚類之間樣本要足夠疏遠。

輪廓系數計算規則:針對樣本空間中的一個特定樣本,計算它與所在聚類其它樣本的平均距離a,

以及該樣本與距離最近的另一個聚類中所有樣本的平均距離b,該樣本的輪廓系數為(b-a)/max(a, b),

將整個樣本空間中所有樣本的輪廓系數取算數平均值,作為聚類劃分的性能指標s。

輪廓系數的區間為:[-1, 1]。 -1代表分類效果差,1代表分類效果好。0代表聚類重疊,沒有很好的劃分聚類。

輪廓系數相關API:

import sklearn.metrics as sm

# v:平均輪廓系數

# metric:距離算法:使用歐幾里得距離(euclidean)

v = sm.silhouette_score(輸入集, 輸出集, sample_size=樣本數, metric=距離算法)

案例:輸出KMeans算法聚類劃分后的輪廓系數。'''

importnumpy as npimportmatplotlib.pyplot as mpimportsklearn.cluster as scimportsklearn.metrics as sm#讀取數據,繪制圖像

x = np.loadtxt('./ml_data/multiple3.txt', unpack=False, dtype='f8', delimiter=',')print(x.shape)#基于Kmeans完成聚類

model = sc.KMeans(n_clusters=4)

model.fit(x)#完成聚類

pred_y = model.predict(x) #預測點在哪個聚類中

print(pred_y) #輸出每個樣本的聚類標簽#打印輪廓系數

print(sm.silhouette_score(x, pred_y, sample_size=len(x), metric='euclidean'))#獲取聚類中心

centers =model.cluster_centers_print(centers)#繪制分類邊界線

l, r = x[:, 0].min() - 1, x[:, 0].max() + 1b, t= x[:, 1].min() - 1, x[:, 1].max() + 1n= 500grid_x, grid_y=np.meshgrid(np.linspace(l, r, n), np.linspace(b, t, n))

bg_x=np.column_stack((grid_x.ravel(), grid_y.ravel()))

bg_y=model.predict(bg_x)

grid_z=bg_y.reshape(grid_x.shape)#畫圖顯示樣本數據

mp.figure('Kmeans', facecolor='lightgray')

mp.title('Kmeans', fontsize=16)

mp.xlabel('X', fontsize=14)

mp.ylabel('Y', fontsize=14)

mp.tick_params(labelsize=10)

mp.pcolormesh(grid_x, grid_y, grid_z, cmap='gray')

mp.scatter(x[:, 0], x[:,1], s=80, c=pred_y, cmap='brg', label='Samples')

mp.scatter(centers[:, 0], centers[:,1], s=300, color='red', marker='+', label='cluster center')

mp.legend()

mp.show()

輸出結果:

(200, 2)

[1 1 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 3 3 0 2 1 3 0 2 1 3 0 2 1

3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 302 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 0 3 0 2 1 3 0 2 1 3 0 2 1 302 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2

1 1 0 2 1 3 0 2 1 3 0 3 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1 3 0 2 1

3 0 2 1 3 0 2 1 3 0 2 1 3 0 2]0.5773232071896659[[5.91196078 2.04980392]

[1.831 1.9998]

[7.07326531 5.61061224]

[3.1428 5.2616 ]]

總結

以上是生活随笔為你收集整理的sklearn聚类模型评估代码_sklearn之聚类评估指标---轮廓系数的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。