日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 >

【数据挖掘】基于方格的聚类方法 ( 概念 | STING 方法 | CLIQUE 方法 )

發布時間:2025/6/17 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【数据挖掘】基于方格的聚类方法 ( 概念 | STING 方法 | CLIQUE 方法 ) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

        • I . 基于方格的聚類方法 簡介
        • II . 基于方格的聚類方法 圖示
        • III . STING 方法
        • IV . CLIQUE 方法



I . 基于方格的聚類方法 簡介



1 . 基于方格的聚類方法 :


① 數據結構 劃分 : 將 多維數據 空間 , 劃分成一定數目的單元 ;

② 數據結構 操作 : 在上述 劃分好的 數據單元 數據結構 上 , 進行聚類操作 ;


2 . 基于方格聚類方法 優缺點 :


① 優點速度快 : 聚類速度很快 , 其聚類速度 與 數據集樣本個數無關 , 與劃分的單元個數有關 ;

② 缺點準確率低 : 聚類的準確率會大大降低 , 劃分的方格越大 , 準確率越低 , 但速度越快 ;


3 . 如 :111 億數據 , 如果按照樣本數量進行聚類很慢 , 如果將其劃分成 100100100 個聚類 , 相當于劃分成了 100100100 個數據單元 , 其速度相當于 100100100 個樣本進行聚類 , 速度很快 ;



II . 基于方格的聚類方法 圖示



如下圖的二維空間 , 二維空間中分布著 100100100 個點 , 將其劃分成 999 個方格 , 然后對 999 個方格進行聚類 , 不再考慮對樣本進行聚類了 ;


999 個方格 , 將每個方格當做一個 樣本對象 , 進行聚類分組 ;



III . STING 方法



1 . STING 方法 簡介 :


① 全稱 : STING , Statistical Information Grid , 統計信息網格 , 是一種 多分辨率聚類技術 ;

② 劃分方格 : 將數據空間 劃分成矩形區域 ;

③ 劃分分辨率 : 不同層次的 矩形方格 劃分成的 數據單元 , 其分辨率不同 ;

④ 層次結構 : 這些 不同分辨率 的 數據單元 , 構成層次結構 , 如下示例 , 綠色的矩形 ( 數據單元 ) 中 , 包含紫色的 矩形 ( 數據單元 ) ;


2 . 單元統計 :


① 統計信息 : 每個單元 都有 數據統計信息 , 如 單元所有樣本的 平均值 , 最大值 , 最小值 , 數據分布 等數據 ;

② 預先計算 : 統計信息需要預先計算出來 , 供之后的聚類操作使用 ;

③ 聚類分組 : 根據每個 數據單元 的統計信息 , 為 數據單元 進行 聚類分組 ;



IV . CLIQUE 方法



1 . CLIQUE 方法 : 是 基于密度 和 基于方法 結合后的算法 ;


① 劃分 方格 : 將多維 數據集 樣本 , 在 多維數據空間 中 , 劃分成 互不相交 的矩形單元 , 這些單元之間互相不能覆蓋 ;

② 密集單元 : 如果 某個 數據單元 的樣本個數 大于 一個閾值 , 這個 數據單元 就是 密集單元 ;

③ 閾值 : 這個閾值一般是開始時 , 用戶輸入的參數 ;

④ 聚類 : 密集單元 相互連接 構成一個集合 , 就是一個聚類分組 ;


2 . CLIQUE 算法優點 :


① 性能高 : CLIQUE 算法可以 找出 具有 高密度 數據樣本 對象所在的數據單元 ,

② 擴展性好 : 這些數據的 輸入順序 , 數據的分布 , 不會影響最終的數據分布 ;


3 . CLIQUE 算法缺點 : 聚類的準確度較低 :

總結

以上是生活随笔為你收集整理的【数据挖掘】基于方格的聚类方法 ( 概念 | STING 方法 | CLIQUE 方法 )的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。