日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

聚类和分类的区别

發(fā)布時間:2023/12/9 编程问答 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 聚类和分类的区别 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

分類算法與聚類算法的區(qū)別:

1.?類別是否預先定義是最直觀區(qū)別

算法書上往往這樣解釋二者的區(qū)別:分類是把某個對象劃分到某個具體的已經(jīng)定義的類別當中,而聚類是把一些對象按照具體特征組織到若干個類別里。雖然都是把某個對象劃分到某個類別中,但是分類的類別是已經(jīng)預定義的,而聚類操作時,某個對象所屬的類別卻不是預定義的。所以,對象所屬類別是否為事先,是二者的最基本區(qū)別。而這個區(qū)別,僅僅是從算法實現(xiàn)流程來看的。

2. 二者解決的具體問題不一樣

分類算法的基本功能是做預測。我們已知某個實體的具體特征,然后想判斷這個實體具體屬于哪一類,或者根據(jù)一些已知條件來估計感興趣的參數(shù)。比如:我們已知某個人存款金額是10000元,這個人沒有結婚,并且有一輛車,沒有固定住房,然后我們估計判斷這個人是否會涉嫌信用欺詐問題。這就是最典型的分類問題,預測的結果為離散值,當預測結果為連續(xù)值時,分類算法可以退化為計量經(jīng)濟學中常見的回歸模型。分類算法的根本目標是發(fā)現(xiàn)新的模式、新的知識,與數(shù)據(jù)挖掘數(shù)據(jù)分析的根本目標是一致的。

聚類算法的功能是降維。假如待分析的對象很多,我們需要歸歸類,劃劃簡,從而提高數(shù)據(jù)分析的效率,這就用到了聚類的算法。很多智能的搜索引擎,會將返回的結果,根據(jù)文本的相似程度進行聚類,相似的結果聚在一起,用戶就很容易找到他們需要的內(nèi)容。聚類方法只能起到降低被分析問題的復雜程度的作用,即降維,一百個對象的分析問題可以轉化為十個對象類的分析問題。聚類的目標不是發(fā)現(xiàn)知識,而是化簡問題,聚類算法并不直接解決數(shù)據(jù)分析的問題,而最多算是數(shù)據(jù)預處理的過程。

3. 有監(jiān)督和無監(jiān)督

分類是有監(jiān)督的算法,而聚類是無監(jiān)督的算法。有監(jiān)督的算法并不是實時的,需要給定一些數(shù)據(jù)對模型進行訓練,有了模型就能預測。新的待估計的對象來了的時候,套進模型,就得到了分類結果。而聚類算法是實時的,換句話說是一次性的,給定統(tǒng)計指標,根據(jù)對象與對象之間的相關性,把對象分為若干類。分類算法中,對象所屬的類別取決于訓練出來的模型,間接地取決于訓練集中的數(shù)據(jù)。而聚類算法中,對象所屬的類別,則取決于待分析的其他數(shù)據(jù)對象。

4. 數(shù)據(jù)處理的順序不同

分類算法中,待分析的數(shù)據(jù)是一個一個處理的,分類的過程,就像給數(shù)據(jù)貼標簽的過程,來一個數(shù)據(jù),我放到模型里,然后貼個標簽。聚類算法中,待分析的數(shù)據(jù)同時處理,來一堆數(shù)據(jù)過來,同時給分成幾小堆。因此,數(shù)據(jù)分類算法和數(shù)據(jù)聚類算法的最大區(qū)別是時效性問題。在已有數(shù)據(jù)模型的條件下,數(shù)據(jù)分類的效率往往比數(shù)據(jù)聚類的效率要高很多,因為一次只是一個對象被處理,而對于聚類結果來說,每當加入一個新的分析對象,類別結果都有可能發(fā)生改變,因此很有必要重新對所有的待分析對象進行計算處理。

5. 典型的分類算法與聚類算法

典型的分類算法有:決策樹,神經(jīng)網(wǎng)絡,支持向量機模型,Logistic回歸分析,以及核估計等等。聚類的方法有,基于鏈接關系的聚類算法,基于中心度的聚類算法,基于統(tǒng)計分布的聚類算法以及基于密度的聚類算法等等。

總結

以上是生活随笔為你收集整理的聚类和分类的区别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。