文献记录(part1)--NP-hardness of Euclidean sum-of-squares clustering
沒(méi)認(rèn)真看的文獻(xiàn)記錄
文章目錄
- 摘要
- 簡(jiǎn)介
- 解決問(wèn)題
摘要
歐幾里得平方和聚類的NP-硬度的最新證明,由于德里尼亞斯等人(馬赫。學(xué)習(xí)。56:9–33,2004),無(wú)效。故提供了一個(gè)備選的簡(jiǎn)短證明。
簡(jiǎn)介
聚類是自動(dòng)分析數(shù)據(jù)的強(qiáng)大工具。它解決了以下一般問(wèn)題:給定一組實(shí)體,找到同質(zhì)和/或分離良好的子集或集群。文獻(xiàn)中使用了許多不同的標(biāo)準(zhǔn)來(lái)表示待發(fā)現(xiàn)聚類的同質(zhì)性和/或分離性(參見(jiàn)漢森和賈馬爾1997年的調(diào)查)。一個(gè)關(guān)鍵標(biāo)準(zhǔn)是從每個(gè)實(shí)體到其所屬聚類質(zhì)心的平方歐幾里德距離的最小和,這表示同質(zhì)性和分離性。請(qǐng)注意,由于惠更斯定理,這相當(dāng)于所有集群內(nèi)實(shí)體對(duì)之間的所有平方距離之和除以其基數(shù)。以此為目標(biāo)劃分成k個(gè)聚類被稱為最小平方和聚類(MSSC)。這個(gè)問(wèn)題是由經(jīng)典的k-means啟發(fā)式(MacQueen 1967)和許多其他算法解決的。
在沒(méi)有正確參考文獻(xiàn)的情況下,文獻(xiàn)中常把k ≥ 2的廣義MSSC問(wèn)題稱為NP-hard問(wèn)題。特別是,如第2節(jié)所示,德里尼亞斯等人(2004年)的證據(jù)是無(wú)效的。由于第二和第四作者(德什潘德和波帕特,2008)的原因,第三節(jié)給出了另一個(gè)簡(jiǎn)短的證明。請(qǐng)注意,另一個(gè)較長(zhǎng)的證明是由達(dá)斯古普塔(2008)獨(dú)立獲得的,幾乎同時(shí)獲得。此外,卡納德等人(2008年)最近獨(dú)立獲得了一個(gè)與我們基本相同的證明。
解決問(wèn)題
經(jīng)典的k-means問(wèn)題已經(jīng)被證明是np.
總結(jié)
以上是生活随笔為你收集整理的文献记录(part1)--NP-hardness of Euclidean sum-of-squares clustering的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 文献学习(part23)--双向聚类方法
- 下一篇: 文献记录(part2)--A Dykst