基于物化视图优化_CVPR2017|基于构造多视图子空间中的潜在表示解决聚类问题
生活随笔
收集整理的這篇文章主要介紹了
基于物化视图优化_CVPR2017|基于构造多视图子空间中的潜在表示解决聚类问题
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
作者 | 張澤宇
編輯 | 臧晨宇
校對?| 李仲深
今天給大家介紹天津大學張長青老師等人在CVPR2017上發(fā)表的文章“Latent Multi-view Subspace Clustering”。與直接使用原始特征進行單視圖的子空間聚類不同,本文提出了一種潛在多視圖子空間的聚類方法(LMSC),用數(shù)據(jù)點的潛在表示進行聚類,同時在多個視角中發(fā)掘互補信息。該方法在多視圖中尋找數(shù)據(jù)的潛在表示,并在此基礎上對數(shù)據(jù)進行重構(gòu),建立了數(shù)據(jù)的完備表示,提高了子空間表示的準確性和魯棒性。該方法同時采用了ALM-ADM算法進行優(yōu)化,使效果得到了提高。
一、研究背景
1.1?背景
子空間聚類在許多領域都有廣泛應用,尤其對于具有高維特征的數(shù)據(jù)而言,具有十分重要的作用。一般來講,子空間聚類假設數(shù)據(jù)點是從多個子空間中提取的,并都能夠?qū)讲煌拇刂小R环N基于自我表示的子空間聚類方法曾被提出,該方法用數(shù)據(jù)點本身的線性組合來對數(shù)據(jù)點進行表示,并使用損失函數(shù)和正則化項來作為目標函數(shù)。除此之外,稀疏子空間聚類(Sparse Subspace Clustering, SSC)、低秩表示聚類(Low-Rank Representation clustering, LRR)、平滑表示聚類(Smooth Representation clustering, SMR)等方法也使子空間聚類的效果得到了一定的提升。
雖然上述的子空間聚類方法取得了較好的效果,但通常對原始數(shù)據(jù)特征的質(zhì)量有較高要求,在特征缺失等情況下會受到較大影響。因此,一些多視圖子空間的聚類方法被提出,用于改善上述缺點。
在多視圖子空間聚類中,數(shù)據(jù)點由多源特征進行描述,這些多視圖的數(shù)據(jù)表示有著更豐富的信息,使聚類取得更好的效果。通常,這些方法可以在原始數(shù)據(jù)的各個視角中進行數(shù)據(jù)重建,并在各視角下生成子空間表示。然而,分別使用單個視角進行數(shù)據(jù)重建往往不能對數(shù)據(jù)點有很好的整體把握,而且可能存在較大的噪聲,這都可能影響聚類效果。
為了解決上述問題,本文提出了一種數(shù)據(jù)的潛在表示,來充分發(fā)掘數(shù)據(jù)之間的關系,并能夠有效處理噪聲。本文假設各個視圖都由一個潛在的表示空間產(chǎn)生,并且這個空間能夠在本質(zhì)上描述數(shù)據(jù),且能夠揭示不同視角下所蘊含潛在結(jié)構(gòu)的共同特征。
基于上述假設,本文提出了潛在多視圖子空間聚類方法(Latent Multi-view Subspace Clustering, LMSC)。該方法學習了多視角特征下的潛在表示,并生成了多視角共同子空間下的表示,而不再僅限于單個視角。本文還將潛在表示學習和多視圖子空間聚類整合為統(tǒng)一框架,并使用交替方向最小化的增廣拉格朗日乘子法(Augmented Lagrangian Multiplier with Alternating Direction Minimization, ALM-ADM)進行優(yōu)化,使效果得到了提高。
1.2?相關工作
此前,多數(shù)的多視圖聚類方法都基于圖模型,有一些方法基于矩陣因子分解或基于數(shù)據(jù)集在原始視圖上的自我表示,有一些方法對一致性進行了優(yōu)化。除此之外,有一些方法基于K-means來解決大規(guī)模多視圖聚類。另外,多核學習、潛在空間的稀疏子空間聚類(Latent Space Sparse Subspace Clustering, LS3C)和潛在低秩表示(Latent Low-Rank Representation, LatLRR)等方法也被提出。
二、模型與方法
2.1?模型與概述
考慮V個視圖下的N個數(shù)據(jù)點集X,我們的目標是對于每一個數(shù)據(jù)點xi獲得一個潛在表示hi,所有N個潛在表示hi構(gòu)成H。我們考慮重構(gòu)函數(shù)P(v),該函數(shù)能夠?qū)⒔y(tǒng)一的潛在表示hi還原為單一視角v下的數(shù)據(jù)點xi,考慮噪聲ei,則可用圖1表示其關系。
圖1.重構(gòu)函數(shù)、潛在表示、單一視角下數(shù)據(jù)點與噪聲的關系因此,需要優(yōu)化的目標函數(shù)如圖2所示。
圖2.目標函數(shù)進一步,可以結(jié)合自表示方法,并引入相應的正則項,優(yōu)化的目標函數(shù)如圖3所示。其中Z是重構(gòu)系數(shù)矩陣。
圖3.目標函數(shù)
其中,λ1與λ2用于平衡三項之間的影響權(quán)重。考慮魯棒性等因素,最終的目標函數(shù)如圖4所示。
圖4.最終的目標函數(shù)
目標中使用了矩陣的核范數(shù),能夠使最終子空間表示盡可能低秩。
目標函數(shù)中的第一項使所得的潛在表示h能夠在P的變換下,還原回單個空間的數(shù)據(jù)表示,從而保證有用信息得到保留;第二項則表示多視圖子空間下潛在表示的重構(gòu)損失;第三項使得到的潛在表示盡可能低秩。
通過建立上述模型,我們得到的潛在表示具有較為顯著的優(yōu)點。
首先,由于綜合了多視圖中的互補信息,相對于單視圖而言,所得的潛在表示能夠更為全面地對數(shù)據(jù)進行表述,進而能夠提高聚類的效果;另外,使用的矩陣塊范數(shù)能夠使使模型更具魯棒性。
最后,我們將兩項矩陣E進行拼接,得到圖5的目標函數(shù)。
圖5.拼接處理后的目標函數(shù)
2.2? 模型優(yōu)化
雖然模型中的參數(shù)較多,但我們可以分別固定一些參數(shù)來優(yōu)化其它參數(shù),從而將問題分解成幾個迭代的子問題求解。使用ALM-ADM方法可以解決我們的問題。為了使用該方法,我們引入變量J,并將目標函數(shù)改寫為圖6形式。
圖6.引入J后的目標函數(shù)
運用ALM方法,函數(shù)如圖7所示。
圖7.運用ALM方法的函數(shù)
隨后,我們分別求解P,H,Z,E,J五個參數(shù)優(yōu)化的子問題,并在最后更新乘數(shù)。
具體子問題優(yōu)化方法與乘數(shù)更新方法較為復雜,可詳見論文原文。
最終,算法流程如圖8所示。
圖8.LMSC算法流程
三、實驗結(jié)果
本文在真實數(shù)據(jù)集和合成數(shù)據(jù)集上進行了實驗評估,其中合成數(shù)據(jù)集用于驗證多視圖算法的效果。
實驗采用NMI,ACC,F-measure,RI等指標進行效果評價。
合成數(shù)據(jù)集實驗結(jié)果如圖9,真實數(shù)據(jù)集實驗結(jié)果如圖10,在MSRCV1數(shù)據(jù)集上使用t-SNE的對不同視角和潛在表示的可視化結(jié)果如圖11。可以發(fā)現(xiàn),本文提出的方法在準確率等方面相比于現(xiàn)有方法有較大提升,而且多視圖相較于單視圖的效果有顯著提升。
圖9.合成數(shù)據(jù)集上的魯棒性實驗
圖10(a).真實數(shù)據(jù)集下各方法在聚類任務上的效果對比
圖10(b).真實數(shù)據(jù)集下單視圖與多視圖聚類任務效果對比
圖11.不同視角與潛在表示的對比
四、總結(jié)
本文提出了在多視圖數(shù)據(jù)上學習多視角潛在表示的方法,并使后續(xù)的聚類任務得到了性能提升。該方法充分利用了不同視圖之間的互補性,且不同于此前其它方法在單視圖下進行的數(shù)據(jù)重構(gòu)。除此之外,由于方法基于多視圖和稀疏結(jié)構(gòu),因此具有較好的魯棒性。此后,對于大規(guī)模數(shù)據(jù)的處理和非線性核方法的應用可能會對該模型做進一步的優(yōu)化。
參考文獻
C. Zhang, Q. Hu, H. Fu, P. Zhu and X. Cao, "Latent Multi-view Subspace Clustering," 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, 2017, pp. 4333-4341, doi: 10.1109/CVPR.2017.461.
https://ieeexplore.ieee.org/document/8099944
?
歡迎關注公眾號,獲取更多論文解讀轉(zhuǎn)載或合作請聯(lián)系郵箱 intbioinfo@163.com
轉(zhuǎn)載時請注明出處
與50位技術(shù)專家面對面20年技術(shù)見證,附贈技術(shù)全景圖總結(jié)
以上是生活随笔為你收集整理的基于物化视图优化_CVPR2017|基于构造多视图子空间中的潜在表示解决聚类问题的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python写彩票抓取_Python|爬
- 下一篇: 屏幕坏点检测图片_电视屏幕出现坏点怎么办