【数学与算法】PCA主成分分析(降维)的通俗理解
生活随笔
收集整理的這篇文章主要介紹了
【数学与算法】PCA主成分分析(降维)的通俗理解
小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
1.PCA降維
PCA主成分分析簡(jiǎn)單的理解,就是把某物的很多個(gè)能直接獲取到的特征,經(jīng)過變換得到很多個(gè)新特征,這些新特征對(duì)該物體來說,有的影響很大,有的影響很小,只需要使用這些影響大的新特征,舍棄很多影響小的新特征,就達(dá)到了降維。
2.舉例
例如,假如我們想要用新方法衡量一個(gè)學(xué)生綜合素質(zhì),目前可以(直接采集)得到一個(gè)學(xué)生的特征有20個(gè),例如身高體重年齡分?jǐn)?shù)等,那么這個(gè)學(xué)生可以用20維向量來描述,但是這20維特征描述起來就太麻煩了。但是又不知道這些特征哪個(gè)重要,哪個(gè)不重要,不能隨意舍棄。怎么辦呢?
我們想要用新方法衡量一個(gè)學(xué)生綜合素質(zhì),可以這樣做:
- 先采集很多學(xué)生樣本來,例如1000個(gè)學(xué)生,每個(gè)學(xué)生采集20個(gè)特征;
- 然后把這1000個(gè)學(xué)生的這20個(gè)特征進(jìn)行處理,每個(gè)特征都求平均值,然后減去對(duì)應(yīng)特征均值,后續(xù)處理直接參考下面求解步驟。
- 然后我們可以用新的20維特征組成的特征向量向量來描述該學(xué)生。但是我們可以只取 k=5\color{red}k=5k=5,即,只取這新的20維特征前5個(gè)主要特征;這樣也就把用20維向量描述一個(gè)學(xué)生,轉(zhuǎn)化為只需要5維向量來描述一個(gè)學(xué)生。這就是降維。
注意,PCA并不是直接舍棄原始20個(gè)特征的某些特征,而是變換處理后,舍棄變換后的新的20個(gè)特征的一些不重要的新特征,只保留比較重要的前 k\color{red}kk 個(gè)比較重要的特征。
PCA主成分分析的講解博客:
如何通俗易懂地講解什么是 PCA(主成分分析)?
【機(jī)器學(xué)習(xí)】降維——PCA(非常詳細(xì))。
總結(jié)
以上是生活随笔為你收集整理的【数学与算法】PCA主成分分析(降维)的通俗理解的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【数学与算法】奇异矩阵、奇异值、奇异值分
- 下一篇: 【数学与算法】步长一维搜索、梯度下降法、