数据挖掘算法学习(四)PCA算法
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘算法学习(四)PCA算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
轉載請附上鏈接http://blog.csdn.net/iemyxie/article/details/38236647
算法簡單介紹
主成分分析(PrincipalComponentAnalysis,簡稱PCA)是一種經常使用的基于變量協方差矩陣對信息進行處理、壓縮和抽提的有效方法。
主要用于對特征進行降維。
算法如果
數據的概率分布滿足高斯分布或是指數型的概率分布。
方差高的向量視為主元。
算法輸入
包括n條記錄的數據集
算法輸出
降維或壓縮后的數據集
算法思想
?1.計算全部樣本的均值m和協方差矩陣S; ?2.計算S的特征值。并由大到小排序; ?3.選擇前n'個特征值相應的特征矢量作成一個變換矩陣E=[e1,e2, …, en’]; ?4.最后。對于之前每個n維的特征矢量x能夠轉換為n’維的新特征矢量??? y=transpose(E)(x-m)
weka執行結果
以weather.nominal.arff為例執行結果部分截圖例如以下:
算法應用
人臉識別
圖像壓縮
信號去噪
轉載請附上鏈接http://blog.csdn.net/iemyxie/article/details/38236647
總結
以上是生活随笔為你收集整理的数据挖掘算法学习(四)PCA算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hinton神经网络公开课编程练习3 O
- 下一篇: redis安装全过程