當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

mse均方误差计算公式_PCA的两种解读：方差最大与均方误差最小的推导

發布時間：2023/12/20 编程问答 49 豆豆

生活随笔收集整理的這篇文章主要介紹了 mse均方误差计算公式_PCA的两种解读：方差最大与均方误差最小的推导小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這張圖片很關鍵，來自統計學習方法的PCA插圖又要考試了，推導一下方差最大化與均方差最小化，老師上課講了一些均方差最小化，推導的過程很詳細不過自己沒有記下來，復習的時候再推一遍加深印象。感謝 @耳東陳老師的精彩課件！

一、方差的定義

去除均值，方便計算

將均值為0后，方差就可以表示成元素平方和除以個數，即

二、協方差的定義

由于均值為 0，所以我們的協方差公式可以表示為：

三、協方差矩陣

將和變量拼成一個矩陣

那么計算協方差矩陣

順便說一下,的期望也就是它與它自身的協方差，記為

四、方差最大化

假設原來有兩個變量x1,x2,三個樣本點分別為ABC，樣本分布在由軸x1x2組成的坐標系中。
對坐標系進行旋轉變換，得到新的坐標軸y1，表示新的變量y1
樣本點ABC在y1軸上投影，得到軸的坐標值為
坐標軸的平方和為表示樣本在變量y1上的方差和
主成分分析旨在選取正交變換中方差最大的變量，作為第一主成分，也就是旋轉變換中坐標值平方和最大的軸
而我們知道，對于樣本而言，本身的為固有值，不變
因此可以通過勾股定理知道，方差最大最大等價于樣本點到軸的距離最小

基于PCA的線性結合的第一個主成分為

那么最大化方差為

而經過了去掉均值化后，期望為0

去均值化期望為0的具體步驟如下，假設為未去除均值的情況，均值為

那么回到(9)式，繼續計算這個方差，有兩種理解辦法，過程是一樣的

第一種根據方差與期望的關系，通過(10)(11)算式推得到從而最大化方差等價于最大化
第二種根據(2)的算式，期望為0，得到以下形式，結果是相同的

最后得到的最優化問題是

五、均方誤差最小化(MSE)

在方差最大化的圖中，(勾股定理)可以知道Variance+MSE=定值，因此二者是等價的，換一種思路通過均方誤差最小化進行推導。

向量的投影

以該圖的B點為例，設B點的坐標為x1,x2,其所代表的向量為

,由于 ,那么可以同樣表示出直線的單位方向向量為 ,（注：由于該直線過原點就沒有寫截距項1）那么先算向量和向量的夾角 .

由于

,即 ,可以繼續化簡為：

那么OB'的長度為

OB'的方向為

因此OB'的向量為

在這個部分，我們的目標是最小化均方誤差，也就是

下一步就是表示出

,由向量的知識，（方向換一下沒事，因為還要平方）可以得到

因此目標為

由于協方差

是定值，因此越大，均方誤差越小。

即得到的最優化問題為：

六、求解最優化問題

根據拉格朗日方程：

那么對w求導可以得到

因此代入后有

即尋找最大的特征值即為所求。

那么從大到小排列

，便得到了各個主成分。

高維小樣本數據集的PCA方法預降維度方法及相關公式

例如:
這意味著在n很大的情況下，，協方差矩陣太大并且不可逆很難分解
因此要采用預處理降維度的辦法

總結

以上是生活随笔為你收集整理的mse均方误差计算公式_PCA的两种解读：方差最大与均方误差最小的推导的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： oracle 加全文索引,Oracle创
下一篇：清华EMBA课程系列思考之二 -- 清华