协方差矩阵, 相关系数矩阵
變量說明:
設(shè)為一組隨機(jī)變量,這些隨機(jī)變量構(gòu)成隨機(jī)向量,每一個(gè)隨機(jī)變量有m個(gè)樣本,則有樣本矩陣
???????????????????????????????????????????????????????????(1)
當(dāng)中相應(yīng)著每一個(gè)隨機(jī)向量X的樣本向量,相應(yīng)著第i個(gè)隨機(jī)單變量的全部樣本值構(gòu)成的向量。
?
單隨機(jī)變量間的協(xié)方差:
隨機(jī)變量之間的協(xié)方差能夠表示為
???????????????????????????????????????????????????????????????????(2)
依據(jù)已知的樣本值能夠得到協(xié)方差的預(yù)計(jì)值例如以下:
?????????????????????????????????????????????????????????? (3)
能夠進(jìn)一步地簡(jiǎn)化為:
???????????????????????????(4)
?協(xié)方差矩陣:?
??
?????????????????????????(5)
當(dāng)中,從而得到了協(xié)方差矩陣表達(dá)式。
假設(shè)全部樣本的均值為一個(gè)零向量,則式(5)能夠表達(dá)成:
????(6)
?
補(bǔ)充說明:
?
1、協(xié)方差矩陣中的每個(gè)元素是表示的隨機(jī)向量X的不同分量之間的協(xié)方差,而不是不相同本之間的協(xié)方差,如元素Cij就是反映的隨機(jī)變量Xi, Xj的協(xié)方差。
2、協(xié) 方差是反映的變量之間的二階統(tǒng)計(jì)特性,假設(shè)隨機(jī)向量的不同分量之間的相關(guān)性非常小,則所得的協(xié)方差矩陣差點(diǎn)兒是一個(gè)對(duì)角矩陣。對(duì)于一些特殊的應(yīng)用場(chǎng)合,為了使 隨機(jī)向量的長(zhǎng)度較小,能夠採用主成分分析的方法,使變換之后的變量的協(xié)方差矩陣全然是一個(gè)對(duì)角矩陣,之后就能夠舍棄一些能量較小的分量了(對(duì)角線上的元素 反映的是方差,也就是交流能量)。特別是在模式識(shí)別領(lǐng)域,當(dāng)模式向量的維數(shù)過高時(shí)會(huì)影響識(shí)別系統(tǒng)的泛化性能,常常須要做這種處理。
3、必須注意的是,這里所得到的式(5)和式(6)給出的僅僅是隨機(jī)向量協(xié)方差矩陣真實(shí)值的一個(gè)預(yù)計(jì)(即由所測(cè)的樣本的值來表示的,隨著樣本取值的不同會(huì)發(fā)生變化),故而所得的協(xié)方差矩陣是依賴于採樣樣本的,而且樣本的數(shù)目越多,樣本在整體中的覆蓋面越廣,則所得的協(xié)方差矩陣越可靠。
4、如同協(xié)方差和相關(guān)系數(shù)的關(guān)系一樣,我們有時(shí)為了可以更直觀地知道隨機(jī)向量的不同分量之間的相關(guān)性到底有多大,還會(huì)引入相關(guān)系數(shù)矩陣。在概率論和統(tǒng)計(jì)學(xué)中,相關(guān)或稱相關(guān)系數(shù)或關(guān)聯(lián)系數(shù),顯示兩個(gè)隨機(jī)變量之間線性關(guān)系的強(qiáng)度和方向。在統(tǒng)計(jì)學(xué)中,相關(guān)的意義是用來衡量?jī)蓚€(gè)變量相對(duì)于其相互獨(dú)立的距離。在這個(gè)廣義的定義下,有很多依據(jù)數(shù)據(jù)特點(diǎn)而定義的用來衡量數(shù)據(jù)相關(guān)的系數(shù)。
對(duì)于不同數(shù)據(jù)特點(diǎn),能夠使用不同的系數(shù)。最經(jīng)常使用的是皮爾遜積差相關(guān)系數(shù)。其定義是兩個(gè)變量協(xié)方差除以兩個(gè)變量的標(biāo)準(zhǔn)差(方差)。
皮爾遜積差系數(shù)
數(shù)學(xué)特征
當(dāng)中,E是數(shù)學(xué)期望,cov表示協(xié)方差。
由于μX = E(X),σX2 = E(X2) ? E2(X),相同地,對(duì)于Y,能夠?qū)懗?/p>
當(dāng)兩個(gè)變量的標(biāo)準(zhǔn)差都 不為零,相關(guān)系數(shù)才有定義。從柯西—施瓦茨不等式可知,相關(guān)系數(shù)不超過1. 當(dāng)兩個(gè)變量的線性關(guān)系增強(qiáng)時(shí),相關(guān)系數(shù)趨于1或-1。當(dāng)一個(gè)變量添加而還有一變量也添加時(shí),相關(guān)系數(shù)大于0。當(dāng)一個(gè)變量的添加而還有一變量降低時(shí),相關(guān)系數(shù)小 于0。當(dāng)兩個(gè)變量獨(dú)立時(shí),相關(guān)系數(shù)為0.但反之并不成立。 這是由于相關(guān)系數(shù)只反映了兩個(gè)變量之間是否線性相關(guān)。比方說,X是區(qū)間[-1,1]上的一個(gè)均勻分布的隨機(jī)變量。Y = X2. 那么Y是全然由X確定。因此Y 和X是不獨(dú)立的。可是相關(guān)系數(shù)為0。或者說他們是不相關(guān)的。當(dāng)Y 和X服從聯(lián)合正態(tài)分布時(shí),其相互獨(dú)立和不相關(guān)是等價(jià)的。
當(dāng)一個(gè)或兩個(gè)變量帶有測(cè)量誤差時(shí),他們的相關(guān)性就受到削弱,這時(shí),“反衰減”性(disattenuation)是一個(gè)更準(zhǔn)確的系數(shù)。
轉(zhuǎn)載于:https://www.cnblogs.com/mfrbuaa/p/3844817.html
總結(jié)
以上是生活随笔為你收集整理的协方差矩阵, 相关系数矩阵的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 4、2 核心组件
- 下一篇: 如何解决eclipse里面tomcat