卡方检验及R语言实现
生活随笔
收集整理的這篇文章主要介紹了
卡方检验及R语言实现
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
卡方檢驗就是統(tǒng)計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨于符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。
注意:卡方檢驗針對分類變量。
(1)提出原假設(shè):
H0:總體X的分布函數(shù)為F(x).
如果總體分布為離散型,則假設(shè)具體為
H0:總體X的分布律為P{X=xi}=pi, i=1,2,...
(2)將總體X的取值范圍分成k個互不相交的小區(qū)間A1,A2,A3,…,Ak,如可取
A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak),
其中a0可取-∞,ak可取+∞,區(qū)間的劃分視具體情況而定,但要使每個小區(qū)間所含的樣本值個數(shù)不小于5,而區(qū)間個數(shù)k不要太大也不要太小。
(3)把落入第i個小區(qū)間的Ai的樣本值的個數(shù)記作fi,成為組頻數(shù)(真實值),所有組頻數(shù)之和f1+f2+...+fk等于樣本容量n。
(4)當H0為真時,根據(jù)所假設(shè)的總體理論分布,可算出總體X的值落入第i 個小區(qū)間Ai的概率pi,于是,npi就是落入第i個小區(qū)間Ai的樣本值的理論頻數(shù)(理論值)。
(5)當H0為真時,n次試驗中樣本值落入第i個小區(qū)間Ai的頻率fi/n與概率pi應(yīng)很接近,當H0不真時,則fi/n與pi相差很大。基于這種思想,皮爾遜引進如下檢驗統(tǒng)計量 =K ,在0假設(shè)成立的情況下服從自由度為k-1的卡方分布。
判斷5種品牌啤酒的愛好者有無顯著差異: > X<-c(210, 312, 170, 85, 223)
? ? > chisq.test(X) --卡方檢驗
Chi-squared test for given probabilities
data: ?X
X-squared = 136.49, df = 4, p-value < 2.2e-16
P值越大,支持原假設(shè)的證據(jù)就越強,給定顯著性水平alpha, 當P值小于alpha時,就拒絕原假設(shè)。
判斷5種品牌啤酒的愛好者有無顯著差異: > X<-c(210, 312, 170, 85, 223)
? ? > chisq.test(X) --卡方檢驗
Chi-squared test for given probabilities
data: ?X
X-squared = 136.49, df = 4, p-value < 2.2e-16
P值越大,支持原假設(shè)的證據(jù)就越強,給定顯著性水平alpha, 當P值小于alpha時,就拒絕原假設(shè)。
總結(jié)
以上是生活随笔為你收集整理的卡方检验及R语言实现的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用devc++表白_【理工大表白墙】19
- 下一篇: k8s 创建秘钥