假设检验-U检验、T检验、卡方检验、F检验
一、假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)是根據(jù)一定的假設(shè)條件,由樣本推斷總體的一種方法。
假設(shè)檢驗(yàn)的基本思想是小概率反證法思想,小概率思想認(rèn)為小概率事件在一次試驗(yàn)中基本上不可能發(fā)生,在這個(gè)方法下,我們首先對(duì)總體作出一個(gè)假設(shè),這個(gè)假設(shè)大概率會(huì)成立,如果在一次試驗(yàn)中,試驗(yàn)結(jié)果和原假設(shè)相背離,也就是小概率事件竟然發(fā)生了,那我們就有理由懷疑原假設(shè)的真實(shí)性,從而拒絕這一假設(shè)。
二、假設(shè)檢驗(yàn)的四種方法
1、有關(guān)平均值參數(shù)u的假設(shè)檢驗(yàn)
根據(jù)是否已知方差,分為兩類檢驗(yàn):U檢驗(yàn)和T檢驗(yàn)。
如果已知方差,則使用U檢驗(yàn),如果方差未知?jiǎng)t采取T檢驗(yàn)。
2、有關(guān)參數(shù)方差σ2的假設(shè)檢驗(yàn)
F檢驗(yàn)是對(duì)兩個(gè)正態(tài)分布的方差齊性檢驗(yàn),簡單來說,就是檢驗(yàn)兩個(gè)分布的方差是否相等
3、檢驗(yàn)兩個(gè)或多個(gè)變量之間是否關(guān)聯(lián)
卡方檢驗(yàn)屬于非參數(shù)檢驗(yàn),主要是比較兩個(gè)及兩個(gè)以上樣本率(構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。根本思想在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或者擬合優(yōu)度問題。
三、U檢驗(yàn)(Z檢驗(yàn))
U檢驗(yàn)又稱Z檢驗(yàn)。
Z檢驗(yàn)是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗(yàn)的方法(總體的方差已知)。它是用標(biāo)準(zhǔn)正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。
Z檢驗(yàn)步驟:
第一步:建立虛無假設(shè) H0:μ1 = μ2 ,即先假定兩個(gè)平均數(shù)之間沒有顯著差異,
第二步:計(jì)算統(tǒng)計(jì)量Z值,對(duì)于不同類型的問題選用不同的統(tǒng)計(jì)量計(jì)算方法,
1、如果檢驗(yàn)一個(gè)樣本平均數(shù)(X)與一個(gè)已知的總體平均數(shù)(μ0)的差異是否顯著。其Z值計(jì)算公式為:
其中:
X是檢驗(yàn)樣本的均值;
μ0是已知總體的平均數(shù);
S是總體的標(biāo)準(zhǔn)差;
n是樣本容量。
2、如果檢驗(yàn)來自兩個(gè)的兩組樣本平均數(shù)的差異性,從而判斷它們各自代表的總體的差異是否顯著。其Z值計(jì)算公式為:
第三步:比較計(jì)算所得Z值與理論Z值,推斷發(fā)生的概率,依據(jù)Z值與差異顯著性關(guān)系表作出判斷。如下表所示:
第四步:根據(jù)是以上分析,結(jié)合具體情況,作出結(jié)論。
例子:一種原件,要求使用壽命不低于1000小時(shí),現(xiàn)從一批這種原件中抽取25件,測得其使用壽命的平均值為950小時(shí),已知該原件服從標(biāo)準(zhǔn)差S=100小時(shí)的正太分布,試在顯著性水平α=0.05下確定這批原件是否合格
解:使用壽命小于1000小時(shí)即為不合格,此題為左單側(cè)檢驗(yàn)
拒絕域?yàn)?#xff1a;Z<-μα ; 查表得 μ0.05=1.65
已知s2=100*2,X=950,n=25 假設(shè)H0:μ=1000;H1<1000
選取統(tǒng)計(jì)量 Z=(X - μ)(S/√n)= (950-1000)/(100/√25)=-2.5
因?yàn)?Z=-2.5<<-μα =-1.65 ,所以拒絕H0,即認(rèn)為這批原件不合格
四、T檢驗(yàn)
亦稱student t檢驗(yàn)(Student's t test),主要用于樣本含量較小(例如n<30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布。目的是用來比較樣本均數(shù)所代表的未知總體均數(shù)μ和已知總體均數(shù)μ0。
T統(tǒng)計(jì)量計(jì)算公式:
自由度:v=n - 1
T檢驗(yàn)的步驟
第一步:建立虛無假設(shè)H0:μ1 = μ2,即先假定兩個(gè)總體平均數(shù)之間沒有顯著差異;
第二步:計(jì)算統(tǒng)計(jì)量T值,對(duì)于不同類型的問題選用不同的統(tǒng)計(jì)量計(jì)算方法
1、如果要評(píng)斷一個(gè)總體中的小樣本平均數(shù)與總體平均值之間的差異程度,其統(tǒng)計(jì)量T值的計(jì)算公式為:
2、如果要評(píng)斷兩組樣本平均數(shù)之間的差異程度,其統(tǒng)計(jì)量T值的計(jì)算公式為:
第三步:根據(jù)自由度df=n-1,查T值表,找出規(guī)定的T理論值并進(jìn)行比較。理論值差異的顯著水平為0.01級(jí)或0.05級(jí)。不同自由度的顯著水平理論值記為T(df)0.01和T(df)0.05
第四步:比較計(jì)算得到的t值和理論T值,推斷發(fā)生的概率,依據(jù)下表給出的T值與差異顯著性關(guān)系表作出判斷。
第五步:根據(jù)是以上分析,結(jié)合具體情況,作出結(jié)論。
實(shí)際應(yīng)用中,T檢驗(yàn)可分為三種:單樣本T檢驗(yàn)、配對(duì)樣本T檢驗(yàn)和雙獨(dú)立樣本T檢驗(yàn)
單樣本T檢驗(yàn)
例子:已知某班的一次數(shù)學(xué)測驗(yàn)成績復(fù)查正態(tài)分布,現(xiàn)從全班中抽取16人,測得這些人成績是[50,44,91,90,74,72,89,81,65,62,68,74,63,61,33,47],問在α=0.05下,是否可以認(rèn)為全體考生的平均分是70分?
from scipy import stats import numpy as nprvs = [50,44,91,90,74,72,89,81,65,62,68,74,63,61,33,47]
mean = np.mean(rvs)#均值
std = np.std(rvs)#標(biāo)準(zhǔn)差
print("均值:",mean," 標(biāo)準(zhǔn)差:",std)
t_val, p = stats.ttest_1samp(rvs, 70)
print("t_val:",t_val," p值:", p)
結(jié)論,因?yàn)閜值=0.42>0.05,所以可以認(rèn)為全體考生的平均分是70分
配對(duì)樣本T檢驗(yàn)
配對(duì)t檢驗(yàn)是采用配對(duì)設(shè)計(jì)方法觀察以下幾種情形:
1.配對(duì)的兩個(gè)受試對(duì)象分別接受兩種不同的處理;
2.同一受試對(duì)象接受兩種不同的處理;
3.同一受試對(duì)象處理前后的結(jié)果進(jìn)行比較(即自身配對(duì));
4.同一對(duì)象的兩個(gè)部位給予不同的處理。
例子:在針織品漂白工藝過程中, 要考慮溫度對(duì)針織品斷裂強(qiáng)力(主要質(zhì)量指標(biāo))的影響。為了比較70℃與80℃的影響有無差別,在這兩個(gè)溫度下,分別重復(fù)做了8次試驗(yàn),強(qiáng)力數(shù)據(jù)如下。問在70℃時(shí)的平均斷裂強(qiáng)力與80℃時(shí)的平均斷裂強(qiáng)力間是否有顯著差別? 假定斷裂強(qiáng)力服從正態(tài)分布(α=0.05)
70℃時(shí)的強(qiáng)力:20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2
80℃時(shí)的強(qiáng)力:17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1
from scipy.stats import ttest_rel import pandas as pdx = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]
配對(duì)樣本t檢驗(yàn)
t_val, p = ttest_rel(x, y)
print('t_val:',t_val," p值:", p)
結(jié)論: 因?yàn)閜值=0.1149>0.05, 故接受原假設(shè), 認(rèn)為在70℃時(shí)的平均斷裂強(qiáng)力與80℃時(shí)的平均斷裂強(qiáng)力間無顯著差別
雙獨(dú)立樣本T檢驗(yàn)
例子:甲乙兩臺(tái)機(jī)床加工螺絲帽,螺絲帽的半徑都服從正態(tài)分布,為驗(yàn)證兩臺(tái)機(jī)床加工的螺絲帽半徑是否相等,分別取兩臺(tái)機(jī)床加工的8、7枚螺絲帽進(jìn)行測量,分別測得[20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9]\[20.7,19.8,19.5,20.8,20.4,19.6,20.2] 問兩臺(tái)機(jī)器生產(chǎn)的螺絲帽半徑是否有差異(α=0.05)
from scipy.stats import norm,ttest_ind #引入正態(tài)分布(norm),T檢驗(yàn)(ttest_ind)n1_samples = [20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9]
n2_samples = [20.7,19.8,19.5,20.8,20.4,19.6,20.2]
#獨(dú)立雙樣本 t 檢驗(yàn)的目的在于判斷兩組樣本之間是否有顯著差異:
t_val, p = ttest_ind(n1_samples, n2_samples)
print('t_val:',t_val," p值:", p) #p值小于0.05時(shí),認(rèn)為差異顯著;大于等于0.05時(shí)表示差異不顯著
結(jié)論:p值=0.408>0.05,接受原假設(shè),甲乙機(jī)床制造的螺絲帽半徑?jīng)]有顯著性差異
五、卡方檢驗(yàn)
卡方檢驗(yàn)又稱X2檢驗(yàn),就是檢驗(yàn)兩個(gè)變量之間有沒有關(guān)系。
屬于非參數(shù)檢驗(yàn),主要是比較兩個(gè)及兩個(gè)以上樣本率(構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。根本思想在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或者擬合優(yōu)度問題。
X2計(jì)算公式為:
例子1:有AB兩種藥可以治療某種疾病,問兩種藥物的療效是否相同?
| 藥類 | 有效 | 無效 | 合計(jì) | 有效率 |
| A藥 | 67 | 26 | 93 | 72.04% |
| B藥 | 44 | 30 | 74 | 59.46% |
| 合計(jì) | 111 | 56 | 167 | 66.47% |
解:建立假設(shè)H0,兩種藥物療效相同,計(jì)算得其理論值為:
| 藥類 | 有效 | 無效 | 合計(jì) |
| A藥 | 61.8 | 31.2 | 93 |
| B藥 | 49.2 | 24.8 | 74 |
| 合計(jì) | 111 | 56 | 167 |
X2=(67-61.8)2/61.8+(26-31.2)2/31.2+(44-49.2)2/49.2+(30-24.8)2/24.8=2.94
查表得P>0.1,按0.05標(biāo)準(zhǔn),不拒絕H0,即可以認(rèn)為兩種藥物的療效相同
例子2:探究死亡年齡和居住地、性別是否有關(guān)?
#old | ruralMale| ruralFemale | urbanMale | urbanFemale
#50-54 | 11.7 | 8.7 | 15.4 | 8.4
#55-59 | 18.1 |11.7 | 24.3 | 13.6
#60-64 | 26.9 | 20.3 | 37 | 19.3
#65-69 | 41 | 30.9 | 54.6 | 35.1
#70-74 | 66 | 54.3 | 71.1 | 50
結(jié)論: 因?yàn)閜值=0.9961>0.05, 故接受原假設(shè), 認(rèn)為死亡年齡和居住地、性別無顯著差別。
六、F檢驗(yàn)
F檢驗(yàn)法是檢驗(yàn)兩個(gè)正態(tài)隨機(jī)變量的總體方差是否相等的一種假設(shè)檢驗(yàn)方法。
F統(tǒng)計(jì)量計(jì)算公式:
例子:存在兩組數(shù)據(jù),需要驗(yàn)證這兩組數(shù)據(jù)的方差齊性。
x = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]
x = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]
f_val, p = levene(x, y)
print(f_val, p)
結(jié)論,p值=0.93大于0.05,認(rèn)為兩個(gè)總體不具有方差齊性
總結(jié)
以上是生活随笔為你收集整理的假设检验-U检验、T检验、卡方检验、F检验的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搜索词扩展实战
- 下一篇: 黄希庭:心理学的研究要走中国人自己的道路