日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

假设检验-U检验、T检验、卡方检验、F检验

發(fā)布時(shí)間:2024/3/12 编程问答 36 豆豆
生活随笔 收集整理的這篇文章主要介紹了 假设检验-U检验、T检验、卡方检验、F检验 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一、假設(shè)檢驗(yàn)

假設(shè)檢驗(yàn)是根據(jù)一定的假設(shè)條件,由樣本推斷總體的一種方法。

假設(shè)檢驗(yàn)的基本思想是小概率反證法思想,小概率思想認(rèn)為小概率事件在一次試驗(yàn)中基本上不可能發(fā)生,在這個(gè)方法下,我們首先對(duì)總體作出一個(gè)假設(shè),這個(gè)假設(shè)大概率會(huì)成立,如果在一次試驗(yàn)中,試驗(yàn)結(jié)果和原假設(shè)相背離,也就是小概率事件竟然發(fā)生了,那我們就有理由懷疑原假設(shè)的真實(shí)性,從而拒絕這一假設(shè)。

二、假設(shè)檢驗(yàn)的四種方法

1、有關(guān)平均值參數(shù)u的假設(shè)檢驗(yàn)

根據(jù)是否已知方差,分為兩類檢驗(yàn):U檢驗(yàn)和T檢驗(yàn)。
如果已知方差,則使用U檢驗(yàn),如果方差未知?jiǎng)t采取T檢驗(yàn)。

2、有關(guān)參數(shù)方差σ2的假設(shè)檢驗(yàn)

F檢驗(yàn)是對(duì)兩個(gè)正態(tài)分布的方差齊性檢驗(yàn),簡單來說,就是檢驗(yàn)兩個(gè)分布的方差是否相等

3、檢驗(yàn)兩個(gè)或多個(gè)變量之間是否關(guān)聯(lián)

卡方檢驗(yàn)屬于非參數(shù)檢驗(yàn),主要是比較兩個(gè)及兩個(gè)以上樣本率(構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。根本思想在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或者擬合優(yōu)度問題。

三、U檢驗(yàn)(Z檢驗(yàn))

U檢驗(yàn)又稱Z檢驗(yàn)。

Z檢驗(yàn)是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗(yàn)的方法(總體的方差已知)。它是用標(biāo)準(zhǔn)正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較兩個(gè)平均數(shù)的差異是否顯著。

Z檢驗(yàn)步驟:

第一步:建立虛無假設(shè) H0:μ1 = μ2 ,即先假定兩個(gè)平均數(shù)之間沒有顯著差異,

第二步:計(jì)算統(tǒng)計(jì)量Z值,對(duì)于不同類型的問題選用不同的統(tǒng)計(jì)量計(jì)算方法,

1、如果檢驗(yàn)一個(gè)樣本平均數(shù)(X)與一個(gè)已知的總體平均數(shù)(μ0)的差異是否顯著。其Z值計(jì)算公式為:

其中:

X是檢驗(yàn)樣本的均值;

μ0是已知總體的平均數(shù);

S是總體的標(biāo)準(zhǔn)差;

n是樣本容量。

2、如果檢驗(yàn)來自兩個(gè)的兩組樣本平均數(shù)的差異性,從而判斷它們各自代表的總體的差異是否顯著。其Z值計(jì)算公式為:

第三步:比較計(jì)算所得Z值與理論Z值,推斷發(fā)生的概率,依據(jù)Z值與差異顯著性關(guān)系表作出判斷。如下表所示:

第四步:根據(jù)是以上分析,結(jié)合具體情況,作出結(jié)論。

例子:一種原件,要求使用壽命不低于1000小時(shí),現(xiàn)從一批這種原件中抽取25件,測得其使用壽命的平均值為950小時(shí),已知該原件服從標(biāo)準(zhǔn)差S=100小時(shí)的正太分布,試在顯著性水平α=0.05下確定這批原件是否合格

解:使用壽命小于1000小時(shí)即為不合格,此題為左單側(cè)檢驗(yàn)

拒絕域?yàn)?#xff1a;Z<-μα ; 查表得 μ0.05=1.65

已知s2=100*2,X=950,n=25 假設(shè)H0:μ=1000;H1<1000

選取統(tǒng)計(jì)量 Z=(X - μ)(S/√n)= (950-1000)/(100/√25)=-2.5

因?yàn)?Z=-2.5<<-μα =-1.65 ,所以拒絕H0,即認(rèn)為這批原件不合格

四、T檢驗(yàn)

亦稱student t檢驗(yàn)(Student's t test),主要用于樣本含量較小(例如n<30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布。目的是用來比較樣本均數(shù)所代表的未知總體均數(shù)μ和已知總體均數(shù)μ0。

T統(tǒng)計(jì)量計(jì)算公式:

自由度:v=n - 1

T檢驗(yàn)的步驟

第一步:建立虛無假設(shè)H0:μ1 = μ2,即先假定兩個(gè)總體平均數(shù)之間沒有顯著差異;

第二步:計(jì)算統(tǒng)計(jì)量T值,對(duì)于不同類型的問題選用不同的統(tǒng)計(jì)量計(jì)算方法

1、如果要評(píng)斷一個(gè)總體中的小樣本平均數(shù)與總體平均值之間的差異程度,其統(tǒng)計(jì)量T值的計(jì)算公式為:

2、如果要評(píng)斷兩組樣本平均數(shù)之間的差異程度,其統(tǒng)計(jì)量T值的計(jì)算公式為:

第三步:根據(jù)自由度df=n-1,查T值表,找出規(guī)定的T理論值并進(jìn)行比較。理論值差異的顯著水平為0.01級(jí)或0.05級(jí)。不同自由度的顯著水平理論值記為T(df)0.01和T(df)0.05

第四步:比較計(jì)算得到的t值和理論T值,推斷發(fā)生的概率,依據(jù)下表給出的T值與差異顯著性關(guān)系表作出判斷。

第五步:根據(jù)是以上分析,結(jié)合具體情況,作出結(jié)論。

實(shí)際應(yīng)用中,T檢驗(yàn)可分為三種:單樣本T檢驗(yàn)、配對(duì)樣本T檢驗(yàn)和雙獨(dú)立樣本T檢驗(yàn)

單樣本T檢驗(yàn)

例子:已知某班的一次數(shù)學(xué)測驗(yàn)成績復(fù)查正態(tài)分布,現(xiàn)從全班中抽取16人,測得這些人成績是[50,44,91,90,74,72,89,81,65,62,68,74,63,61,33,47],問在α=0.05下,是否可以認(rèn)為全體考生的平均分是70分?

from scipy import stats import numpy as np

rvs = [50,44,91,90,74,72,89,81,65,62,68,74,63,61,33,47]
mean = np.mean(rvs)#均值
std = np.std(rvs)#標(biāo)準(zhǔn)差
print("均值:",mean," 標(biāo)準(zhǔn)差:",std)

t_val, p = stats.ttest_1samp(rvs, 70)
print("t_val:",t_val," p值:", p)

結(jié)論,因?yàn)閜值=0.42>0.05,所以可以認(rèn)為全體考生的平均分是70分

配對(duì)樣本T檢驗(yàn)

配對(duì)t檢驗(yàn)是采用配對(duì)設(shè)計(jì)方法觀察以下幾種情形:

1.配對(duì)的兩個(gè)受試對(duì)象分別接受兩種不同的處理;

2.同一受試對(duì)象接受兩種不同的處理;

3.同一受試對(duì)象處理前后的結(jié)果進(jìn)行比較(即自身配對(duì));

4.同一對(duì)象的兩個(gè)部位給予不同的處理。

例子:在針織品漂白工藝過程中, 要考慮溫度對(duì)針織品斷裂強(qiáng)力(主要質(zhì)量指標(biāo))的影響。為了比較70℃與80℃的影響有無差別,在這兩個(gè)溫度下,分別重復(fù)做了8次試驗(yàn),強(qiáng)力數(shù)據(jù)如下。問在70℃時(shí)的平均斷裂強(qiáng)力與80℃時(shí)的平均斷裂強(qiáng)力間是否有顯著差別? 假定斷裂強(qiáng)力服從正態(tài)分布(α=0.05)

70℃時(shí)的強(qiáng)力:20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2

80℃時(shí)的強(qiáng)力:17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1

from scipy.stats import ttest_rel import pandas as pd

x = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]

配對(duì)樣本t檢驗(yàn)

t_val, p = ttest_rel(x, y)
print('t_val:',t_val," p值:", p)

結(jié)論: 因?yàn)閜值=0.1149>0.05, 故接受原假設(shè), 認(rèn)為在70℃時(shí)的平均斷裂強(qiáng)力與80℃時(shí)的平均斷裂強(qiáng)力間無顯著差別

雙獨(dú)立樣本T檢驗(yàn)

例子:甲乙兩臺(tái)機(jī)床加工螺絲帽,螺絲帽的半徑都服從正態(tài)分布,為驗(yàn)證兩臺(tái)機(jī)床加工的螺絲帽半徑是否相等,分別取兩臺(tái)機(jī)床加工的8、7枚螺絲帽進(jìn)行測量,分別測得[20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9]\[20.7,19.8,19.5,20.8,20.4,19.6,20.2] 問兩臺(tái)機(jī)器生產(chǎn)的螺絲帽半徑是否有差異(α=0.05)

from scipy.stats import norm,ttest_ind #引入正態(tài)分布(norm),T檢驗(yàn)(ttest_ind)

n1_samples = [20.5,19.8,19.7,20.4,20.1,20.0,19.0,19.9]
n2_samples = [20.7,19.8,19.5,20.8,20.4,19.6,20.2]

#獨(dú)立雙樣本 t 檢驗(yàn)的目的在于判斷兩組樣本之間是否有顯著差異:
t_val, p = ttest_ind(n1_samples, n2_samples)
print('t_val:',t_val," p值:", p) #p值小于0.05時(shí),認(rèn)為差異顯著;大于等于0.05時(shí)表示差異不顯著

結(jié)論:p值=0.408>0.05,接受原假設(shè),甲乙機(jī)床制造的螺絲帽半徑?jīng)]有顯著性差異

五、卡方檢驗(yàn)

卡方檢驗(yàn)又稱X2檢驗(yàn),就是檢驗(yàn)兩個(gè)變量之間有沒有關(guān)系。

屬于非參數(shù)檢驗(yàn),主要是比較兩個(gè)及兩個(gè)以上樣本率(構(gòu)成比)以及兩個(gè)分類變量的關(guān)聯(lián)性分析。根本思想在于比較理論頻數(shù)和實(shí)際頻數(shù)的吻合程度或者擬合優(yōu)度問題。

X2計(jì)算公式為:

例子1:有AB兩種藥可以治療某種疾病,問兩種藥物的療效是否相同?

藥類

有效

無效

合計(jì)

有效率

A藥

67

26

93

72.04%

B藥

44

30

74

59.46%

合計(jì)

111

56

167

66.47%

解:建立假設(shè)H0,兩種藥物療效相同,計(jì)算得其理論值為:

藥類

有效

無效

合計(jì)

A藥

61.831.2

93

B藥

49.224.8

74

合計(jì)

111

56

167

X2=(67-61.8)2/61.8+(26-31.2)2/31.2+(44-49.2)2/49.2+(30-24.8)2/24.8=2.94

查表得P>0.1,按0.05標(biāo)準(zhǔn),不拒絕H0,即可以認(rèn)為兩種藥物的療效相同

例子2:探究死亡年齡和居住地、性別是否有關(guān)?

#old | ruralMale| ruralFemale | urbanMale | urbanFemale
#50-54 | 11.7 | 8.7 | 15.4 | 8.4
#55-59 | 18.1 |11.7 | 24.3 | 13.6
#60-64 | 26.9 | 20.3 | 37 | 19.3
#65-69 | 41 | 30.9 | 54.6 | 35.1
#70-74 | 66 | 54.3 | 71.1 | 50

from scipy.stats import chi2_contingency import numpy as np kf_data = np.array([[11.7,8.7,15.4,8.4], [18.1,11.7,24.3,13.6],[26.9,20.3,37,19.3],[41,30.9,54.6,35.1],[66,54.3,71.1,50]]) kf = chi2_contingency(kf_data) print('chisq-statistic=%.4f, p-value=%.4f, df=%i \n expected_frep: \n%s'%kf)

結(jié)論: 因?yàn)閜值=0.9961>0.05, 故接受原假設(shè), 認(rèn)為死亡年齡和居住地、性別無顯著差別。

六、F檢驗(yàn)

F檢驗(yàn)法是檢驗(yàn)兩個(gè)正態(tài)隨機(jī)變量的總體方差是否相等的一種假設(shè)檢驗(yàn)方法。

F統(tǒng)計(jì)量計(jì)算公式:

例子:存在兩組數(shù)據(jù),需要驗(yàn)證這兩組數(shù)據(jù)的方差齊性。
x = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]

from scipy.stats import levene

x = [20.5, 18.8, 19.8, 20.9, 21.5, 19.5, 21.0, 21.2]
y = [17.7, 20.3, 20.0, 18.8, 19.0, 20.1, 20.0, 19.1]
f_val, p = levene(x, y)
print(f_val, p)

結(jié)論,p值=0.93大于0.05,認(rèn)為兩個(gè)總體不具有方差齊性

總結(jié)

以上是生活随笔為你收集整理的假设检验-U检验、T检验、卡方检验、F检验的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。