统计学基础之假设检验
目錄:
一、基本概念
1、原假設
2、備擇假設
3、兩類錯誤
4、顯著性水平
5、p值
6、單側檢驗
7、雙側檢驗
二、假設檢驗的分類
1、一個總體參數的假設檢驗
總體均值的檢驗
總體比例的檢驗
總體方差的檢驗
2、兩個總體參數的假設檢驗
兩個總體均值之差的檢驗
兩個總體比例之差的檢驗
兩個總體方差比的檢驗
一、基本概念
假設檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。其基本原理是先對總體的特征作出某種假設,然后通過抽樣研究的統計推理,對此假設應該被拒絕還是接受作出推斷。
(1)先假設總體某項假設成立,計算其會導致什么結果產生。若導致不合理現象產生,則拒絕原先的假設。若并不導致不合理的現象產生,則不能拒絕原先假設,從而接受原先假設。
(2)它又不同于一般的反證法。所謂不合理現象產生,并非指形式邏輯上的絕對矛盾,而是基于小概率原理:概率很小的事件在一次試驗中幾乎是不可能發生的,若發生了,就是不合理的。至于怎樣才算是“小概率”呢?通常可將概率不超過0.05的事件稱為“小概率事件”,也可視具體情形而取0.1或0.01等。在假設檢驗中常記這個概率為α,稱為顯著性水平。而把原先設定的假設成為原假設,記作H0。把與H0相反的假設稱為備擇假設,它是原假設被拒絕時而應接受的假設,記作H1。
1、原假設:轉自:https://blog.csdn.net/qq_41228218/article/details/90489582
原假設亦稱待驗假設、虛無假設、解消假設,一般記為Ho。
假設檢驗的基本思想是概率性質的反證法。根據所考察問題的要求提出原假設和備擇假設,為了檢驗原假設是否正確,先假定原假設是正確的情況下,構造一個小概率事件,然后根據抽取的樣本去檢驗這個小概率事件是否發生。如果在一次試驗中小概率事件竟然發生了,我們就懷疑原假設原假設的正確性,從而拒絕原假設如果在一次試驗中小概率事件沒有發生,則沒有理由懷疑原假設原假設的正確性,因此接受原假設。
平均數比較的原假設是:平均數相等。
單樣本t檢驗中原假設是觀測者與檢驗值沒有顯著差異
正態分布的原假設是:服從正態分布。
方差齊次性檢驗的原假設是:方差相等。
相關性檢驗的原假設是:不相關。
差異性檢驗中原假設是無差別假設
eg:
列聯表中的卡方檢驗原假設為: 行列變量獨立
2、備擇假設
備擇假設包含關于總體分布的一切使原假設不成立的命題。備擇假設亦稱對立假設、備選假設。
設總體的分布函數中,為未知參數,,為參數空間。我們將參數空間分解為互不相交的兩個部分及,即. 考慮檢驗問題:
為非空子集,
是假設檢驗的對象,稱
為原假設(或零假設),稱
為備擇假設(或備選假設,對立假設)。
如果只含有兩個點,即若
,則有
這時稱
及
分別為簡單原假設及簡單備擇假設。
如果多于兩個點,即若
,而
為非單點集,即有
則稱
為簡單原假設,
為復合備擇假設。
注:若
及
都是非單點集,則稱
及
都是復合的。
3、兩類錯誤
在進行假設檢驗時提出原假設和備擇假設,原假設實際上是正確的,但我們做出的決定是拒絕原假設,此類錯誤稱為第一類錯誤。原假設實際上是不正確的,但是我們卻做出了接受原假設的決定,此類錯誤稱為第二類錯誤。
第一類錯誤(Ⅰ類錯誤)也稱為 α錯誤,是指當虛無假設(H0)正確時,而拒絕H0所犯的錯誤。這意味著研究者的結論并不正確,即觀察到了實際上并不存在的處理效應。
可能產生原因:
1、樣本中極端數值。
2、采用決策標準較寬松。
第二類錯誤(Ⅱ類錯誤)也稱為β錯誤,是指虛無假設錯誤時,反而接受虛無假設的情況,即沒有觀察到存在的處理效應。
可能產生的原因:
1、實驗設計不靈敏。
2、樣本數據變異性過大。
3、處理效應本身比較小。
兩類錯誤的關系:
1、 α+β不一定等于1。
2、在樣本容量確定的情況下,α與β不能同時增加或減少。
3、統計檢驗力。(1-β)
4、顯著性水平
顯著性水平是估計總體參數落在某一區間內,可能犯錯誤的概率,用α表示。當原假設為正確時人們卻把它拒絕了的概率或風險。它是公認的小概率事件的概率值,必須在每一次統計檢驗之前確定,通常取α=0.05或α=0.01。這表明,當作出接受原假設的決定時,其正確的可能性(概率)為95%或99%。
顯著性水平是在進行假設檢驗時事先確定一個可允許的作為判斷界限的小概率標準。檢驗中,依據顯著性水平大小把概率劃分為二個區間,小于給定標準的概率區間稱為拒絕區間,大于這個標準則為接受區間。事件屬于接受區間,原假設成立而無顯著性差異;事件屬于拒絕區間,拒絕原假設而認為有顯著性差異[2]。對顯著水平的理解必須把握以下二點:
1、顯著性水平不是一個固定不變的數值,依據拒絕區間所可能承擔的風險來決定。
2、統計上所講的顯著性與實際生活工作中的顯著性是不一樣的。
5、p值
P值是用來判定假設檢驗結果的一個參數,也可以根據不同的分布使用分布的拒絕域進行比較。當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果P值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,P值越小,我們拒絕原假設的理由越充分。總之,P值越小,表明結果越顯著。但是檢驗的結果究竟是“顯著的”、“中度顯著的”還是“高度顯著的”需要我們自己根據P值的大小和實際問題來解決。
在一個概率模型中,統計摘要(如兩組樣本均值差)與實際觀測數據相同,或甚至更大這一事件發生的概率。換言之,是檢驗假設零假設成立或表現更嚴重的可能性。p值若與選定顯著性水平(0.05或0.01)相比更小,則零假設會被否定而不可接受。然而這并不直接表明原假設正確。p值是一個服從正態分布的隨機變量,在實際使用中因樣本等各種因素存在不確定性。產生的結果可能會帶來爭議。
為理解P值的計算過程,用Z表示檢驗的統計量,ZC表示根據樣本數據計算得到的檢驗統計量值。
左側檢驗P值是當
時,檢驗統計量小于或等于根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值
右側檢驗
P值是當μ=μ0時,檢驗統計量大于或等于根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值
雙側檢驗
P值是當μ=μ0時,檢驗統計量大于或等于根據實際觀測樣本數據計算得到的檢驗統計量值的概率,即p值
在原假設為真的條件下,檢驗統計量的觀察值大于或者等于其計算值的概率(通俗點說P值為當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率)
轉自:https://blog.csdn.net/weixin_34120274/article/details/92154510
P值很小,說明發生這種情況的概率很小,拒絕原價
理解
P值就是 原假設為真的概率,a 是顯著性水平,代表小概率事件
當在雙側檢驗中 , 當 a =0.05,P < 0.025(a/2=0.025) 則拒絕原假設(說明原假設出現的概率比小概率事件還要小,當然要拒絕),相反則接受原假設、
當在單側檢驗中,當 a =0.05 ,P < 0.05 則拒絕原假設
6、單側檢驗
當要檢驗的是樣本所取自的總體的參數值大于或小于某個特定值時,所采用的一種單方面的統計檢驗方法。
單側檢驗包括左單側檢驗和右單側檢驗兩種。如果所要檢驗的是樣本所取自的總體的參數值是否大于某個特定值時,則采用右單側檢驗;反之,若所要檢驗的是樣本所取自的總體的參數值是否小于某個特定值時,則采用左單側檢驗。
單參數假設檢驗問題
(1)
(2)稱為單側假設檢驗問題 。
設為
上的單參數概率密度族且關于實值統計量
具有非降單調似然比,則關于單側假設檢驗問題,
有
(a)存在水平有
的 UMP 檢驗的檢驗函數
其中常數
和 c 由下式確定:
(b)這個檢驗的勢函數是非降的,且在集合
上是嚴格增加的。
(c)在一切使得的檢驗函數
中,
由(a)中所確定的檢驗函數
,使得對任意的
,
都達到最小。
而對單側假設檢驗問題(2),則類似上面的 (a) ,(b),(c) 結論均成立,只需要將(a) 中的第一個式子中的不等號改變方向即可。
7、雙側檢驗
指當統計分析的目的是要檢驗樣本平均數和總體平均數,或樣本成數有沒有顯著差異,而不問差異的方向是否是正差還是負差時,所采用的一種統計檢驗方法。
單參數假設檢驗問題
(1)
(2)或
,
(3)或
稱為雙側假設檢驗問題
設樣本
服從單參數指數族分布(即概率密度滿足
形式,其中
為實參數
是
的嚴增函數)。
(1)關于雙側假設檢驗問題
存在水平為
的 UMPU 檢驗,其檢驗函數為
其中常數
和
由下式確定:
2)關于雙側假設檢驗問題
或
,存在水平為
的 UMPU 檢驗,其檢驗函數為
其中常數
和
由下式確定:
3)關于雙側假設問題
或
,存在水平為
的 UMP 檢驗,其檢驗函數依賴于充分統計量
,形如
其中常數和
由下式確定:
二、假設檢驗的分類
1、一個總體參數的假設檢驗
總體均值的檢驗
總體比例的檢驗
總體方差的檢驗
2、兩個總體參數的假設檢驗
兩個總體均值之差的檢驗
兩個總體比例之差的檢驗
兩個總體方差比的檢驗
總結
以上是生活随笔為你收集整理的统计学基础之假设检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: tensorflow2.0 GPU 版本
- 下一篇: Flash文件体积如何减肥