统计推断——假设检验——检验的功效(势)
一、假設檢驗的兩類錯誤:
第Ⅰ類錯誤:實際情況與 一致時,卻根據統計量數值拒絕,這樣的錯誤稱為第Ⅰ類錯誤;出現第Ⅰ類錯誤的概率用表示。
第Ⅱ類錯誤:實際情況與不一致時,卻根據統計量數值不拒絕,這樣的錯誤稱為第Ⅱ類錯誤;出現第Ⅱ類錯誤的概率用表示。
二、假設檢驗的兩類錯誤為什么不能同時變小?
假如理論告訴我們參數只可能在0和1之間取值,檢驗統計量服從分布。檢驗統計量可取值于整個,我們想要劃分為,,使得落在時接受:的假設,而落在時接受:的假設。
現在問題是如何劃分,。事實上不同的原則可以導出不同的劃分方法,其中每一個都是不同的檢驗。其中每種檢驗都對應相應的的第一類第二類錯誤概率值,所謂第一類第二類錯誤值不能同時減小,指的就是在這一階段不可能通過單純改變,的劃分方式來同時降低兩類錯誤概率。
至于為什么這一階段不可能通過改變,劃分來降低兩類錯誤概率,由下圖所示:
若以1/2為分隔點,當檢驗統計量落在其左邊接受:落在右邊時接受:。
當的確為0時,即:假設正確時,錯誤概率為落在1/2右邊的概率(第一類錯誤發生的概率)。如下圖所示:
當的確為1時,錯誤概率(第二類錯誤發生的概率)為落在1/2左邊,如下圖所示:?
將分割線移到0時,:錯誤率升為?
此時,:時錯誤率降為?
由以上分析可獲結論:對于某一具體的檢驗來說,當樣本量一定時, 越小 越大,越大 越小。?
三、檢驗的功效
實際上不成立時,根據統計量的數值拒絕, 做對了!這樣的概率,稱為檢驗功效(power of test),記為。
檢驗功效的意義:當兩個總體參數的確存在差異時,所使用的統計檢驗能夠發現這種差異的概率。?
例 如果?= ?0.90,則意味著當 實際上不成立時,理論上在每100次檢驗中,平均有90次能拒絕。
單樣本設計資料t 檢驗的功效
例? 已知北方地區一般兒童前囟門閉合月齡的均值為14.1,某研究人員從東北某缺鈣地區抽取36名兒童,得前囟門閉合月齡均值為14.3,標準差為5.08。問該縣兒童前囟門閉合月齡是否大于一般兒童的前囟門閉合月齡??
分析:根據醫學專業知識,缺鈣地區不會閉合得更快,但有可能閉合得慢些,故可作單側檢驗。
結論:經假設,得=0.236,>0.05,不拒絕。?
但是以上的結論也可能樣本量小, 檢驗的功效不夠大導致的,所以我們要計算該檢驗的功效
功效計算公式
: 樣本量?
?: 欲發現的最小差異(或容許誤差)?
: 總體標準差;?
: 標準正態分布的臨界值。單側檢驗時取單側臨界值? 雙側檢驗時取雙側臨界值
: 標準正態分布的單側臨界值(永遠是一個單側的臨界值,即標準正態分布上側尾部面積為所對應的那個臨界值)。
算得后,反查標準正態分布表來確定,進而得到。
根據現有知識,= 0.5月, = 5月, ?=1.645 (單側)
由標準正態分布表查得=?0.8531,=?0.1469?欲發現=?0.5 月的差別,概率只有?14.69%,檢驗功太小!?
三、影響檢驗功效的主要因素?
1、參數間(兩均數和)差異越大,功效越大?
2、個體差異越小,功效越小?
3、樣本量越大,功效越大(樣本量小曲線較胖,樣本量大曲線較瘦)?
4、越大,功效越大?
在假設檢驗結果的解釋和評價中,特別是分析那些未能拒絕 的假設檢驗結果,事后估計的值,有助于判斷是總體的參數確實沒有差別,還是由于樣本量太小,而導致檢驗效能不足,如< 80%。??
?
?
總結
以上是生活随笔為你收集整理的统计推断——假设检验——检验的功效(势)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 如何使静态图片做成动态效果?怎么让静态图
- 下一篇: 价值7k美刀的Flickr网站漏洞是怎么