简单理解t检验与秩和检验
t-檢驗
選用t-檢驗的基本前提假設是,兩組樣本都服從正態分布,且方差相同。設有兩類(x, y)分別有mmm個和nnn個樣本,它們的總體樣本方差是:
sp2=(n?1)Sx2+(m?1)Sy2m+n?2s_p^2=\frac{(n-1)S_x^2+(m-1)S_y^2}{m+n-2}sp2?=m+n?2(n?1)Sx2?+(m?1)Sy2??
其中,Sx2S_x^2Sx2?和Sy2S_y^2Sy2?分別是兩類樣本各自的估計方差,t檢驗的統計量是:
t=xˉ?yˉsp1n+1mt=\frac{\bar{x}-\bar{y}}{s_p\sqrt{\frac{1}{n}+\frac{1}{m}}}t=sp?n1?+m1??xˉ?yˉ??
它服從自由度為n+m?2n+m-2n+m?2的t分布。
在實際問題中,首先計算出實際樣本的t值,然后根據t分布可以查出在原假設下取得該t值的ppp值,最后根據適當的顯著性水平(如0.05)來決定是否拒絕原假設,推斷兩類樣本的均值是否有顯著差異。
ttt檢驗屬于參數化檢驗方法,此類方法對數據分布有一定的假設,必要時需要首先檢驗樣本分布是否符合該假設。
秩和檢驗
Wilcoxon秩和檢驗(rank-sum test),有時也叫Mann-Whitney U檢驗,是另一類非參數檢驗方法,它們不對數據分布作特殊假設,因而能適用于更復雜的數據分布情況。而當數據實際上滿足正態分布時,用ttt檢驗更有效。
秩和檢驗的做法是,首先將兩類樣本混合在一起,對所有樣本按照所考察的特征從小到大排序。在兩類樣本中分別計算所得排序序號之和T1T_1T1?和T2T_2T2?,稱作秩和。兩類的樣本數分別是n1n_1n1?個和n2n_2n2?。秩和檢驗的基本思想是,如果一類樣本的秩和顯著地比另一類小(或大),則兩類樣本在所考察的特征上有顯著差異。秩和檢驗的統計量就是某一類(如第一類,秩和為T1T_1T1?)的秩和
為了比較兩類樣本的秩和是否差異顯著,需要比較T分布,當樣本數目較大時,人們可以用正態分布來近似秩和T1T_1T1?的分布。其中
μ1=n1(n1+n2+1)2,σ1=n1n2(n1+n2+1)12\mu_1=\frac{n_1(n_1+n_2+1)}{2}, \sigma_1=\sqrt{\frac{n_1n_2(n_1+n_2+1)}{12}}μ1?=2n1?(n1?+n2?+1)?,σ1?=12n1?n2?(n1?+n2?+1)??
與ttt檢驗相比,秩和檢驗沒有對樣本分布作任何假設,適用于更廣泛的情況。另外,ttt檢驗的目的是檢驗兩類樣本的均值是否有系統差異,而秩和檢驗不但受兩類分布的均值的影響,也受到分布形狀的影響。
注:如無特殊說明,以上大部分內容為摘選自張學工所著《模式識別》。
總結
以上是生活随笔為你收集整理的简单理解t检验与秩和检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 小程序模仿通讯录制作
- 下一篇: java版的mrp模拟器,mrp模拟器