学习模式上的记录之统计篇一 秩和检验
學了快三年模式了,為了說服自己模式的結果是可信的,以及對數據做更好的處理,中間補習了很多統計方面的知識,現在想想不如都放在這里,中間有很多借鑒和參考他人的博客和理解,都記錄下來了,方便自己查閱,也希望可以幫助其他人。
Wilcoxon 秩和檢驗(rank-sum-test),或叫 Mann-Whitney U 檢驗,Mann-Whitney U 檢驗:也叫 Mann–Whitney–Wilcoxon (MWW) , Wilcoxon rank-sum test, or Wilcoxon–Mann–Whitney test,是一種非參數秩和假設檢驗,對獨立樣本進行的一種不要求正態分布的 t-test 檢驗方法。主要是對來自除了總體均值以外完全相同的兩個總體,檢驗其是否具有顯著差異,樣本大小大于20時,檢驗的效果最好。是一類非參數檢驗方法。但是當數據實際上滿足正態分布的時候,用t檢驗更有效。
秩和檢驗的原理和做法:
- 原理:
兩個獨立樣本的t-test是檢驗兩個樣本的均值是否相等。而相對的,兩個獨立樣本的 Wilcoxon test 則是檢驗兩個樣本的中位數,或者說兩個樣本的分布是否有偏移。因此,Wilcoxon test 在計算統計量時是先將兩個樣本混到一起,然后對混合后的list進行從小到大排序,根據排序把兩個樣本的值分別轉換成排序序數,最后比較兩個樣本的序數的大小。如果序數大的富集在其中一個樣本,表明該樣本相對另一個樣本的值要更大,相反亦然。
- 做法:
首先將兩類樣本混在一起,對所有樣本按照所考察的特征從小到大排序。在兩類樣本中分別計算所得排序序號之和 T1 和 T2 ,稱作秩和。兩類樣本的個數分別是 n1 和 n2 。
首先,將 n1 + n2 個實驗數據混合在一起,并按照從小到大的次序排列,每個試驗值在序列中的次序叫做該值的秩(rank),然后將屬于第一組數據的秩相加,其和記為 R1 ,成為第一組數據的秩和(rank sum),同理,可求第二組數據的秩和 R2 ,如果兩組數據之間沒有顯著性差異,則 R1 就不應該太大或太小,對于給定的顯著性水平 α 和 n1, n2 ,由秩和臨界值表可以查得 R1 的上下限值 T2 和 T1 ,如果 R1>T2 或者 R1<T1 ,則認為兩組數據有顯著差異,否則,則兩組數據無顯著差異。
在進行秩和檢驗時如果幾個數據相等,則他們的秩應該是相等的,等于相應幾個秩的算術平均值。
為了比較兩類樣本的秩和是否差異顯著,需要比較T分布,當樣本數目較大時,人們可以利用正態分布來近似秩和 T1 的分布。
秩和檢驗的基本思想是,如果一類樣本的秩和顯著地比另一類小(或大),則兩類樣本在所考察地特征上有顯著差異。秩和檢驗地統計量就是某一類的秩和,某一類秩和哦,不是單純的秩和。
假設:假設兩個獨立樣本之間沒有差異,成立則 H0,不成立則 H1。
檢驗步驟:
其中 n1,n2 樣本的大小,R1,R2 分別為樣本等級和。
其中 U1,U2 中的最小值用于與顯著檢驗 Uα (查 Mann-Whitney Table 可得具體值)相比較,如果 Umin <Uα 時,拒絕 H0,接受 H1.表明兩樣本之間存在差異。
推薦閱讀:
秩和檢驗
Wilcoxon 檢驗之 rank-sum 與 signed-rank
總結
以上是生活随笔為你收集整理的学习模式上的记录之统计篇一 秩和检验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CPU-BenchMark
- 下一篇: 计算机二级考试办公软件高级应用题型,计算