统计学中P值的理解
一、p值含義理解
P值的含義:原假設(shè)為真時,出現(xiàn)偏離原假設(shè)值的觀測值以及比觀測值更極端的值的概率,說白了P值是個概率值。
通俗理解:在假設(shè)原假設(shè)(H0)正確時,出現(xiàn)現(xiàn)狀或比現(xiàn)狀更差的情況的概率。
p值是Fisher先提出來的“顯著性檢驗”理論體系中的概念,假設(shè)檢驗之所以可行,其理論背景是小概率理論,小概率事件在一次試驗中幾乎是不可能發(fā)生的,但是它一旦發(fā)生,我們就有理由拒絕原假設(shè);反之,小概率時間沒有發(fā)生,則認為原假設(shè)是合理的。通常步驟如下:
1. 有一個命題,稱之為”零假設(shè)“(null hypothesis)H0;
2. 找到一個統(tǒng)計量Z,可以計算Z的統(tǒng)計分布;
3. 一次試驗結(jié)果可以計算得到一個確切的Z值(Z0),在H0成立的情況下,出現(xiàn)比Z0更極端情況的概率值記作p值;
4. 如果p很小,則可以作為”零假設(shè)并不成立“的有力證據(jù)。
顯著性水平是原假設(shè)為真時拒絕原假設(shè)的概率,也即上述所說的小概率的界限,常取值0.05,001.在顯著性水平α下,P值規(guī)則為:P≤α,則拒絕H0;如果P>α,則不拒絕原假設(shè)。
我們通常把1-α稱為置信水平,即對推斷結(jié)果的把握度、可靠性。
二、舉例解釋
假設(shè)檢驗一枚硬幣是否是公正的,即出現(xiàn)正負面的概率是一樣的。
假設(shè):硬幣是公平的
檢驗:扔1000次硬幣來測試假設(shè)是否正確。
扔1000次硬幣用二項分布來計算很麻煩,根據(jù)中心極限定理,我們知道,可以用正態(tài)分布來近似,比如,我扔了1000次,得到了530次正面,用正態(tài)分布來計算就比較簡單。
對于正態(tài)分布,沒辦法計算某個點的概率(連續(xù)分布單點概率=0),只能取區(qū)間來獲得概率,那這個時候取哪個區(qū)間合適呢?這就用到了上面定義的那句話了“出現(xiàn)現(xiàn)狀或比現(xiàn)狀更差的情況的概率”,如下:
如果顯著水平為0.05,這個時候p-value=0.03<0.05,則拒絕原假設(shè)。
三、線性回歸中的P值如何理解
線性回歸中的原假設(shè):兩個變量之間的線性關(guān)系是不顯著的。
當給定顯著水平α時,如果檢驗結(jié)果的p值小于α,則拒絕原假設(shè),說明模型反映的線性關(guān)系顯著,即該變量很有用;反之不拒絕原假設(shè),即該變量與目標變量確實沒有多少線性關(guān)系,可以剔除該變量。
總結(jié)
- 上一篇: 脚被雨水泡了怎么办
- 下一篇: 怎么创建具有真实纹理的CG场景岩石?