概率分布:二项分布
二項分布
二項分布(binomial distribution)就是在重復n次獨立的伯努利試驗(Bernoulli experiment)中,所期望結果出現次數的概率分布。
伯努利試驗的特點:
重復n次獨立的伯努利試驗形成二項分布(高爾頓板)
高爾頓板丨圖片來源:維基百科
從最上方的節點往下,是幾排交錯排列的釘子。從入口扔下的小球撞上一個釘子,就像觸網的乒乓球一樣,彈向左邊和右邊的概率相等。最上方只有一種可能。下降之后,左右兩邊比例變成1:1,繼續這個步驟,第n行的比例系數其實就是n次二項式的展開系數,或者表現為楊輝三角的第n行數值。
一般地,如果隨機變量服從參數為和的二項分布,記為或。次試驗中正好得到次成功的概率由概率質量函數給出
式中,,是二項式系數。不同參數下的二項分布概率分布:
如果,那么隨機變量的期望為
隨機變量的方差為
二項分布的近似
當時,二項分布的概率質量函數是對稱的。當時,二項分布的概率質量函數呈現偏態,且與的偏斜方向相反。如果很大,即使,偏態逐漸降低,最終成正態分布。
?二項分布逼近正態分布的過程丨圖片來源:維基百科
1. 近似為泊松分布
如果存在有限極限,則該二項分布就趨于參數為的泊松分布
實際運用中,如果很大,但比較小(比起來說很小),通常就滿足要求。一般來說,n的值越大,p的值越小,近似就越準確。因為在這種情況下,(1-p)將接近1,因此將接近分布的均值,即。這滿足了泊松分布模型中均值和方差接近的條件。那么用泊松分布近似二項分布更簡單些,畢竟泊松分布跟二項分布一樣都是離散型分布。
2. 近似為高斯分布
如果趨于無限大(如是一個定值),則根據德莫佛-拉普拉斯(De'Moivre-Laplace)中心極限定理,這列二項分布將趨近于高斯分布(正態分布)
式中,,。
實際運用中,要求且時,一般都用高斯分布來近似計算二項分布。
總結
- 上一篇: git配置中的CRLF、LF、CR
- 下一篇: 档案学专业计算机课,档案学专业解读_档案