excel查标准正态分布_终于搞清楚正态分布、指数分布到底是个啥了
前一篇文章寫的是離散型隨機變量的概率分布,今天我們來聊聊連續型隨機變量的概率分布。
并非所有的數據都是連續的,根據數據類型的不同,有不同的求概率的方法,對于離散型隨機變量的概率分布,我們關心的是取某一個特定數值下的概率,而對于連續型隨機變量的概率分布,我們關心的是取某一個特定范圍內的概率。
首先要提到的一個概念就是:
概率密度函數
概率密度函數用來描述連續型隨機變量的概率分布,用函數f(x)表示連續型隨機變量,將f(x)就稱為概率密度函數,概率密度并非概率,只是一種表示概率的方法,大家不要混淆,其曲線下面的面積表示概率。
概率密度函數下方的總面積為1,因為面積代表概率,而概率是必須為1。
下面是三種典型的連續型隨機變量的概率分布
1. 正態分布
隨機變量X服從一個數學期望為μ、方差為σ^2的正態分布,就是正態分布,也叫做高斯分布,通常記做:
標準正態分布
正態分布是一個鐘形曲線,曲線對稱,中央部分的概率密度最大,越往兩邊,概率密度越小。μ決定了曲線的中央位置,σ決定了曲線的分散性,σ越大,曲線越平緩,σ越小,曲線越陡峭。
如何求正態分布的概率?
正態分布的概率密度函數滿足:
連續型隨機變量的理想模型就是正態分布,求正態分布的概率同樣是求概率密度曲線下的面積,曲線的面積如何求?沒關系,已經有前人栽樹了,總結好了一整套的概率對應表,我們就直接乘涼就好了,其實求正態分布下的概率,是高中數學的知識點,但是如今我們完全可以借助Excel、Python這些工具也是可以直接計算出來,就沒必要學習怎么去手算了。
標準正態分布的意義是,任何一個正態分布都可以通過線性變換轉換為標準正態分布。
正態分布
很多實際問題都是符合正態分布的,如身高、體重等。正態分布在質量管理中也應用的非常廣泛,“3σ原則”就是在正態分布的原理上建立的。
3σ原則是:
- 數值分布在(μ—σ,μ+σ)中的概率為0.6826
- 數值分布在(μ—2σ,μ+2σ)中的概率為0.9544
- 數值分布在(μ—3σ,μ+3σ)中的概率為0.9974
因此可以認為,Y 的取值幾乎全部集中在(μ—3σ,μ+3σ)]區間內,超出這個范圍的可能性僅占不到0.3%,這是一個小概率事件,通常在一次試驗中是不會發生的,一旦發生就可以認為質量出現了異常。
可以用Python里的matplotlib來畫一下正態分布
scipy.stats 是 scipy 專門用于統計的函數庫,所有的統計函數都位于子包 scipy.stats 中
fig,ax?=?plt.subplots(1,1)loc?=?1scale?=?2.0#平均值,?方差,?偏度,?峰度mean,var,skew,kurt?=?norm.stats(loc,scale,moments='mvsk')#print?mean,var,skew,kurt#ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X結果:
2. 均勻分布
均勻分布,也叫矩形分布,是概率密度函數在結果區間內為固定數值的分布
均勻分布
它的概率密度函數為:
均勻分布在自然情況下極為罕見,同樣來畫一下均勻分布
#?均勻分布fig,ax?=?plt.subplots(1,1)loc?=?1scale?=?1#平均值,?方差,?偏度,?峰度mean,var,skew,kurt?=?uniform.stats(loc,scale,moments='mvsk')#ppf:累積分布函數的反函數。q=0.01時,ppf就是p(X結果:
3. 指數分布
指數分布是描述泊松過程中的事件之間的時間的概率分布,即事件以恒定平均速率連續且獨立地發生的過程。如旅客進機場的時間間隔,還有許多電子產品的壽命分布一般服從指數分布。
指數分布
其概率密度函數為:
指數分布具有無記憶的關鍵性質。這表示如果一個隨機變量呈指數分布,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件概率,與從開始使用時算起它使用至少s小時的概率相等。
用Python畫指數分布的概率密度函數
結果:
總結
以上是生活随笔為你收集整理的excel查标准正态分布_终于搞清楚正态分布、指数分布到底是个啥了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 请列举你了解的分布式锁_终于搞懂分布式锁
- 下一篇: ThinkPHP php 仿千图网源码_