第七章 参数估计
參數估計是在抽樣及抽樣分布的基礎上,根據樣本統計量來推斷所關心的總體參數。
1 參數估計基本原理
1 估計量與估計值
估計量:參數估計中,用來估計總體參數的統計量的名稱,如樣本均值、樣本比例
估計值:根據一個具體的樣本計算出來的估計量的數值
2 點估計與區間估計
參數估計的方法有點估計和區間估計。
點估計:用樣本統計量的某個取值直接作為總體參數的估計值。無法概率度量可靠程度
區間估計:在點估計的基礎上,給出總體參數的一個區間范圍,該區間通常由樣本統計量加減估計誤差得到。給出一個概率度量。
在區間估計中,由樣本統計量所構造的總體參數的估計區間稱為置信區間,其中區間的最小值稱為置信下限,最大值稱為置信上限。
如果將構造置信區間的步驟重復多次,置信區間中包含總體參數真值的次數所占比例稱為置信水平,也稱置信度或置信系數。
3 評價估計量的標準
評價估計量的標準:無偏性、有效性、一致性
無偏性:指估計量抽樣分布的數學期望等于被估計的總體參數
有效性:指對同一總體參數的兩個無偏估計量,有更小標準差的估計量更有效
一致性:指隨著樣本量的增大,點估計量的值越來越接近被估總體的參數
2 一個總體參數的區間估計
研究一個總體時,所關心的參數主要有總體均值μ?、總體比例π?和總體方差σ?2??等。下文將介紹如何用樣本統計量來構造一個總體參數的置信區間。
1 總體均值的區間估計
在對總體均值進行區間估計時,需要考慮總體是否為正態分布,總體方差是否已知,用于構造估計量的樣本是大樣本還是小樣本等幾種情況。
(1) 正態總體、方差已知,或非正態總體、大樣本
這時,樣本均值X?ˉ??服從正態分布,經過標準化后,則服從標準正態分布,即
z=x?ˉ??μσ/n??√??~N(0,1)?
根據上式可以得出總體均值μ?在1?α?置信水平下的置信區間為:x?ˉ?±z?α/2?σn??√???
式中x?ˉ?+z?α/2?σn??√???稱為置信上限,x?ˉ??z?α/2?σn??√???稱為置信下限,α?是事先確定的一個概率值,也稱風險值,是總體均值不包括在置信區間的概率,1?α?稱為置信水平,z?α/2??是標志正態分布上側面積為α/2?時的z?值,z α/2 σn √ 是估計總體均值時的估計誤差。
如果總體服從正態分布但σ?2??未知,或總體并不服從正態分布,只要是在大樣本條件下,上式中的總體方差σ?2??就可以用樣本方差代替。
(2)正態總體、方差未知、小樣本
如果總體方差σ?2??未知,而且是在小樣本的情況下,則需要用樣本方差S?2??代替σ?2??,這時,樣本均值經過標準化后的隨機變量服從自由度為(n?1)?的t?分布,即
t=x ˉ ?μs/n √ ~t(n?1)
此時需要t分布來建立總體均值μ的置信區間。
根據上式可得總體均值μ?在1?α?置信水平下的置信區間為:
x?ˉ?±t?α/2?sn??√???
2 總體比例的估計
當大樣本情況下,樣本比例p?的抽樣分布可用正態分布近似。此時
z=p?μπ(1?π)/n ? ? ? ? ? ? ? ? ? √ ~N(0,1)
由此可求置信區間
3 樣本方差的估計
由(n?1)s?2?σ?2??~χ?2?(n?1)?可推出總體方差σ?2??在1?α?置信水平下的置信區間為:
(n?1)s?2?χ?2?α/2??≤σ?2?≤(n?1)s?2?χ?2?1?α/2???
3 兩個總體參數的區間估計
對于兩個總體,所關心的參數主要有兩個總體的均值之差μ?1??μ?2??、兩個總體的比例之差π?1??π?2??、兩個總體的方差比σ?2?1?/σ?2?2??。
1 兩個總體均值之差的區間估計
(1) 兩個總體均值之差的估計:獨立樣本
A. 大樣本的估計
如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本的元素與另一個樣本中的元素相互獨立。則成為獨立樣本。如果兩個總體都為正態分布,或兩個都不服從正態分布,只要兩個樣本都為大樣本,根據抽樣分布可知,兩個樣本均值之差的抽樣分布服從正態分布,標準化后為:
z=(x?1??ˉ??x?2??ˉ?)?(μ?1??μ?2?)σ?2?1?n?1??+σ?2?2?n?2????????????????????√??~N(0,1)?
由此可推斷出置信區間
當總體方差未知時,可用樣本方差代替。
B. 小樣本的估計
假設:(1)兩個總體都服從正態分布 (2)兩個隨機樣本獨立地分別抽自兩個總體
在上述假設下,兩個樣本均值都服從正態分布。
情況1:(1)兩個總體方差σ?2?1?、σ?2?2??已知,利用上式標準正態分布
(2)兩個總體方差σ?2?1?、σ?2?2??未知,但σ?2?1?=σ?2?2??
根據(n?1)S?2?/σ?2??服從自由度為n?1?的χ?2??分布,樣本差服從正態分布,可構造自由度為n?1?+n?2??2?的t?分布,進而估計置信區間。
(3)兩個總體方差σ 2 1 、σ 2 2 未知,且σ?2?1?≠σ?2?2??
同樣構造t分布,較復雜
(2) 兩個總體均值之差的估計:匹配樣本
匹配樣本:一個樣本中的數據與另一個樣本中的數據相對應。匹配樣本可以消除由于樣本指定的不公平造成的兩種方法時間上的差異。
大樣本條件下,不管方差是否已知,均可采用標準正態分布
小樣本條件下,采用t?分布
2 兩個總體比例之差的區間估計
根據抽樣分布,兩個樣本比例之差服從正態分布。標準化后,服從標準正態分布。
3 兩個總體方差比的區間估計
根據(n?1)S 2 /σ 2 服從自由度為n?1?的χ?2??分布,兩個樣本方差比服從F(n?1??2,n?2??1)?分布,因此可用F?分布構造兩個總體方差比σ 2 1 /σ 2 2 的置信區間。
總結
- 上一篇: 第六章 统计量及其抽样分布
- 下一篇: 第八章 假设检验