高等数理统计(三)
引言
【比較官方的簡介】數(shù)理統(tǒng)計學(xué)是一門以概率論為基礎(chǔ),應(yīng)用性很強(qiáng)的學(xué)科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對所考察的問題作出正確的推斷和預(yù)測,為采取正確的決策和行動提供依據(jù)和建議。數(shù)理統(tǒng)計不同于一般的資料統(tǒng)計,它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。
【簡單的講】,就是通過樣本分析來推斷整體。
【意義或者重要性】在這個大數(shù)據(jù)時代,數(shù)據(jù)是非常重要的。怎樣挖掘數(shù)據(jù)內(nèi)部的規(guī)律或者隱含的信息,變得尤為重要。當(dāng)時我們是不可能獲得整體的數(shù)據(jù)的,所以我們只能通過抽取樣本,進(jìn)而通過樣本來推斷整體的規(guī)律。
【目錄】
第一章、樣本與統(tǒng)計量
一、引言:
二、總體與樣本:
三、統(tǒng)計量:
四、常用分布:
第二章、參數(shù)估計
一、引言:
二、點估計——矩估計法:
三、點估計——極大似然估計:
四、估計量的優(yōu)良性準(zhǔn)則
五、區(qū)間估計——正態(tài)分布
1、引入
2、單個正態(tài)總體參數(shù)的區(qū)間估計
3、兩個正態(tài)總體的區(qū)間估計
六、區(qū)間估計——非正態(tài)分布:
1、大樣本正態(tài)近似法
2、二項分布
3、泊松分布
第三章、假設(shè)檢驗
一、引言:
二、正態(tài)總體均值的假設(shè)檢驗
1、單正態(tài)總體 N(μ, σ2)均值 μ?的檢驗
(1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0?
(2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0
2、兩個正態(tài)總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較
(1) 雙邊檢驗 H0: μ1?= μ2;H1: μ1≠μ2?
? ? (2) 單邊檢驗 H0: μ1?>=?μ2;H1: μ1<μ2?
(3) 單邊檢驗 H0:?μ1?<=?μ2;H1:?μ1>μ2?
三、正態(tài)總體方差的檢驗
1、單個正態(tài)總體方差的 χ2 檢驗
(1) H0: σ2?=σ02;H1: σ2?≠σ02
(2) H0: σ2?=σ02;H1: σ2?>σ02
(3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)
2、兩正態(tài)總體方差比的 F 檢驗
(1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.
?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22
?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22
第三章、假設(shè)檢驗
一、引言:
下面,我們討論不同于參數(shù)估計問題的另一類統(tǒng)計推斷問題——根據(jù)樣本提供的信息,檢驗總體的某個假設(shè)是否成立的問題。這類問題稱為假設(shè)檢驗。
假設(shè)檢驗可分為兩類:
1、參數(shù)檢驗:總體分布已知情形下,檢驗未知參數(shù)的某個假設(shè)。
2、非參數(shù)檢驗:總體分布未知情形下的假設(shè)檢驗問題。
先看一個例子:
【例1】某工廠生產(chǎn) 10 歐姆的電阻,根據(jù)以往生產(chǎn)的電阻實際情況,可以認(rèn)為: 電阻值 X服從正態(tài)分布 N(μ, 0.12)。現(xiàn)在隨機(jī)抽取10個電阻, 測得它們的電阻值為:9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10.0, 10.5, 10.1, 10.2.問: 從樣本看,能否認(rèn)為該廠生產(chǎn)的電阻的平均值 μ?= 10 歐姆?
I.? 如何建立檢驗?zāi)P?/strong>
●? 確定總體:記 X 為該廠生產(chǎn)電阻的測值,則?:X ~ N(μ, 0.12);
●? 明確任務(wù):通過樣本推斷 “X 的均值 μ 是否等于10歐姆”;
●? 假設(shè):上面的任務(wù)是要通過樣本檢驗“X 的均值μ =10”這一假設(shè)是否成立。
在數(shù)理統(tǒng)計中,把 “ X 的均值 μ =10” 這樣一個待檢驗的假設(shè)記為 “原假設(shè)” 或 “零假設(shè)”,記成 “ H0:μ =10”。
原假設(shè)的對立面是 “ X? 的均值?? μ ≠10”,稱為? “對立假設(shè)” 或 “備擇假設(shè)”,記成?? “ H1:μ ≠10”。把原假設(shè)和對立假設(shè)合寫在一起,就是:H0:μ =10; H1:μ≠10.
?
II.? 解決問題的思路
這里的問題是:如何確定常數(shù) c 呢?細(xì)致地分析:根據(jù)中心極限定理,有
為確定常數(shù) c,我們考慮一個很小的正數(shù)a, 如a = 0.05。當(dāng)原假設(shè) H0: μ =10 成立時,有
III.? 方法原理:小概率發(fā)生(落入拒絕域),則拒絕。
IV. 兩類錯誤與顯著性水平
當(dāng)我們檢驗一個假設(shè) H0 時,有可能犯以下兩類錯誤之一:H0 是正確的,但被我們拒絕了,這就犯了“棄真”的錯誤,即拋棄了正確假設(shè);H0 是不正確的,但被我們接受了,這就犯了“取偽”的錯誤,即采用了偽假設(shè)。
? ? ? 因為檢驗統(tǒng)計量總是隨機(jī)的,所以,我們總是以一定的概率犯以上兩類錯誤。
通常用 α 和 β ?記犯第一、第二類錯誤的概率,即?
α = P{ 拒絕H0 | H0 為真?}
β?= P{ 接受H0 | H0 為假?}
在檢驗問題中,犯“棄真”和“取偽”兩類錯誤都總是不可避免的,并且減少犯第一類錯誤的概率,就會增大犯第二類錯誤的概率;反之亦然。?所以,犯兩類錯誤的概率不能同時得到控制。
在統(tǒng)計學(xué)中,通常控制犯第一類錯誤的概概率。一般事先選定一個數(shù) a(0<a<1),要求犯第一類錯誤的概率不超過 a。稱 a 為假設(shè)檢驗的顯著性水平,簡稱水平。犯第二類錯誤的概率的計算超出了課程的學(xué)習(xí)范圍。因此,不作討論。 ??
【例1(續(xù))】分析該例的顯著性水平。
現(xiàn)在我們來分析一下:取上述? c? 后,如果? H0 是正確的,卻被我們拒絕了。這時,犯第一類錯誤的概率是多少呢?
二、正態(tài)總體均值的假設(shè)檢驗
1、單正態(tài)總體 N(μ, σ2)均值 μ?的檢驗
(1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0?
假設(shè) σ2已知,根據(jù)上節(jié)中的例1,當(dāng)原假設(shè) H0:? μ = μ0 成立時,有?
以上檢驗法稱作 U 檢驗法。
在應(yīng)用上,σ2未知的情況是常見的。此時,和前面不同的是:常用樣本方差 S2代替未知的σ2 。
此檢驗法稱作? t? 檢驗法。
(2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0?
上一段中, H0:μ=μ0 ;? H1: μ≠μ0 的對立假設(shè)為 H1: μ ≠μ0 , 該假設(shè)稱為雙邊對立假設(shè)。而現(xiàn)在要處理的對立假設(shè)為 H1: μ >μ0,? 稱為右邊對立假設(shè)。
? 類似地,H0: μ =μ0; H1: μ <μ0 中的對立假設(shè)H1: μ <μ0,假設(shè)稱為左邊對立假設(shè)。右邊對立假設(shè)和左邊對立假設(shè)統(tǒng)稱為單邊對立假設(shè),其檢驗為單邊檢驗。
例如:工廠生產(chǎn)的某產(chǎn)品的數(shù)量指標(biāo)服從正態(tài)分布,均值為 μ0 ;采用新技術(shù)或新配方后,產(chǎn)品質(zhì)量指標(biāo)還服從正態(tài)分布,但均值為 μ。我們想了解 “μ是否顯著地大于μ0”,即產(chǎn)品的質(zhì)量指標(biāo)是否顯著地增加了。
【例 2】某廠生產(chǎn)一種工業(yè)用繩,其質(zhì)量指標(biāo)是繩子所承受的最大拉力,假定該指標(biāo)服從正態(tài)分布,且該廠原來生產(chǎn)的繩子指標(biāo)均值 μ0 =15公斤,采用一種新原材料后,廠方稱這種原材料提高了繩子的質(zhì)量,也就是說繩子所承受的最大拉力 μ 比15公斤增大了。
??? 為檢驗該廠的結(jié)論是否真實,從其新產(chǎn)品中隨機(jī)抽取50件,測得它們所承受的最大拉力的平均值為15.8公斤,樣本標(biāo)準(zhǔn)差S=0.5公斤。取顯著性水平a =0.01。問從這些樣本看:能否接受廠方的結(jié)論。
2、兩個正態(tài)總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較
在應(yīng)用上,經(jīng)常會遇到兩個正態(tài)總體均值的比較問題。
例如:比較甲、乙兩廠生產(chǎn)的某種產(chǎn)品的質(zhì)量。將兩廠生產(chǎn)的產(chǎn)品的質(zhì)量指標(biāo)分別看成正態(tài)總體 N(μ1, σ12) 和 N(μ2, σ22)。比較它們的產(chǎn)品質(zhì)量指標(biāo)的問題,就變?yōu)楸容^這兩個正態(tài)總體的均值 μ1和 μ2的的問題。
又如:考察一項新技術(shù)對提高產(chǎn)品質(zhì)量是否有效。將新技術(shù)實施前后生產(chǎn)的產(chǎn)品質(zhì)量指標(biāo)分別看成正態(tài)總體 N(μ1,?σ12) 和 N(μ2,?σ22)。這時,所考察的問題就歸結(jié)為檢驗這兩個正態(tài)總體的均值 μ1和?μ2是否相等的問題。? ?
?
【說明】
上面,我們假定 σ12=σ22。當(dāng)然,這是個不得已而強(qiáng)加上去的條件,因為如果不加此條件,就無法使用簡單易行的 t 檢驗。
? ? ? 在實用中,只要我們有理由認(rèn)為σ12和σ22相差不是太大,往往就可使用上述方法。通常是:如果方差比檢驗未被拒絕(見下節(jié)), 就認(rèn)為σ12和σ22相差不是太大。
【例3】假設(shè)有A和B兩種藥,欲比較它們在服用2小時后在血液中的含量是否一樣。對藥品A,隨機(jī)抽取8個病人服藥,服藥2小時后,測得8個病人血液中藥物濃度(用適當(dāng)?shù)膯挝?分別為:
???? 1.23, 1.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76.
對藥品B,隨機(jī)抽取6個病人服藥,服藥2小時后,測得血液中藥的濃度分別為:?1.76, 1.41,? 1.87, 1.49, 1.67, 1.81.
假定這兩組觀測值抽自具有共同方差的兩個正態(tài)總體,在顯著性水a(chǎn)=0.10下,檢驗病人血液中這兩種藥的濃度是否有顯著不同?
?
三、正態(tài)總體方差的檢驗
1、單個正態(tài)總體方差的 χ2 檢驗
設(shè) X1, X2, …, Xn 為來自總體 N(μ , σ2) 的樣本,μ ?和 σ2未知,求下列假設(shè)的顯著性水平為 a? 的檢驗。
(1) H0: σ2 =σ02;H1: σ2 ≠σ02
【思路分析】利用樣本方差 S2是?σ2的一個無偏估計,且 (n-1)S2/ ?σ2?~ χ2n-1 的結(jié)論。
當(dāng)原假設(shè) H0: σ2?= σ02成立時,S2和σ02應(yīng)該比較接近,即比值 S2/σ02應(yīng)接近于1。所以,這個比值過大或過小 時,應(yīng)拒絕原假設(shè)。
? ? ?合理的做法是:? 找兩個合適的界限 c1 和 c2 ,
● 當(dāng) c1<(n-1)S2/σ02 < c2 時,接受H0;
● 當(dāng) (n-1)S2/σ02≤c1 或 (n-1)S2/σ02≥c2 時,?? 拒絕 H0 。 ? ?
(2) H0: σ2?=σ02;H1: σ2?>σ02
(3)? H0: σ2?≤σ02;H1: σ2?> σ02?(同2.)
?
【例1】某公司生產(chǎn)的發(fā)動機(jī)部件的直徑 (單位: cm) 服從正態(tài)分布,并稱其標(biāo)準(zhǔn)差 σ0=0.048 。現(xiàn)隨機(jī)抽取5個部件,測得它們的直徑為?1.32, 1.55, 1.36, 1.40, 1.44.
取a=0.05,問:
(1). 能否認(rèn)為該公司生產(chǎn)的發(fā)動機(jī)部件的直徑的標(biāo)準(zhǔn)差確實為σ= σ0?
(2). 能否認(rèn)為σ ≤ σ0?
解:? (1). 的問題就是檢驗H0: σ2?=σ02;H1: σ2?≠σ02.?其中,n=5,a =0.05,σ0=0.048.
(2).? 的問題是檢驗H0:?σ2?≤σ02;H1:?σ2?>?σ02.
2、兩正態(tài)總體方差比的 F 檢驗
設(shè)X1, X2, …, Xm和Y1, Y2, …, Yn 分別為抽自正態(tài)總體 N(μ1 , σ12)和 N(μ2?, σ22)的樣本,? 欲檢驗
(1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.
該檢驗主要用于上節(jié)中實施兩樣本 t 檢驗之前,討論 ?σ12?=?σ22?的假設(shè)是否合理。
【思路分析】
因兩總體 N(μ1?, σ12)和 N(μ2?, σ22)的樣本方差S12和S22分別為σ12和σ22的無偏估計。所以,直觀上講,S12/S22 是σ12/σ22 的一個好的估計。
當(dāng)? H0: ?σ12?=?σ22 成立時, ?σ12/σ22=1,? 作為其估計,S12/S22也應(yīng)與 1 相差不大。當(dāng)該值過分地大或過分地小時,都應(yīng)拒絕原假設(shè)成立。
??? 合理的思路是:找兩個界限c1和c2,
● 當(dāng) c1< S12/S22?< c2 時,接受H0;
● 當(dāng) S12/S22?≤ c1, 或 S12/S22?≥ c2 時,? 拒絕H0。
(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22
(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22
結(jié)論同 2。
【例2】甲乙兩廠生產(chǎn)同一種電阻,現(xiàn)從甲乙兩廠的產(chǎn)品中分別隨機(jī)地抽取12個和10個樣品,測得它們的電阻值后,計算出樣本方差分別為S12=1.40,S22=4.38。假設(shè)兩廠生產(chǎn)的電阻的電阻的阻值分別服從正態(tài)分布 ? N(μ1?, σ12)和 N(μ2?, σ22)。在顯著性水平 a = 0.10下, 是否可接受: ??(l).σ12 =σ22;(2).σ12≤σ22. ?
?
轉(zhuǎn)載于:https://www.cnblogs.com/mo-wang/p/4949628.html
總結(jié)
- 上一篇: Android setColor
- 下一篇: 基于Docker搭建GitLab代码管理