日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

高等数理统计(二)

發(fā)布時(shí)間:2023/12/10 编程问答 24 豆豆
生活随笔 收集整理的這篇文章主要介紹了 高等数理统计(二) 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

引言

  【比較官方的簡(jiǎn)介】數(shù)理統(tǒng)計(jì)學(xué)是一門以概率論為基礎(chǔ),應(yīng)用性很強(qiáng)的學(xué)科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機(jī)性的數(shù)據(jù),以便對(duì)所考察的問題作出正確的推斷和預(yù)測(cè),為采取正確的決策和行動(dòng)提供依據(jù)和建議。數(shù)理統(tǒng)計(jì)不同于一般的資料統(tǒng)計(jì),它更側(cè)重于應(yīng)用隨機(jī)現(xiàn)象本身的規(guī)律性進(jìn)行資料的收集、整理和分析。

  【簡(jiǎn)單的講】,就是通過樣本分析來推斷整體。

  【意義或者重要性】在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)是非常重要的。怎樣挖掘數(shù)據(jù)內(nèi)部的規(guī)律或者隱含的信息,變得尤為重要。當(dāng)時(shí)我們是不可能獲得整體的數(shù)據(jù)的,所以我們只能通過抽取樣本,進(jìn)而通過樣本來推斷整體的規(guī)律。

  【目錄】

  第一章、樣本與統(tǒng)計(jì)量

    一、引言:

    二、總體與樣本:

    三、統(tǒng)計(jì)量:

    四、常用分布:

  第二章、參數(shù)估計(jì)

    一、引言:

    二、點(diǎn)估計(jì)——矩估計(jì)法

    三、點(diǎn)估計(jì)——極大似然估計(jì)

    四、估計(jì)量的優(yōu)良性準(zhǔn)則

    五、區(qū)間估計(jì)——正態(tài)分布

      1、引入

      2、單個(gè)正態(tài)總體參數(shù)的區(qū)間估計(jì)

      3、兩個(gè)正態(tài)總體的區(qū)間估計(jì)

    六、區(qū)間估計(jì)——非正態(tài)分布:

      1、大樣本正態(tài)近似法

      2、二項(xiàng)分布

      3、泊松分布

  第三章、假設(shè)檢驗(yàn)

    一、引言:

    二、正態(tài)總體均值的假設(shè)檢驗(yàn)

      1、單正態(tài)總體 N(μ, σ2)均值 μ?的檢驗(yàn)

        (1) 雙邊檢驗(yàn) H0: μ = μ0;H1: μ≠μ0?

        (2) 單邊檢驗(yàn) H0: μ = μ0;H1: μ>μ0

      2、兩個(gè)正態(tài)總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較

        (1) 雙邊檢驗(yàn) H0:?μ1?=?μ2;H1:?μ1μ2?

?       ? (2) 單邊檢驗(yàn) H0:?μ1?>=?μ2;H1:?μ1<μ2?

        (3) 單邊檢驗(yàn) H0:?μ1?<=?μ2;H1:?μ1>μ2?

    三、正態(tài)總體方差的檢驗(yàn)

      1、單個(gè)正態(tài)總體方差的?χ2 檢驗(yàn)

        (1) H0: σ2?=σ02;H1: σ2?≠σ02

        (2) H0: σ2?=σ02;H1: σ2?>σ02

        (3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)

      2、兩正態(tài)總體方差比的?F 檢驗(yàn)

         (1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.

        ?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22

        ?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22

?

第二章、參數(shù)估計(jì)

  本講首先介紹參數(shù)矩估計(jì)的基本思想以及求矩估計(jì)的步驟,給出多個(gè)求參數(shù)矩估計(jì)的例子;然后介紹參數(shù)極大似然估計(jì)的基本原理,求極大似然估計(jì)的基本方法,給出多個(gè)求參數(shù)極大似然矩估計(jì)的例子。

一、引言:

  數(shù)理統(tǒng)計(jì)的任務(wù): ● 總體分布類型的判斷; ● 總體分布中未知參數(shù)的推斷(參數(shù)估計(jì)與 假設(shè)檢驗(yàn))。

  【參數(shù)估計(jì)】設(shè)總體 X 的分布函數(shù)為 F( x, θ ),其中θ 為未知參數(shù)或參數(shù)向量,現(xiàn)從該總體中抽樣,得到樣本X1, X2 , … , Xn .依樣本對(duì)參數(shù)θ 做出估計(jì),或估計(jì)參數(shù) θ ? 的某個(gè)已知函數(shù) g(θ ) 。這類問題稱為參數(shù)估計(jì)。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)

  為估計(jì)參數(shù) μ,需要構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量 T( X1, X2 , … , Xn ), 一旦當(dāng)有了樣本,就將樣本值代入到該統(tǒng)計(jì)量中,算出一個(gè)值作為 μ 的估計(jì),稱該計(jì)算值為 μ 的一個(gè)點(diǎn)估計(jì)

【尋求估計(jì)量的方法】

  1. 矩估計(jì)法

  2. 極大似然法

  3. 最小二乘法

  4. 貝葉斯方法 …

  我們僅介紹前面的兩種參數(shù)估計(jì)法 。

二、點(diǎn)估計(jì)——矩估計(jì)法

  矩估計(jì)是基于“替換”思想建立起來的一種參數(shù)估計(jì)方法 。最早由英國(guó)統(tǒng)計(jì)學(xué)家 K. 皮爾遜 提出。其思想是: 用同階、同類的樣本矩來估計(jì)總體矩

?

【步驟】

設(shè)總體 X 的分布函數(shù)中含 k 個(gè)未知參數(shù)?θ12,...,θk。

步驟一:記總體 X 的 m 階原點(diǎn)矩 E(Xm)為 am , m ?= 1,2,…,k.

一般地, am (m = 1, 2, …, K) 是總體分布中參數(shù)或參數(shù)向量 (θ12,...,θk) 的函數(shù)。

故, am (m=1, 2, …, k) 應(yīng)記成:?am12,...,θk), m =1, 2, …, k.

步驟二:算出樣本的 m 階原點(diǎn)矩

步驟三:令

??得到關(guān)于 θ12,...,θk?的方程組(L≥k)。一般要求方程組(1)中有 k 個(gè)獨(dú)立方程

步驟四:解方程組(1), 并記其解為

這種參數(shù)估計(jì)法稱為參數(shù)的矩估計(jì)法,簡(jiǎn)稱矩法。

?【例題】

?

【優(yōu)缺點(diǎn)】

矩估計(jì)的優(yōu)點(diǎn)是:簡(jiǎn)單易行, 不需要事先知道總體是什么分布

缺點(diǎn)是:當(dāng)總體的分布類型已知時(shí),未充分利用分布所提供的信息;此外,一般情形下,矩估計(jì)不具有唯一性

?

三、點(diǎn)估計(jì)——極大似然估計(jì)

  極大似然估計(jì)法是在總體的分布類型已知前提下,使用的一種參數(shù)估計(jì)法 。該方法首先由德國(guó)數(shù)學(xué)家高斯于 1821年提出,其后英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)歇于 1922年發(fā)現(xiàn)了這一方法,研究了方法的一些性質(zhì),并給出了求參數(shù)極大似然估計(jì)一般方法——極大似然估計(jì)原理

1、極大似然估計(jì)原理

  設(shè)總體 X 的分布 (連續(xù)型時(shí)為概率密度,離散型時(shí)為概率分布) 為 f(x, θ) , ?X1,X2,…,Xn 是抽自總體 X 的簡(jiǎn)單樣本。于是,樣本的聯(lián)合概率函數(shù) (連續(xù)型時(shí)為聯(lián)合概率密度,離散型時(shí)為聯(lián)合概率分布)

假定現(xiàn)在我們觀測(cè)到一組樣本 X1, X2, …, ?Xn,要去估計(jì)未知參數(shù)θ 。一種直觀的想法是:哪個(gè)參數(shù)(多個(gè)參數(shù)時(shí)是哪組參數(shù)) 使得現(xiàn)在的出現(xiàn)的可能性 (概率) 最大,哪個(gè)參數(shù)(或哪組參數(shù))就作為參數(shù)的估計(jì)。這就是極大似然估計(jì)原理

如果

,?稱 ?為θ 的極大似然估計(jì) (MLE)。

【極大似然估計(jì)(MLE)的一般步驟】

1、 由總體分布導(dǎo)出樣本的聯(lián)合概率函數(shù)(連 續(xù)型時(shí)為聯(lián)合概率密度, 離散型時(shí)為聯(lián)合 概率分布);

2、把樣本的聯(lián)合概率函數(shù)中的自變量看成 已知常數(shù), 參數(shù)θ 看成自變量, 得到似然 函數(shù) L(θ );

3、求似然函數(shù) L(θ ) 的最大值點(diǎn) (常常轉(zhuǎn)化 為求ln L(θ )的最大值點(diǎn)) ,即 θ 的MLE;

4、在最大值點(diǎn)的表達(dá)式中,代入樣本值, 就得參數(shù) θ 的極大似然估計(jì)。

【兩點(diǎn)說明】

● ?求似然函數(shù) L(θ ) 的最大值點(diǎn),可應(yīng)用微積分中的技巧。由于 ?ln(x) ?是 x 的增函數(shù),所以 ln L(θ ) 與 L(θ ?) 在 θ ?的同一點(diǎn)處達(dá)到各自的最大值。假定 θ 是一實(shí)數(shù), ?ln L(θ )是 θ 的一個(gè)可微函數(shù)。通過求解似然方程

?可以得到 θ ? 的MLE。

● 用上述方法求參數(shù)的極大似然估計(jì)有時(shí)行不通,這時(shí)要用極大似然原理來求 。

【例題】例1: 設(shè)X1, X2, …, Xn是取自總體 X~B(1, p) 的一個(gè)樣本,求參數(shù) p 的極大似然估計(jì)。

?

四、估計(jì)量的優(yōu)良性準(zhǔn)則:

  從前面兩節(jié)(矩估計(jì)和極大似然)的討論中可以看到:

  ● 同一參數(shù)可以有幾種不同的估計(jì),這時(shí)就需要判斷采用哪一種估計(jì)為好的問題。

  ● 另一方面,對(duì)于同一個(gè)參數(shù),用矩法和極大似然法即使得到的是同一個(gè)估計(jì), 也存在衡量這個(gè)估計(jì)優(yōu)劣的問題

  估計(jì)量的優(yōu)良性準(zhǔn)則就是:評(píng)價(jià)一個(gè)估計(jì)量“好”與“壞”的標(biāo)準(zhǔn)

1、無偏性:


【例如】若?Θ?指的是正態(tài)總體N(μ , s2)的均值m,則其一切可能取值范圍是(-∞,∞)。若?Θ 指的是方差s2,則其一切可能取值范圍是(0,∞)

?

【例題】正態(tài)分布的無偏估計(jì)

注意:E(X2) = Var (X) + [ E(X)]2 ? ?(具體詳見高等數(shù)理統(tǒng)計(jì)(一)——>?三、統(tǒng)計(jì)量?——> 1、隨機(jī)變量的數(shù)字特征:?——>?(2)方差)

均方誤差準(zhǔn)則

五、區(qū)間估計(jì)——正態(tài)分布:

1、引入:

  前面討論了參數(shù)的點(diǎn)估計(jì)。點(diǎn)估計(jì)就是利用樣本計(jì)算出的值 (即實(shí)軸上點(diǎn)) 來估計(jì)未知參數(shù)。其優(yōu)點(diǎn)是:可直地告訴人們? “未知參數(shù)大致是多少”缺點(diǎn)是:并未反映出估計(jì)的誤差范圍 (精度)。故,在使用上還有不盡如人意之處。而區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這一不足之處

【例如】在估計(jì)正態(tài)總體均值 μ 的問題中,若根據(jù)一組實(shí)際樣本,得到 μ 的極大似然估計(jì)為 10.12。實(shí)際上,μ 的真值可能大于10.12,也可能小于10.12。

  一個(gè)可以想到的估計(jì)辦法是:給出一個(gè)區(qū)間,并告訴人們?cè)搮^(qū)間包含未知參數(shù) μ 的可靠度 (也稱置信系數(shù))

  也就是說,給出一個(gè)區(qū)間,使我們能以一定的可靠度相信區(qū)間包含參數(shù) μ 。

  這里的“可靠度”是用概率來度量的,稱為置信系數(shù),常用?1- α?表示 (0 <?α <1)

  置信系數(shù)的大小常根據(jù)實(shí)際需要來確定,通常取0.95或0.99,即?α=0.05或0.01。

???

  為確定置信區(qū)間,我們先回顧前面給出的隨機(jī)變量的上α 分位點(diǎn)的概念。

詳見第一章的【常用分布】。現(xiàn)在回到尋找置信區(qū)間問題上來。

【置信區(qū)間的定義】

?

2、單個(gè)正態(tài)總體參數(shù)的區(qū)間估計(jì):

(1)σ2 已知時(shí),對(duì)μ的區(qū)間估計(jì):正態(tài)分布

【例1】某廠生產(chǎn)的零件長(zhǎng)度 X 服從 N(?μ , 0.04),現(xiàn)從該廠生產(chǎn)的零件中隨機(jī)抽取6個(gè),長(zhǎng)度測(cè)量值如下(單位:毫米):

??? 14.6,? 15.l,? 14.9,? 14.8,? 15.2,? 15.1.

  求:μ 的置信系數(shù)為0.95的區(qū)間估計(jì)。?

(2)μ、σ2?未知時(shí),對(duì)μ的區(qū)間估計(jì):T分布

?

【例2】為估計(jì)一物體的重量μ,將其稱量10次,得到重量的測(cè)量值 (單位:? 千克) 如下:

10.l, 10.0, 9.8, 10.5, 9.7, l0.l, 9.9, 10.2, 10.3, 9.9.

設(shè)它們服從正態(tài)分布 N(μ ,?σ2)。求μ 的置信系數(shù)為0.95的置信區(qū)間。

?

(3)μ、σ2?未知時(shí),σ2?的區(qū)間估計(jì):卡方分布

?

【例3(續(xù)例2)】σ2的置信系數(shù)為0.95的置信區(qū)間。

3、兩個(gè)正態(tài)總體的區(qū)間估計(jì):

  在實(shí)際應(yīng)用中,經(jīng)常會(huì)遇到兩個(gè)正態(tài)總體的區(qū)間估計(jì)問題。例如:考察一項(xiàng)新技術(shù)對(duì)提高產(chǎn)品的某項(xiàng)質(zhì)量指標(biāo)的作用,將實(shí)施新技術(shù)前的產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體 N(μ1, σ12),實(shí)施新技術(shù)后產(chǎn)品質(zhì)量指標(biāo)看成正態(tài)總體 N(μ2, σ22)。于是,評(píng)價(jià)新技術(shù)的效果問題,就歸結(jié)為研究?jī)蓚€(gè)正態(tài)總體均值之差 μ12 的問題

【定理1】設(shè) X1, X2, ···, Xm是抽自正態(tài)總體X 的簡(jiǎn)單樣本,X~N(μ1,?σ12),樣本均值與樣本方差為

Y1, Y2, ···, Yn 是抽自正態(tài)總體 Y 的簡(jiǎn)單樣本,Y ~N(μ2,?σ22),樣本均值與樣本方差為

當(dāng)兩樣本相互獨(dú)立時(shí),有:

I、σ12、σ22 已知時(shí):

【重要】均值相消,方差累加

?

利用該定理,我們可以得到 μ12 的置信系數(shù)為 1-α 的置信區(qū)間:

【例1】(比較棉花品種的優(yōu)劣):假設(shè)用甲、乙兩種棉花紡出的棉紗強(qiáng)度分別為 X~N(μ1, 2.182)和Y ~N(μ2, 1.762)。試驗(yàn)者從這兩種棉紗中分別抽取樣本 X1, X2 ,…, X200 和 Y1, Y2, …, Y100,樣本均值分別為:。求?μ12的置信系數(shù)為 0.95 的區(qū)間估計(jì)。 ?

II、當(dāng)σ12、σ22 未知時(shí),但假設(shè)σ12222:

證明:

利用該定理,我們可以得到 μ12 的置信系數(shù)為 1-α 的置信區(qū)間:

?

、區(qū)間估計(jì)——非正態(tài)分布:

  1、大樣本正態(tài)近似法

  前面兩節(jié)討論了正態(tài)總體分布參數(shù)的區(qū)間估計(jì)。但是在實(shí)際應(yīng)用中,我們有時(shí)不能判斷手中的數(shù)據(jù)是否服從正態(tài)分布,或者有足夠理由認(rèn)為它們不服從正態(tài)分布。這時(shí),只要樣本大小 n 比較大,總體均值 μ 的置信區(qū)間仍可用正態(tài)總體情形的公式(如下),所不同的是:這時(shí)的置信區(qū)間是近似的

?【證明】

  這是求一般總體均值的一種簡(jiǎn)單有效的方法,其理論依據(jù)是中心極限定理,它要求樣本大小 n 比較大。因此,這個(gè)方法稱為大樣本方法

  設(shè)總體均值為 μ,? 方差為σ2 ,? X1, X2, …, Xn 為來自總體的樣本。因?yàn)檫@些樣本獨(dú)立同分布的,根據(jù)中心極限定理,對(duì)充分大的 n, 下式近似成立

  因而,近似地有

  于是, μ 的置信系數(shù)約為1-α 的置信區(qū)間為

  當(dāng)σ2未知時(shí),用σ2的某個(gè)估計(jì),如 S2 來代替,(T分布,具體同【五、區(qū)間估計(jì)——正態(tài)分布】小節(jié))得到

  只要 n 很大,(2)式所提供的置信區(qū)間在應(yīng)用上是令人滿意的。

  那么,n? 究竟多大才算很大呢?

  顯然,對(duì)于相同的 n ,?? (2)式所給出的置信區(qū)間的近似程度隨總體分布與正態(tài)分布的接近程度而變化,因此,理論上很難給出 n 很大的一個(gè)界限。但許多應(yīng)用實(shí)踐表明:當(dāng) n≥30時(shí),近似程度是可以接受的;當(dāng) n≥50時(shí),近似程度是很好的

  【例1】某公司欲估計(jì)自己生產(chǎn)的電池壽命。現(xiàn)從其產(chǎn)品中隨機(jī)抽取 50 只電池做壽命試驗(yàn)。這些電池壽命的平均值為 2.266 ?(單位:100小時(shí)),標(biāo)準(zhǔn)差 S=1.935。求該公司生產(chǎn)的電池平均壽命的置信系數(shù)為 95% 的置信區(qū)間。

  【解】查正態(tài)分布表,得 zα /2= z0.025=1.96,由公式 (2),得電池平均壽命的置信系數(shù)為 95% 的置信區(qū)間為

  2、二項(xiàng)分布:

  設(shè)事件 A 在一次試驗(yàn)中發(fā)生的概率為 p, 現(xiàn)在做 n 次試驗(yàn),以Yn記事件 A 發(fā)生的次數(shù),則 Yn ~ B(n, p)。依中心極限定理,對(duì)充分大的 n,近似地有

?

  (3)式是(1)式的特殊情形。即近似認(rèn)為: Yn ~ N ( np,np(1-p) ) ?——> ?Yn = (Yn - np ) / sqrt( np(1-p) )~ N ( 0,1 )

?

  (4)式就是二項(xiàng)分布參數(shù) p 的置信系數(shù)約為1-α 的置信區(qū)間。

【證明】

【例2】商品檢驗(yàn)部門隨機(jī)抽查了某公司生產(chǎn)的產(chǎn)品100件,發(fā)現(xiàn)其中合格產(chǎn)品為84件,試求該產(chǎn)品合格率的置信系數(shù)為0.95的置信區(qū)間。

  解:n=100,? Yn=84,? α =0.05,? zα/2=1.96,? 將這些結(jié)果代入到(4)式,得 p 的置信系數(shù)為0.95的近似置信區(qū)間為 [0.77, 0.91]。

【例3】在環(huán)境保護(hù)問題中,? 飲水質(zhì)量研究占有重要地位, 其中一項(xiàng)工作是檢查飲用水中是否存在某種類型的微生物。假設(shè)在隨機(jī)抽取的100份一定容積的水樣品中有20份含有這種類型的微生物。試求同樣容積的這種水含有這種微生物的概率? p 的置信系數(shù)為0.90的置信區(qū)間。

  解:n=100,? Yn=20,? α =0.10,? zα/2=1.645,? 將這些結(jié)果代入到(4)式,得 p 的置信系數(shù)為0.90的近似置信區(qū)間為 [0.134, 0.226]。

?

  3、泊松分布 ?

【例4】公共汽車站在一單位時(shí)間內(nèi) (如半小時(shí),或1小時(shí), 或一天等) 到達(dá)的乘客數(shù)服從泊松分布 P(λ),? 對(duì)不同的車站,? 所不同的僅僅是參數(shù)λ? 的取值不同。現(xiàn)對(duì)一城市某一公共汽車站進(jìn)行了100個(gè)單位時(shí)間的調(diào)查。這里單位時(shí)間是20 分鐘。計(jì)算得到每 20 分鐘內(nèi)來到該車站的乘客數(shù)平均值為 15.2 人。試求參數(shù) λ 的置信系數(shù)為 95%的置信區(qū)間。

  解: n=100,? α =0.05,? zα/2=1.96, ? ? 將這些結(jié)果代入到 (5) 式,? 得 λ 的置信系數(shù)為0.95的近似置信區(qū)間為 [14.44, 15.96]。

轉(zhuǎn)載于:https://www.cnblogs.com/mo-wang/p/4855617.html

總結(jié)

以上是生活随笔為你收集整理的高等数理统计(二)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。