日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

高等数理统计(一)

發布時間:2023/12/10 编程问答 27 豆豆
生活随笔 收集整理的這篇文章主要介紹了 高等数理统计(一) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

引言

  【比較官方的簡介】數理統計學是一門以概率論為基礎,應用性很強的學科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機性的數據,以便對所考察的問題作出正確的推斷和預測,為采取正確的決策和行動提供依據和建議。數理統計不同于一般的資料統計,它更側重于應用隨機現象本身的規律性進行資料的收集、整理和分析。

  【簡單的講】,就是通過樣本分析來推斷整體。

  【意義或者重要性】在這個大數據時代,數據是非常重要的。怎樣挖掘數據內部的規律或者隱含的信息,變得尤為重要。當時我們是不可能獲得整體的數據的,所以我們只能通過抽取樣本,進而通過樣本來推斷整體的規律。

目錄  

  第一章、樣本與統計量

    一、引言:

    二、總體與樣本:

    三、統計量——隨機變量的數字特征

      1、均值、方差

      2、矩、協方差、相關性與協方差矩陣

      3、距離與相似系數

      4、抽樣分布定理

    四、常用分布:

  第二章、參數估計

    一、引言:

    二、點估計——矩估計法

    三、點估計——極大似然估計

    四、估計量的優良性準則

    五、區間估計——正態分布

      1、引入

      2、單個正態總體參數的區間估計

      3、兩個正態總體的區間估計

    六、區間估計——非正態分布:

      1、大樣本正態近似法

      2、二項分布

      3、泊松分布

  第三章、假設檢驗

    一、引言:

    二、正態總體均值的假設檢驗

      1、單正態總體 N(μ, σ2)均值 μ?的檢驗

        (1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0?

        (2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0

      2、兩個正態總體 N(μ1, σ12) 和? N(μ2, σ22)均值的比較

        (1) 雙邊檢驗 H0:?μ1?=?μ2;H1:?μ1μ2?

?       ? (2) 單邊檢驗 H0:?μ1?>=?μ2;H1:?μ1<μ2?

        (3) 單邊檢驗 H0:?μ1?<=?μ2;H1:?μ1>μ2?

    三、正態總體方差的檢驗

      1、單個正態總體方差的?χ2 檢驗

        (1) H0: σ2?=σ02;H1: σ2?≠σ02

        (2) H0: σ2?=σ02;H1: σ2?>σ02

        (3)? H0:?σ2?≤σ02;H1:?σ2?>?σ02?(同2.)

      2、兩正態總體方差比的?F 檢驗

         (1).? H0: σ12?=?σ22;H1: σ12?≠ ?σ22.

        ?(2) H0: σ12?=?σ22;H1:?? ?σ12>?σ22

        ?(3) H0: σ12?≤?σ22;H1:?? ?σ12>?σ22

?  第四章、回歸分析

    一、引言

二、一元線性回歸 1、一元線性回歸模型       2、回歸系數的最小二乘估計:       3、回歸方程的顯著性檢驗         (1)F 檢驗         (2)T?檢驗      ?   ?(3)相關系數檢驗

      4、估計與預測

        (1)?E(y0)的估計

        (2)?y0的預測區間

?    三、廣義線性回歸模型

?

     四、非線性回歸模型

?  第五章、方差分析

    一、引言

二、單因子方差分析的統計模型 ?     三、平方和分解
    四、參數估計       1、點估計:正態分布的極大似然估計       2、置信區間     五、重復數不等情形     六、多重比較       1、效應差的置信區間       2、之后補充          七、方差齊性檢驗       1、Hartley檢驗

?

第一章、樣本與統計量

  本講首先介紹了樣本與統計量的基本概念,包括:總體、個體、樣本、總體分布與樣本分布;然后介紹了統計量的概念和幾個常見的統計量:樣本均值、方差、標準差、 k 階原點矩和k 階中心矩;最后介紹了抽樣分布的概念與抽樣分布定理

  一、引言:

  由于大量隨機現象必然呈現出其規律性,因而從理論上講,只要對隨機現象進行足夠多次的觀察,隨機現象的規律性就一定能夠清楚地呈現出來。但是,客觀上只允許我們對隨機現象進行次數不多的觀察或試驗,也就是說:我們獲得的只能是局部的或有限的觀察資料(即樣本)

  數理統計的任務就是研究怎樣有效地收集、整理和分析所獲得的有限資料,并對所研究的問題盡可能地給出精確而可靠的推斷。現實世界中存在著形形色色的數據,分析這些數據需要多種多樣的方法。

  因此,數理統計中的方法和支持這些方法的相應理論是相當豐富的。概括起來可以歸納成兩大類。

  參數估計: 根據數據,對分布中的未知參數 進行估計;

  假設檢驗: 根據數據,對分布的未知參數的某種假設進行檢驗。

  參數估計與假設檢驗構成了統計推斷的兩種基本形式,這兩種推斷滲透到了數理統計的每個分支。

  【簡單的講】我們希望通過(有限的)樣本及其統計量等信息去分析樣本(的分布等),進而(通過參數估計和假設檢驗)去推斷和檢證整體的規律。

  二、總體與樣本:

  1、總體、個體與樣本:

  在數理統計中,稱研究問題所涉及對象的全體為總體總體中的每個成員為個體。 例如: 研究某工廠生產的某種產品的廢品率,則這種產品的全體就是總體,而每件產品都是一個個體。

  實際上,我們真正關心的并不一定是總體或個體本身,而真正關心的是總體或個體的某項數量指標。 如:某電子產品的使用壽命,某天的最高氣溫,加工出來的某零件的長度等數量指標。因此,有時也將總體理解為那些研究對象的某項數量指標的全體。

  為評價某種產品質量的好壞,通常的做法是:從全部產品中隨機(任意)地抽取一些樣品進行觀測(檢測),統計學上稱這些樣品為一個樣本。 同樣,我們也將樣本的數量指標稱為樣本。因此,今后當我們說到總體及樣本時,既指研究對象又指它們的某項數量指標

  【例1】研究某地區 N 個農戶的年收人。 在這里,總體既指這 N 個農戶,又指我們所關心的 N個農戶的數量指標──他們的年收入( N 個數字)。 如果從這 N 個農戶中隨機地抽出 n 個農戶作為調查對象,那么,這 n 個農戶以及他們的數量指標──年收入( n個數字)就是樣本。

  【注意】上例中的總體是直觀的,看得見、摸得著的。但是,客觀情況并非總是這樣。如【例2】

  【例2】用一把尺子測量一件物體的長度。 假定 n 次測量值分別為X1,X2 ,…,Xn。顯然,在該問題中,我們把測量值X1,X2 ,…,Xn看成樣本。但總體是什么呢?

  事實上,這里沒有一個現實存在的個體的集合可以作為上述問題的總體。可是,我們可以這樣考慮,既然 n 個測量值 X1,X2?,…,Xn?是樣本,那么,總體就應該理解為一切所有可能的測量值的全體

  又如:為研究某種安眠藥的藥效,讓 n 個病人同時服用這種藥,記錄服藥者各自服藥后的睡眠時間比未服藥時增加睡眠的小時數 X1,X2,…,Xn, 則這些數字就是樣本。 那么,什么是總體呢?

  設想讓某個地區(或某國家,甚至全世界)所有患失眠癥的病人都服用此藥,則他們所增加睡眠的小時數之全體就是研究問題的總體

  2、總體分布

  對一個總體,如果用X表示其數量指標,那么,X的值對不同的個體就取不同的值。因此,如果我們隨機地抽取個體,則X的值也就隨著抽取個體的不同而不同。 所以,X是一個隨機變量! 既然總體是隨機變量X,自然就有其概率分布我們把X的分布稱為總體分布。 總體的特性是由總體分布來刻畫的。因此,常把總體和總體分布視為同義語。

  【例 3 (例 l 續)】在例 l中,若農戶年收入以萬元計,假定 N戶的收入X只取以下各值: 0.5, 0.8, l.0, 1.2和1.5。取上述值的戶數分別n1, n2, n3, n4和n5 (n1+n2+n3+n4+n5=N)。則X為離散型分布,分布律為:

X

0.5

0.8

1

1.2

1.5

p?k

n1/N

n2/N

n3/N

n4/N

n5/N

  【例4 ( 例2續 )】在例2中,假定物體真實長度為μ(未知)。一般說來,測量值X就是總體,取μ 附近值的概率要大一些,而離μ 越遠的值被取到的概率就越小。 如果測量過程沒有系統性誤差,則X取大于μ 和小于μ 的概率也會相等。

  在這種情況下,人們往往認為X 服從均值為μ,方差為σ2正態分布。σ2反映了測量的精度。于是,總體X的分布為 N(μ?,σ2)。

  【說明】這里有一個問題,即物體長度的測量值總是在其真值 μ的附近,它不可能取負值。 而正態分布取值在(-∞,∞)上。那么,怎么可以認為測量值X服從正態分布呢? 回答這個問題,有如下兩方面的理由。

  (1)對于X~N(μ,σ2), P{μ-3σ<X<μ+3σ}=0.9974. 即 X 落在區間(μ-3σ,μ+3σ)之外的概率不超過 0.003, 這個概率非常小。X 落在(μ-4σ,μ+4σ)之外的概率就更小了。

  例如:假定物體長度μ =10厘米,測量誤差為0.01厘米,則σ2=0.012。 這時((μ-3σ,μ+3σ)=(9.97,10.03)。于是,測量值落在這個區間之外的概率最多只有0.003,可忽略不計。 可見,用正態分布 N(10,0.012)去描述測量值X是適當的。完全可認為:X 根本就不可能取到負值;

  (2)另外,正態分布取值范圍是(-∞,∞),這樣還可以解決規定測量值取值范圍上的困難。

  如若不然, 就需要用一個定義在有限區間(a,b)取值的隨機變量來描述測量值X。那么, a和b到底取什么值呢?測量者事先很難確定。 再退一步,即使能夠確定出a和b,卻仍很難找出一個定義在 (a,b) 上的非均勻分布用來恰當地描述測量值。與其這樣,還不如干脆就把取值區間放大到(-∞,∞),并用正態分布來描述測量值。這樣,既簡化了問題,又不致引起較大的誤差。

  【離散分布和連續分布的說明】

  ● 如果總體所包含的個體數量是有限的, 則 稱該總體為有限總體。有限總體的分布顯然是離散型的,如【例3】。

  ● 如果總體所包含的個體數量是無限的,則 稱該總體為無限總體。限總體的分布可以 是連續型的,如【例4】;也可是離散型的。

  但是,在數理統計中,研究有限總體比較困難。因為其分布是離散型的,且分布律與總體中所含個體數量有關系。通常在總體所含個體數量比較大時,將其近似地視為無限總體,并用連續型分布逼近總體的分布,這樣便于進一步地做統計分析。如【例5】

  【例5】研究某大城市年齡在1歲到10歲之間兒童的身高。

  顯然,不管城市規模多大,這個年齡段的兒童數量總是有限的。因此,該總體X只能是有限總體。總體分布只能是離散型分布然而,為便于處理問題,我們將有限總體近似地看成一個無限總體,并用正態分布來逼近這個總體的分布。 當城市比較大,兒童數量比較多時,這種逼近所帶來的誤差,從應用觀點來看,可以忽略不計

?【樣本的二重性】樣本X1,X2,…,Xn既被看成數值,又被看成隨機變量

  ● 假設 X1, X2, …, Xn 是總體X中的樣本,在一 次具體的觀測或試驗中,它們是一批測量值, 是已經取到的一組數。這就是說,樣本具有數的屬性

  ● 由于在具體試驗或觀測中,受各種隨機因素 的影響,在不同試驗或觀測中,樣本取值可 能不同。因此,當脫離特定的具體試驗或觀 測時,我們并不知道樣本 X1,X2,…,Xn 的具 體取值到底是多少。因此,可將樣本看成隨機變量。故樣本又具有隨機變量的屬性。

  【例 6 (例2續)】在前面測量物體長度的例子中,如果我們在完全相同的條件下,獨立地測量了n 次,把這 n 次測量結果,即樣本記為?X1,X2,…,Xn?.

  那么,我們就認為:這些樣本相互獨立,且有相同的分布;其分布與總體分布 N(μ?,σ2)相同

  【將上述結論推廣到一般的分布】如果在相同條件下對總體 X 進行 n 次重復、獨立觀測,就可以認為所獲得的樣本X1,X2,…,Xn是 n 個獨立且與總體 X 有同樣分布的隨機變量。在統計文獻中,通常稱相互獨立且有相同分布的樣本為隨機樣本或簡單樣本, n 為樣本大小或樣本容量

?

  3、樣本分布

  既然樣本 X1,X2,…,Xn?被看作隨機向量,自然需要研究其聯合分布。

  假設總體 X 具有概率密度函數 f (x),因樣本?X1,X2,…,Xn獨立同分布于 X,于是,樣本的聯合概率密度函數(也叫似然函數(likehood))為:

  【例7】 假設某大城市居民的收入 X 服從正態分布N(μ?,σ2), 概率密度為

?

  現從總體 X 中隨機抽取樣本 X1,X2,…,Xn?,因其獨立同分布于總體 X,即: Xi ~ N(μ?,σ2), i=1,2,…,n. 于是,樣本X1,X2,…,Xn 的聯合概率密度為

?

  三、統計量——隨機變量的數字特征

  由樣本推斷總體的某些情況時,需要對樣本進行“加工”,構造出若干個樣本的已知 (確定)的函數,其作用是把樣本中所含的某一方面的信息集中起來。這種不含任何未知參數的樣本的函數稱為統計量。它是完全由樣本所決定的量

  1、均值、方差

  (1)數學期望:

?

  (2)方差:

【總體】

式(1.65)證明如下:方差等于平方均值減去均值的平方

Var(x)= E[ (x-Ex)2]

   = E[x2-2xEx+(Ex)2]

   = E(x2)-2ExEx+E(Ex)2

   =E(x2)-2(Ex)2+(Ex)2

   = E(x2)-[E(x)]2

【樣本】注意方差不是除n,而是(n-1)

?

  (3)幾種常用隨機變量分布的期望和方差:

  2、矩、協方差、相關性與協方差矩陣

  (1)矩與中心化、標準化數據:

  【總體】

  

?

  ?

  【樣本】

  

  

  

  

  

  (2)協方差與相關系數:

?

  (3)協方差矩陣與相關矩陣:

  

  

【協方差矩陣和相關系數矩陣的關系】由二者的定義公式可知,經標準化的樣本數據的協方差矩陣就是原始樣本數據的相關矩陣。?這里所說的標準化指正態化,即將原始數據處理成均值為0,方差為1的標準數據。

  

?

  3、距離與相似系數

  

  

  證明第(3)和(4)條之間的關系】

  

?

  

  

?

  4、抽樣分布

  統計量既然依賴于樣本,而后者又是隨機變量,故統計量也是隨機變量,有一定的分布,這個分布稱為統計量的抽樣分布。 ??

【抽樣分布定理】設 X1,X2,...,Xn是來自均值為μ ,方差為 σ2 的總體的樣本,則當 n 充分大時, 近似地有:

證明如下

【正態分布標準化定理】若X~N(μ,σ2),則 Z = (X-μ)/σ ~ N(0,1)

【中心極限定理】設 X1,X2,...,Xn是來自均值為μ?,方差為?σ2?的總體的樣本,則當 n 充分大時, 近似地有:

?【應用1】可輕易的計算隨機樣本均值的概率分布值

【應用2】

【例1】用機器向瓶子里灌裝液體洗滌劑,規定每瓶裝 μ?毫升。但實際灌裝量總有一定波動。假定灌裝量的方差 σ2=1,如果每箱裝這樣的洗滌劑 25 瓶。求這 25 瓶洗凈劑的平均灌裝量與標定值 μ?相差不超過0.3毫升的概率;又如果每箱裝50瓶時呢?

解:記一箱中 25 瓶洗凈劑灌裝量為 X1,X2,..., X25 是來自均值為μ , 方差為1的總體的隨機樣本。根據抽樣分布定理1,近似地有

?

四、常用分布:

  1、χ2 分布:它是由正態分布派生出來的一種分布。

【定義】 設 X1, X2, …, Xn 相互獨立,且均服從正態分布 N(0, 1), 則稱隨機變量

?服從自由度為 n 的卡方分布,記成χn2

其實卡方分布是一種伽瑪分布(α=n/2,Β=1/2時),詳見【附伽瑪分布和函數內容】

?

【附伽瑪分布和函數內容】具體詳見文章【LDA-math-神奇的Gamma函數】

?其實伽瑪函數可以看成階乘在實數上的擴展。

【性質】如下

對于性質(1),可由正態分布的標準化公式推出,即Zi = (Xi-μ)/σ ~ N(0,1),則Σ(Zi2)符合卡方分布。

對于性質(3),由于卡方分布是伽瑪分布的特殊情況,則可直接由伽瑪分布的均值和方差算出。

?

【分布密度函數】

?

【分布分位點】具體數值可以查表

?

  2、t?分布:

【定義】?設 X ~N(0, 1) , ?Y ~χn2 , ?且 X與Y 相互獨立,則稱隨機變量

?為服從自由度 n 的 t 分布,記為 T ~ tn

可以看出t分布的概率密度函數是偶函數,即 f(t) = f(-t)

t1-α(n) = -tα(n)

?

  3、F分布:

  【性質1】若 X ~ Fm,n,則 Y = X -1 ~ Fn,m

【性質2】

  在通常 F 分布表中,只對α 比較小的值,如α = 0.01, 0.05, 0.025及0.1等列出了分位點。但有時我們也需要知道α?比較大的分位點,它們在 F 分布表中查不到。這時我們就可利用分位點的關系式(1)把它們計算出來。

【例】對m=12, ?n=9, ?α=0.95, ?我們在 F 分布表中查不到 F12,9(0.95),但由(1)式,知

【性質3】若X ~ tn , 則X2 ~ F1,n

  4、正態總體樣本均值與樣本方差的分布

?性質(4)是由性質(1)和(2)共同推出的。定理(1)(2)(4)基本上就是后面參數估計和假設檢驗的核心。

【例】在設計導彈發射裝置時,重要內容之一是研究彈著點偏離目標中心的距離的方差。 對于某類導彈發射裝置,彈著點偏離目標中心的距離服從 N(μ,σ2),這里σ2 = 100米2。 現在進行了25次發射試驗,用 S2 記這25次試驗中彈著點偏離目標中心的距離的樣本方差。 求: S2 超過50米2的概率。

轉載于:https://www.cnblogs.com/mo-wang/p/4851153.html

總結

以上是生活随笔為你收集整理的高等数理统计(一)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。