数理统计——随机过程
數理統計——隨機過程
文章目錄
- 數理統計——隨機過程
- 概述
- 隨機過程的定義
- 隨機過程的數字特征
- 典型的隨機過程
- 獨立增量過程
- 泊松過程
- 維納過程
- 馬爾可夫過程
- 定義
- 平穩馬爾可夫鏈
- 小結
概述
這篇博文我們主要探討在通信領域和自然語言處理(Natural Language Processing,NLP)等領域廣泛出現的一個數理統計概念——隨機過程(Stochastic Process)。隨機過程,尤其是其中的馬爾可夫過程,是NLP中應用非常廣泛的經典模型——隱含馬爾可夫模型(Hidden Markov Model,HMM)的理論基礎。由于筆者的研究方向并不在通信領域,因此本文的方向會偏向于為機器學習服務。另外,這篇文章主要是為應用服務的,所以并不會過多地介紹一些數學上的名詞、概念,而是注重理解模型。對細節感興趣的讀者可以參考高等教育出版社浙大第四版《概率論與數理統計》。
隨機過程的定義
隨機過程被認為是概率論的“動力學”部分,也就是說,它的研究對象是隨時間(或者其他因素)演變的隨機現象,需要用一系列甚至無窮多個隨機變量來進行描述。比如下面的例子:
諸如此類的,我們把這種依賴于“時間”ttt變化的一系列隨機變量稱為隨機過程。對于隨機過程,我們還能做進一步分類。在第1個例子中,在任意時刻ttt,都可以用一個隨機變量進行描述,而且這個隨機變量的取值是離散的,我們就稱它為一維離散型隨機過程;而第2個例子中,醉漢在任意時刻的坐標是用兩個連續型隨機變量進行刻畫的,所以我們稱它為二維連續型隨機過程。
此外,根據我們的參數ttt的取值是連續的還是離散的,還能把隨機過程分為連續參數隨機過程和離散參數隨機過程(也叫隨機序列)。上面的例子中,擲骰子的時間是固定的、離散的,是離散參數隨機過程,而醉漢的移動時間是連續的,是連續參數隨機過程。
值得注意的是,在上面兩個例子中,我們的參數ttt都表示時間。實際上,這個ttt可以是多種多樣的,例如序號、距離等,在第一個例子中,如果我們給擲骰子的次數進行標號,構成一個參數集合TTT,那么它還是一個隨機過程,只不過這次依賴的參數被定義為了次數,而不是時間。
隨機過程的數字特征
在數學上,類似多元隨機變量,隨機過程也有其數字特征,它的數字特征一般是參數ttt的函數。
對于一維隨機過程,設在時刻ttt對應的隨機變量為X(t)X(t)X(t),有如下數字特征:
- 均值函數μX(t)=E[X(t)]\mu_X(t)=E[X(t)]μX?(t)=E[X(t)]稱為集平均或統計平均。
- 均方值函數ΨX2(t)=E[X2(t)]\Psi_X^2(t)=E[X^2(t)]ΨX2?(t)=E[X2(t)]
- 方差函數σX2(t)=E{[X(t)?μX(t)]}\sigma_X^2(t)=E\{[X(t)-\mu_X(t)]\}σX2?(t)=E{[X(t)?μX?(t)]}它的算術平方根稱為標準差函數。
- 自相關函數RX(t1,t2)=E[X(t1)X(t2)]R_X(t_1,t_2)=E[X(t_1)X(t_2)]RX?(t1?,t2?)=E[X(t1?)X(t2?)]
- 自協方差函數CX(t1,t2)=E{[X(t1)?μX(t1)][X(t2)?μX(t2)]}C_X(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][X(t_2)-\mu_X(t_2)]\}CX?(t1?,t2?)=E{[X(t1?)?μX?(t1?)][X(t2?)?μX?(t2?)]}簡稱協方差函數。
對于二維隨機過程(X(t),Y(t))(X(t),Y(t))(X(t),Y(t)),有如下數字特征:
- 互相關函數RXY(t1,t2)=E[X(t1)Y(t2)]R_{XY}(t_1,t_2)=E[X(t_1)Y(t_2)]RXY?(t1?,t2?)=E[X(t1?)Y(t2?)]
- 互協方差函數CXY(t1,t2)=E{[X(t1)?μX(t1)][Y(t2)?μY(t2)]}C_{XY}(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][Y(t_2)-\mu_Y(t_2)]\}CXY?(t1?,t2?)=E{[X(t1?)?μX?(t1?)][Y(t2?)?μY?(t2?)]}
對隨機變量的數字特征我只是簡單羅列,并不加以闡釋,有興趣的讀者可以參考我概述部分提到的資料。
典型的隨機過程
獨立增量過程
獨立增量過程是一個非常重要的隨機過程,它在數學上的定義如下:
對任意選定的正整數n和任意選定的0<t1t_1t1?<t2t_2t2?<···<tnt_ntn?,如果對應的n個增量X(t1)?X(0)X(t_1)-X(0)X(t1?)?X(0),···,X(tn)?X(tn?1)X(t_n)-X(t_{n-1})X(tn?)?X(tn?1?)相互獨立,則稱這個隨機過程為獨立增量過程。
簡單地來說,就是隨機過程在不重合的區間上的增量是相互獨立的,它就是獨立增量過程。
另外還有一個概念,如果增量的概率分布只與時間差有關,與具體處于什么時間無關,那么就稱增量具有平穩性,相應的獨立增量過程是齊次的或時齊的。
泊松過程
首先是計數過程的概念,考慮這樣一個例子:假設有很多很多螞蟻要回家,我們用隨機變量N(t)N(t)N(t)來表示從0時刻到ttt時刻回到家的螞蟻數。對于這樣一個隨機過程,它的時間是連續的,隨機變量的取值只能取非負整數,這樣的過程,我們稱為計數過程。
由此引出泊松過程(泊松流)的定義,若一個隨機過程滿足:
那么我們稱{N(t),t≥0N(t),t\geq0N(t),t≥0}是強度為λ\lambdaλ的泊松過程。
從定義中不難看出,之所以稱為泊松過程,是因為它的增量服從泊松分布。當然,這里的強度λ\lambdaλ可以是非均勻的,這里的λ\lambdaλ可以是ttt的函數。
關于泊松分布有如下定理:
- 強度為λ\lambdaλ的泊松過程的點間間距(點間間距是相鄰兩個事件出現的時間差)是獨立同分布的隨機變量,都服從參數為1λ\frac{1}{\lambda}λ1?的指數分布。
該定理的逆定理也成立。
泊松過程是研究排隊理論的工具,在技術領域內又是模擬一類重要噪聲的基礎。
維納過程
維納過程是布朗運動的數學模型,也是一種獨立增量過程。設關于ttt的隨機變量為W(t)W(t)W(t),定義如下:
則稱此過程為維納過程。
馬爾可夫過程
定義
在實際生活中,我們往往會遇到這樣的情況:一件事情,在下一時刻發生的情況僅與現在的情況有關,而與之前發生的情況無關。換句話說,就是“未來”只與“現在”有關,而與“過去”無關。比如下面幾個例子:
- 象棋棋盤上的棋子,在下一回合的位置只與它現在所處的位置有關。
- 商店前的一條隊伍,它在下一時刻的長度只與它現在的長度有關。
我們把這種性質稱為馬爾可夫性或無后效性。具有馬爾可夫性的隨機過程就是馬爾可夫過程。數學上是采用條件概率的方式來定義的:
對于隨機過程X(t)X(t)X(t),如果對參數ttt的任意nnn個取值t1<t2<???<tn,n≥3t_1<t_2<···<t_n,n\geq3t1?<t2?<???<tn?,n≥3,若P{X(tn)∣X(t1),X(t2),???,X(tn?1)}=P{X(tn)∣X(tn?1)}P\{X(t_n)|X(t_1),X(t_2),···,X(t_{n-1})\}=P\{X(t_n)|X(t_{n-1})\}P{X(tn?)∣X(t1?),X(t2?),???,X(tn?1?)}=P{X(tn?)∣X(tn?1?)}則稱該過程為馬爾可夫過程。
考慮我們之前談論到的兩個典型過程可以發現,泊松過程實際上就是時間連續狀態離散的馬爾可夫過程,維納過程是時間和狀態都連續的馬爾可夫過程,時間和狀態都是離散的馬爾可夫過程稱為馬爾可夫鏈。如果馬爾可夫鏈從一個狀態到另一個狀態的概率只與時間差有關,那么我們稱馬爾可夫鏈是平穩的,下面我們來討論平穩馬爾可夫鏈。
平穩馬爾可夫鏈
我們已經知道馬爾可夫鏈是時間和狀態都離散的馬爾可夫過程,因此,我們假設一個馬爾可夫鏈X(t)X(t)X(t)共有kkk個狀態,記作a1,a2,???,aka_1,a_2,···,a_ka1?,a2?,???,ak?,我們把馬爾可夫鏈的狀態發生一次變化稱作一次轉移,我們可以用矩陣來表示馬爾可夫鏈的一步轉移概率:
P=[p11p12???p1kp21p22???p2k???pij???pikpk1pk2???pkk]P= \left[ \begin{matrix} p_{11} & p_{12} & ··· & p_{1k}\\ p_{21} & p_{22} & ··· &p_{2k} \\ ··· & p_{ij} & ··· &p_{ik}\\ p_{k1}&p_{k2}&···&p_{kk} \end{matrix} \right] P=?????p11?p21????pk1??p12?p22?pij?pk2???????????????p1k?p2k?pik?pkk???????其中,pijp_{ij}pij?表示一次轉移中,馬爾可夫鏈從狀態aia_iai?轉移到aja_jaj?的概率。上面的矩陣被稱為一步轉移概率矩陣。由概率論的基本知識可以知道:∑j=1kpij=1\sum_{j=1}^kp_{ij}=1j=1∑k?pij?=1也就是說一步轉移概率矩陣每行元素的和等于1。根據一步轉移概率矩陣,我們可以通過矩陣乘法得出n步轉移概率矩陣:Pn=PnP_n=P^nPn?=Pn其中PnP_nPn?中第iii行第jjj列的元素pij′p'_{ij}pij′?表示的含義為:通過nnn次轉移,馬爾可夫鏈的狀態從aia_iai?變為aja_jaj?的概率。
從上可以看到,一步轉移概率矩陣對于刻畫平穩馬爾可夫鏈非常的重要,實際上,對于使用馬爾可夫鏈的數學模型或是機器學習模型,其最重要的一點就是估算或者確定馬爾可夫鏈的一步轉移概率矩陣。
小結
本文主要是在數學上敘述了隨機過程的概念,以及介紹了在機器學習中應用甚廣的馬爾可夫鏈。更多的內容,我會在介紹HMM時涉及。
總結
以上是生活随笔為你收集整理的数理统计——随机过程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Jmeter作用域
- 下一篇: No fallback instance