日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数理统计——随机过程

發布時間:2023/12/10 编程问答 29 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数理统计——随机过程 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

數理統計——隨機過程

文章目錄

  • 數理統計——隨機過程
    • 概述
    • 隨機過程的定義
    • 隨機過程的數字特征
    • 典型的隨機過程
      • 獨立增量過程
      • 泊松過程
      • 維納過程
    • 馬爾可夫過程
      • 定義
      • 平穩馬爾可夫鏈
    • 小結

概述

這篇博文我們主要探討在通信領域和自然語言處理(Natural Language Processing,NLP)等領域廣泛出現的一個數理統計概念——隨機過程(Stochastic Process)。隨機過程,尤其是其中的馬爾可夫過程,是NLP中應用非常廣泛的經典模型——隱含馬爾可夫模型(Hidden Markov Model,HMM)的理論基礎。由于筆者的研究方向并不在通信領域,因此本文的方向會偏向于為機器學習服務。另外,這篇文章主要是為應用服務的,所以并不會過多地介紹一些數學上的名詞、概念,而是注重理解模型。對細節感興趣的讀者可以參考高等教育出版社浙大第四版《概率論與數理統計》。

隨機過程的定義

隨機過程被認為是概率論的“動力學”部分,也就是說,它的研究對象是隨時間(或者其他因素)演變的隨機現象,需要用一系列甚至無窮多個隨機變量來進行描述。比如下面的例子:

  • 一個人每隔一段時間擲一次骰子,在ttt時刻擲出骰子的點數都可以用一個隨機變量XtX_tXt?來描述。(這一隨機過程也被稱為伯努利過程伯努利隨機序列
  • 一個醉漢在一段時間內的位置坐標,在任意時刻ttt,他的坐標都可以用(Xt,YtX_t,Y_tXt?,Yt?)來描述。
  • 諸如此類的,我們把這種依賴于“時間”ttt變化的一系列隨機變量稱為隨機過程。對于隨機過程,我們還能做進一步分類。在第1個例子中,在任意時刻ttt,都可以用一個隨機變量進行描述,而且這個隨機變量的取值是離散的,我們就稱它為一維離散型隨機過程;而第2個例子中,醉漢在任意時刻的坐標是用兩個連續型隨機變量進行刻畫的,所以我們稱它為二維連續型隨機過程

    此外,根據我們的參數ttt的取值是連續的還是離散的,還能把隨機過程分為連續參數隨機過程離散參數隨機過程(也叫隨機序列)。上面的例子中,擲骰子的時間是固定的、離散的,是離散參數隨機過程,而醉漢的移動時間是連續的,是連續參數隨機過程。

    值得注意的是,在上面兩個例子中,我們的參數ttt都表示時間。實際上,這個ttt可以是多種多樣的,例如序號、距離等,在第一個例子中,如果我們給擲骰子的次數進行標號,構成一個參數集合TTT,那么它還是一個隨機過程,只不過這次依賴的參數被定義為了次數,而不是時間。

    隨機過程的數字特征

    在數學上,類似多元隨機變量,隨機過程也有其數字特征,它的數字特征一般是參數ttt的函數。

    對于一維隨機過程,設在時刻ttt對應的隨機變量為X(t)X(t)X(t),有如下數字特征:

    • 均值函數μX(t)=E[X(t)]\mu_X(t)=E[X(t)]μX?(t)=E[X(t)]稱為集平均統計平均
    • 均方值函數ΨX2(t)=E[X2(t)]\Psi_X^2(t)=E[X^2(t)]ΨX2?(t)=E[X2(t)]
    • 方差函數σX2(t)=E{[X(t)?μX(t)]}\sigma_X^2(t)=E\{[X(t)-\mu_X(t)]\}σX2?(t)=E{[X(t)?μX?(t)]}它的算術平方根稱為標準差函數
    • 自相關函數RX(t1,t2)=E[X(t1)X(t2)]R_X(t_1,t_2)=E[X(t_1)X(t_2)]RX?(t1?,t2?)=E[X(t1?)X(t2?)]
    • 自協方差函數CX(t1,t2)=E{[X(t1)?μX(t1)][X(t2)?μX(t2)]}C_X(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][X(t_2)-\mu_X(t_2)]\}CX?(t1?,t2?)=E{[X(t1?)?μX?(t1?)][X(t2?)?μX?(t2?)]}簡稱協方差函數

    對于二維隨機過程(X(t),Y(t))(X(t),Y(t))(X(t),Y(t)),有如下數字特征:

    • 互相關函數RXY(t1,t2)=E[X(t1)Y(t2)]R_{XY}(t_1,t_2)=E[X(t_1)Y(t_2)]RXY?(t1?,t2?)=E[X(t1?)Y(t2?)]
    • 互協方差函數CXY(t1,t2)=E{[X(t1)?μX(t1)][Y(t2)?μY(t2)]}C_{XY}(t_1,t_2)=E\{[X(t_1)-\mu_X(t_1)][Y(t_2)-\mu_Y(t_2)]\}CXY?(t1?,t2?)=E{[X(t1?)?μX?(t1?)][Y(t2?)?μY?(t2?)]}

    對隨機變量的數字特征我只是簡單羅列,并不加以闡釋,有興趣的讀者可以參考我概述部分提到的資料。

    典型的隨機過程

    獨立增量過程

    獨立增量過程是一個非常重要的隨機過程,它在數學上的定義如下:

    對任意選定的正整數n和任意選定的0<t1t_1t1?<t2t_2t2?<···<tnt_ntn?,如果對應的n個增量X(t1)?X(0)X(t_1)-X(0)X(t1?)?X(0),···,X(tn)?X(tn?1)X(t_n)-X(t_{n-1})X(tn?)?X(tn?1?)相互獨立,則稱這個隨機過程為獨立增量過程。

    簡單地來說,就是隨機過程在不重合的區間上的增量是相互獨立的,它就是獨立增量過程。

    另外還有一個概念,如果增量的概率分布只與時間差有關,與具體處于什么時間無關,那么就稱增量具有平穩性,相應的獨立增量過程是齊次的時齊的

    泊松過程

    首先是計數過程的概念,考慮這樣一個例子:假設有很多很多螞蟻要回家,我們用隨機變量N(t)N(t)N(t)來表示從0時刻到ttt時刻回到家的螞蟻數。對于這樣一個隨機過程,它的時間是連續的,隨機變量的取值只能取非負整數,這樣的過程,我們稱為計數過程

    由此引出泊松過程(泊松流)的定義,若一個隨機過程滿足:

  • 它是計數過程;
  • 它是獨立增量過程;
  • 對任意的t>t0≥0t>t_0\geq0t>t0?0,增量N(t)?N(t0)~π(λ(t?t0))N(t)-N(t_0)\sim\pi(\lambda(t-t_0))N(t)?N(t0?)π(λ(t?t0?))
  • N(0)=0N(0)=0N(0)=0
  • 那么我們稱{N(t),t≥0N(t),t\geq0N(t),t0}是強度為λ\lambdaλ的泊松過程

    從定義中不難看出,之所以稱為泊松過程,是因為它的增量服從泊松分布。當然,這里的強度λ\lambdaλ可以是非均勻的,這里的λ\lambdaλ可以是ttt的函數。

    關于泊松分布有如下定理:

    • 強度為λ\lambdaλ的泊松過程的點間間距(點間間距是相鄰兩個事件出現的時間差)是獨立同分布的隨機變量,都服從參數為1λ\frac{1}{\lambda}λ1?的指數分布。

    該定理的逆定理也成立。

    泊松過程是研究排隊理論的工具,在技術領域內又是模擬一類重要噪聲的基礎。

    維納過程

    維納過程是布朗運動的數學模型,也是一種獨立增量過程。設關于ttt的隨機變量為W(t)W(t)W(t),定義如下:

  • 獨立增量過程;
  • 對任意的t>s≥0t>s\geq0t>s0,增量W(t)?W(s)~N(0,σ2(t?s))W(t)-W(s)\sim N(0,\sigma^2(t-s))W(t)?W(s)N(0,σ2(t?s))
  • W(0)=0W(0)=0W(0)=0,
  • 則稱此過程為維納過程。

    馬爾可夫過程

    定義

    在實際生活中,我們往往會遇到這樣的情況:一件事情,在下一時刻發生的情況僅與現在的情況有關,而與之前發生的情況無關。換句話說,就是“未來”只與“現在”有關,而與“過去”無關。比如下面幾個例子:

    • 象棋棋盤上的棋子,在下一回合的位置只與它現在所處的位置有關。
    • 商店前的一條隊伍,它在下一時刻的長度只與它現在的長度有關。

    我們把這種性質稱為馬爾可夫性無后效性。具有馬爾可夫性的隨機過程就是馬爾可夫過程。數學上是采用條件概率的方式來定義的:

    對于隨機過程X(t)X(t)X(t),如果對參數ttt的任意nnn個取值t1<t2<???<tn,n≥3t_1<t_2<···<t_n,n\geq3t1?<t2?<???<tn?n3,若P{X(tn)∣X(t1),X(t2),???,X(tn?1)}=P{X(tn)∣X(tn?1)}P\{X(t_n)|X(t_1),X(t_2),···,X(t_{n-1})\}=P\{X(t_n)|X(t_{n-1})\}P{X(tn?)X(t1?),X(t2?),???,X(tn?1?)}=P{X(tn?)X(tn?1?)}則稱該過程為馬爾可夫過程。

    考慮我們之前談論到的兩個典型過程可以發現,泊松過程實際上就是時間連續狀態離散的馬爾可夫過程,維納過程是時間和狀態都連續的馬爾可夫過程,時間和狀態都是離散的馬爾可夫過程稱為馬爾可夫鏈。如果馬爾可夫鏈從一個狀態到另一個狀態的概率只與時間差有關,那么我們稱馬爾可夫鏈是平穩的,下面我們來討論平穩馬爾可夫鏈。

    平穩馬爾可夫鏈

    我們已經知道馬爾可夫鏈是時間和狀態都離散的馬爾可夫過程,因此,我們假設一個馬爾可夫鏈X(t)X(t)X(t)共有kkk個狀態,記作a1,a2,???,aka_1,a_2,···,a_ka1?,a2?,???,ak?,我們把馬爾可夫鏈的狀態發生一次變化稱作一次轉移,我們可以用矩陣來表示馬爾可夫鏈的一步轉移概率:
    P=[p11p12???p1kp21p22???p2k???pij???pikpk1pk2???pkk]P= \left[ \begin{matrix} p_{11} & p_{12} & ··· & p_{1k}\\ p_{21} & p_{22} & ··· &p_{2k} \\ ··· & p_{ij} & ··· &p_{ik}\\ p_{k1}&p_{k2}&···&p_{kk} \end{matrix} \right] P=?????p11?p21????pk1??p12?p22?pij?pk2???????????????p1k?p2k?pik?pkk???????其中,pijp_{ij}pij?表示一次轉移中,馬爾可夫鏈從狀態aia_iai?轉移到aja_jaj?的概率。上面的矩陣被稱為一步轉移概率矩陣。由概率論的基本知識可以知道:∑j=1kpij=1\sum_{j=1}^kp_{ij}=1j=1k?pij?=1也就是說一步轉移概率矩陣每行元素的和等于1。根據一步轉移概率矩陣,我們可以通過矩陣乘法得出n步轉移概率矩陣Pn=PnP_n=P^nPn?=Pn其中PnP_nPn?中第iii行第jjj列的元素pij′p'_{ij}pij?表示的含義為:通過nnn次轉移,馬爾可夫鏈的狀態從aia_iai?變為aja_jaj?的概率。

    從上可以看到,一步轉移概率矩陣對于刻畫平穩馬爾可夫鏈非常的重要,實際上,對于使用馬爾可夫鏈的數學模型或是機器學習模型,其最重要的一點就是估算或者確定馬爾可夫鏈的一步轉移概率矩陣

    小結

    本文主要是在數學上敘述了隨機過程的概念,以及介紹了在機器學習中應用甚廣的馬爾可夫鏈。更多的內容,我會在介紹HMM時涉及。

    總結

    以上是生活随笔為你收集整理的数理统计——随机过程的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。