日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

决策理论的基本概念

發(fā)布時(shí)間:2024/3/13 编程问答 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 决策理论的基本概念 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.2 決策理論的基本概念

客觀未知

概率模型適合于描述報(bào)酬依賴于有客觀明顯概率的事件(比如拋硬幣,轉(zhuǎn)輪盤等)

主觀未知

概率模型適合于描述報(bào)酬依賴于不明顯明顯概率的事件(比如股市,賽馬等)

基本符號(hào)

對(duì)于有限集合,我們用 Z 表示用 Δ ( Z ) \Delta(Z) Δ(Z) 表示集合 Z 的概率分布集合 即
Δ Z = { q : Z → R ∣ ∑ y ∈ Z q ( y ) = 1 且 q ( z ) ? 0 , ? z ∈ Z } \Delta Z = \{q:Z\to R \mid \sum_{y\in Z}q(y) = 1 且 q(z) \geqslant 0, \forall z\isin Z\} ΔZ={q:ZRyZ?q(y)=1q(z)?0,?zZ}
(按照常規(guī)的集合記號(hào),上述大括號(hào)中的 “ ∣ \mid ” 表示“滿足···的條件”)

以買彩票為例子

  • X 表示由決策者最終可能獲得的彩金所組成的集合
  • Ω \varOmega Ω 表示可能的狀態(tài)所組成的集合,其中之一是世界真實(shí)的狀態(tài)
  • 假設(shè) X Ω \varOmega Ω 都是有限集合
  • 將彩票定義為某個(gè)函數(shù)f,對(duì) X 中的每個(gè)彩金 x 和 Ω \varOmega Ω 中的每一個(gè)狀態(tài)
    f 都給出一個(gè)非負(fù)實(shí)數(shù)
    f ( x ∣ t ) f(x\mid t) f(xt)
    使得對(duì) Ω \varOmega Ω中的每一個(gè)t都有
    ∑ x ∈ X f ( x ∣ t ) = 1 \sum_{x\in X}f(x\mid t)=1 xX?f(xt)=1
  • L表示由所有這樣的彩票所組成的集合,就是
    L = { f : Ω → Δ ( X ) } L = \{f:\varOmega \to \Delta(X)\} L={f:ΩΔ(X)}
    Δ ( X ) 表示集合 X 的概率分布 \Delta(X) 表示集合X的概率分布 Δ(X)表示集合X的概率分布
  • 對(duì) Ω \varOmega Ω 中的任一狀態(tài) tL 中的任一彩票 f,
    f ( ? ∣ t ) f(·\mid t) f(?t)
    表示在狀態(tài) t 下由 f 確定的 X 的概率分布,即 表示在狀態(tài)t下由f確定的X的概率分布,即 表示在狀態(tài)t下由f確定的X的概率分布,即
    f ( ? ∣ t ) = ( f ( x ∣ t ) ) x ∈ X ∈ Δ ( X ) f(·\mid t) = (f(x\mid t))_{x\in X}\isin \Delta(X) f(?t)=(f(xt))xX?Δ(X)
  • 這里的每個(gè)數(shù) f ( x ∣ t ) f(x\mid t) f(xt)都可以被理解為若t是世界的真實(shí)狀態(tài),
    則彩票 f 得到彩金 x 的客觀條件概率是 f ( x ∣ t ) f(x\mid t) f(xt)
    為了使這種解釋合乎情理,狀態(tài)必須被定義的足夠廣泛,以至于包括所有可能影響到所獲得的彩金的 主觀未知事件

    我們假定,根據(jù)彩金集合X的定義,不同彩金之間相互排斥,且窮盡了決策者各種決策的可能結(jié)果。

    事件

    決策者關(guān)于世界真實(shí)狀態(tài)可能擁有的信息可以用一個(gè) 事件(event) 來描述,每個(gè)事件都是 Ω \varOmega Ω 的一個(gè)非空子
    我們用 Ξ \varXi Ξ 來表示所有事件組成的集合,則

    Ξ = { S ∣ S ? Ω 且 S =? ? } \varXi = \{S\mid S\sube \varOmega 且 S\not= \emptyset\} Ξ={SS?ΩS=?}

    對(duì)于L(前面定義的彩票的集合)中的任意兩個(gè)彩票f和g,以及 Ξ \varXi Ξ中的任意事件S,當(dāng)且僅當(dāng)決策者知道了世界真實(shí)狀態(tài)在S中,
    則對(duì)于他來說f至少和g一樣的理想選擇的時(shí)候,我們才得到
    f ? s g f\gtrsim \small s \large g f?sg
    KaTeX \KaTeX KATE?X : 這表示,當(dāng)且僅當(dāng)決策者在只知道事件S已經(jīng)發(fā)生而且又必須在f和g中選擇其中一個(gè)時(shí),
    他自愿選擇了彩票f才有$ f\gtrsim \small s \large g $

    給定的關(guān)系($ f\gtrsim \small s ) 我們可以定義關(guān)系 ( ) 我們可以定義關(guān)系( )我們可以定義關(guān)系(\succ ) 和 ( )和( )(\sim$) 因此

    f ~ s g 當(dāng)且僅當(dāng) f ? s g 且 g ? s f f ? s g 當(dāng)且僅當(dāng) f ? s g 且 g ? s f f \sim \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\gtrsim \small s \normalsize f \\ f \succ \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\nsim \small s \normalsize f fsg當(dāng)且僅當(dāng)f?sgg?sff?sg當(dāng)且僅當(dāng)f?sgg?sf
    這就是說,$f \sim \small s \large g $ 意味著,如果決策者在知道S之后只能在f和g之間選擇,他認(rèn)為二者之間毫無差異;
    f ? s g f \succ \small s \large g f?sg則意味著在同樣的情況下,他嚴(yán)格偏向于f.

    • 第二個(gè)公式解讀

    當(dāng)決策者知道S之后只能在f和g之間選擇,他認(rèn)為二者之間有差異,且偏向于f,則他嚴(yán)格偏向于f

    對(duì)于滿足 0 ≤ α ≤ 1 0\le \alpha \le 1 0α1中的任意一個(gè)數(shù) α \alpha α和L中任意兩個(gè)彩票f與g, α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示L中這樣的彩票,使得
    [ α f + ( 1 ? α ) g ] ( x ∣ t ) = α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) , ? x ∈ X , ? t ∈ Ω \lbrack \alpha f+(1-\alpha )g\rbrack (x\mid t) = \alpha f(x\mid t)+(1-\alpha)g(x\mid t),\\ \forall x \isin X, \forall t\in \varOmega [αf+(1?α)g](xt)=αf(xt)+(1?α)g(xt),?xX,?tΩ

    • 公式解讀

    我們假設(shè)從一個(gè)裝有白色球和黑色球的袋子里面抽取一個(gè)球,袋中黑色球的比例是 α \alpha α,那么白球的比例是 ( 1 ? α ) (1-\alpha) (1?α)
    設(shè)想若取出的是黑球, 則決策者抽取的彩票為f,若取出的是白球,則決策者抽取的彩票為g。
    于是,如果t是真實(shí)的狀態(tài),該決策者最終得到彩票的概率是 α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) \alpha f(x\mid t)+(1-\alpha)g(x\mid t) αf(xt)+(1?α)g(xt)

    • 因而, α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示基于f和g并按照隨機(jī)的彩票選擇過程而產(chǎn)生的復(fù)合彩票。

    對(duì)任意彩金x,我們令 [ x ] \lbrack x\rbrack [x]表示一個(gè)總是一定能給出彩金x的彩票。即,對(duì)每個(gè)狀態(tài)t都有
    [ x ] ( y ∣ t ) = 1 若 y = x , [ x ] ( y ∣ t ) = 0 若 y ≠ x \lbrack x\rbrack (y\mid t)=1 \quad 若y=x, \qquad \lbrack x\rbrack (y\mid t)=0 \quad 若y\neq x [x](yt)=1y=x,[x](yt)=0y=x

    • 因而, α [ x ] + ( 1 ? α ) [ y ] \alpha \lbrack x\rbrack + (1-\alpha)\lbrack y\rbrack α[x]+(1?α)[y] 表示概率 α \alpha α ( 1 ? α ) (1-\alpha) (1?α)給出彩金x和彩金y的彩票

    總結(jié)

    以上是生活随笔為你收集整理的决策理论的基本概念的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。