决策理论的基本概念
1.2 決策理論的基本概念
客觀未知
概率模型適合于描述報(bào)酬依賴于有客觀明顯概率的事件(比如拋硬幣,轉(zhuǎn)輪盤等)
主觀未知
概率模型適合于描述報(bào)酬依賴于不明顯明顯概率的事件(比如股市,賽馬等)
基本符號(hào)
對(duì)于有限集合,我們用 Z 表示用 Δ ( Z ) \Delta(Z) Δ(Z) 表示集合 Z 的概率分布集合 即
Δ Z = { q : Z → R ∣ ∑ y ∈ Z q ( y ) = 1 且 q ( z ) ? 0 , ? z ∈ Z } \Delta Z = \{q:Z\to R \mid \sum_{y\in Z}q(y) = 1 且 q(z) \geqslant 0, \forall z\isin Z\} ΔZ={q:Z→R∣y∈Z∑?q(y)=1且q(z)?0,?z∈Z}
(按照常規(guī)的集合記號(hào),上述大括號(hào)中的 “ ∣ \mid ∣” 表示“滿足···的條件”)
以買彩票為例子
f 都給出一個(gè)非負(fù)實(shí)數(shù)
f ( x ∣ t ) f(x\mid t) f(x∣t)
使得對(duì) Ω \varOmega Ω中的每一個(gè)t都有
∑ x ∈ X f ( x ∣ t ) = 1 \sum_{x\in X}f(x\mid t)=1 x∈X∑?f(x∣t)=1
L = { f : Ω → Δ ( X ) } L = \{f:\varOmega \to \Delta(X)\} L={f:Ω→Δ(X)}
Δ ( X ) 表示集合 X 的概率分布 \Delta(X) 表示集合X的概率分布 Δ(X)表示集合X的概率分布
f ( ? ∣ t ) f(·\mid t) f(?∣t)
表示在狀態(tài) t 下由 f 確定的 X 的概率分布,即 表示在狀態(tài)t下由f確定的X的概率分布,即 表示在狀態(tài)t下由f確定的X的概率分布,即
f ( ? ∣ t ) = ( f ( x ∣ t ) ) x ∈ X ∈ Δ ( X ) f(·\mid t) = (f(x\mid t))_{x\in X}\isin \Delta(X) f(?∣t)=(f(x∣t))x∈X?∈Δ(X)
這里的每個(gè)數(shù) f ( x ∣ t ) f(x\mid t) f(x∣t)都可以被理解為若t是世界的真實(shí)狀態(tài),
則彩票 f 得到彩金 x 的客觀條件概率是 f ( x ∣ t ) f(x\mid t) f(x∣t)
為了使這種解釋合乎情理,狀態(tài)必須被定義的足夠廣泛,以至于包括所有可能影響到所獲得的彩金的 主觀未知事件
我們假定,根據(jù)彩金集合X的定義,不同彩金之間相互排斥,且窮盡了決策者各種決策的可能結(jié)果。
事件
決策者關(guān)于世界真實(shí)狀態(tài)可能擁有的信息可以用一個(gè) 事件(event) 來描述,每個(gè)事件都是 Ω \varOmega Ω 的一個(gè)非空子集。
我們用 Ξ \varXi Ξ 來表示所有事件組成的集合,則
Ξ = { S ∣ S ? Ω 且 S =? ? } \varXi = \{S\mid S\sube \varOmega 且 S\not= \emptyset\} Ξ={S∣S?Ω且S=?}
對(duì)于L(前面定義的彩票的集合)中的任意兩個(gè)彩票f和g,以及 Ξ \varXi Ξ中的任意事件S,當(dāng)且僅當(dāng)決策者知道了世界真實(shí)狀態(tài)在S中,
則對(duì)于他來說f至少和g一樣的理想選擇的時(shí)候,我們才得到
f ? s g f\gtrsim \small s \large g f?sg
KaTeX \KaTeX KATE?X : 這表示,當(dāng)且僅當(dāng)決策者在只知道事件S已經(jīng)發(fā)生而且又必須在f和g中選擇其中一個(gè)時(shí),
他自愿選擇了彩票f才有$ f\gtrsim \small s \large g $
給定的關(guān)系($ f\gtrsim \small s ) 我們可以定義關(guān)系 ( ) 我們可以定義關(guān)系( )我們可以定義關(guān)系(\succ ) 和 ( )和( )和(\sim$) 因此
f ~ s g 當(dāng)且僅當(dāng) f ? s g 且 g ? s f f ? s g 當(dāng)且僅當(dāng) f ? s g 且 g ? s f f \sim \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\gtrsim \small s \normalsize f \\ f \succ \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\nsim \small s \normalsize f f~sg當(dāng)且僅當(dāng)f?sg且g?sff?sg當(dāng)且僅當(dāng)f?sg且g?sf
這就是說,$f \sim \small s \large g $ 意味著,如果決策者在知道S之后只能在f和g之間選擇,他認(rèn)為二者之間毫無差異;
而 f ? s g f \succ \small s \large g f?sg則意味著在同樣的情況下,他嚴(yán)格偏向于f.
- 第二個(gè)公式解讀
當(dāng)決策者知道S之后只能在f和g之間選擇,他認(rèn)為二者之間有差異,且偏向于f,則他嚴(yán)格偏向于f
對(duì)于滿足 0 ≤ α ≤ 1 0\le \alpha \le 1 0≤α≤1中的任意一個(gè)數(shù) α \alpha α和L中任意兩個(gè)彩票f與g, α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示L中這樣的彩票,使得
[ α f + ( 1 ? α ) g ] ( x ∣ t ) = α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) , ? x ∈ X , ? t ∈ Ω \lbrack \alpha f+(1-\alpha )g\rbrack (x\mid t) = \alpha f(x\mid t)+(1-\alpha)g(x\mid t),\\ \forall x \isin X, \forall t\in \varOmega [αf+(1?α)g](x∣t)=αf(x∣t)+(1?α)g(x∣t),?x∈X,?t∈Ω
- 公式解讀
我們假設(shè)從一個(gè)裝有白色球和黑色球的袋子里面抽取一個(gè)球,袋中黑色球的比例是 α \alpha α,那么白球的比例是 ( 1 ? α ) (1-\alpha) (1?α)。
設(shè)想若取出的是黑球, 則決策者抽取的彩票為f,若取出的是白球,則決策者抽取的彩票為g。
于是,如果t是真實(shí)的狀態(tài),該決策者最終得到彩票的概率是 α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) \alpha f(x\mid t)+(1-\alpha)g(x\mid t) αf(x∣t)+(1?α)g(x∣t)
- 因而, α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示基于f和g并按照隨機(jī)的彩票選擇過程而產(chǎn)生的復(fù)合彩票。
對(duì)任意彩金x,我們令 [ x ] \lbrack x\rbrack [x]表示一個(gè)總是一定能給出彩金x的彩票。即,對(duì)每個(gè)狀態(tài)t都有
[ x ] ( y ∣ t ) = 1 若 y = x , [ x ] ( y ∣ t ) = 0 若 y ≠ x \lbrack x\rbrack (y\mid t)=1 \quad 若y=x, \qquad \lbrack x\rbrack (y\mid t)=0 \quad 若y\neq x [x](y∣t)=1若y=x,[x](y∣t)=0若y=x
- 因而, α [ x ] + ( 1 ? α ) [ y ] \alpha \lbrack x\rbrack + (1-\alpha)\lbrack y\rbrack α[x]+(1?α)[y] 表示概率 α \alpha α和 ( 1 ? α ) (1-\alpha) (1?α)給出彩金x和彩金y的彩票
總結(jié)
- 上一篇: CSP 201609-3 炉石传说
- 下一篇: 网络编程之什么是计算机网络