當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

决策理论的基本概念

發(fā)布時(shí)間：2024/3/13 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了决策理论的基本概念小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1.2 決策理論的基本概念

客觀未知

概率模型適合于描述報(bào)酬依賴于有客觀明顯概率的事件（比如拋硬幣，轉(zhuǎn)輪盤等）

主觀未知

概率模型適合于描述報(bào)酬依賴于不明顯明顯概率的事件（比如股市，賽馬等）

基本符號(hào)

對(duì)于有限集合，我們用 Z 表示用 $\Delta(Z)$ 表示集合 Z 的概率分布集合即
$\Delta Z = \{q:Z\to R \mid \sum_{y\in Z}q(y) = 1 且 q(z) \geqslant 0, \forall z\isin Z\}$
(按照常規(guī)的集合記號(hào)，上述大括號(hào)中的 “ $\mid$ ” 表示“滿足···的條件”)

以買彩票為例子

令 X 表示由決策者最終可能獲得的彩金所組成的集合

令

\varOmega

表示可能的狀態(tài)所組成的集合，其中之一是世界真實(shí)的狀態(tài)

假設(shè) X 和

\varOmega

都是有限集合

將彩票定義為某個(gè)函數(shù)f,對(duì) X 中的每個(gè)彩金 x 和

\varOmega

中的每一個(gè)狀態(tài)
f 都給出一個(gè)非負(fù)實(shí)數(shù)

f(x\mid t)

使得對(duì)

\varOmega

中的每一個(gè)t都有

\sum_{x\in X}f(x\mid t)=1

令L表示由所有這樣的彩票所組成的集合，就是

\{f:\varOmega \to \Delta(X)\}

\Delta(X) 表示集合X的概率分布

對(duì)

\varOmega

中的任一狀態(tài) t 和 L 中的任一彩票 f,

f(·\mid t)

表示在狀態(tài) t 下由 f 確定的 X 的概率分布，即

f(·\mid t) = (f(x\mid t))_{x\in X}\isin \Delta(X)

這里的每個(gè)數(shù) $f(x\mid t)$ 都可以被理解為若t是世界的真實(shí)狀態(tài)，
則彩票 f 得到彩金 x 的客觀條件概率是 $f(x\mid t)$
為了使這種解釋合乎情理，狀態(tài)必須被定義的足夠廣泛，以至于包括所有可能影響到所獲得的彩金的主觀未知事件

我們假定，根據(jù)彩金集合X的定義，不同彩金之間相互排斥，且窮盡了決策者各種決策的可能結(jié)果。

事件

決策者關(guān)于世界真實(shí)狀態(tài)可能擁有的信息可以用一個(gè) 事件(event) 來描述，每個(gè)事件都是 $\varOmega$ 的一個(gè)非空子集。
我們用 $\varXi$ 來表示所有事件組成的集合，則

$\varXi = \{S\mid S\sube \varOmega 且 S\not= \emptyset\}$

對(duì)于L(前面定義的彩票的集合)中的任意兩個(gè)彩票f和g，以及 $\varXi$ 中的任意事件S，當(dāng)且僅當(dāng)決策者知道了世界真實(shí)狀態(tài)在S中,
則對(duì)于他來說f至少和g一樣的理想選擇的時(shí)候，我們才得到
$f\gtrsim \small s \large g$
$\KaTeX$ : 這表示，當(dāng)且僅當(dāng)決策者在只知道事件S已經(jīng)發(fā)生而且又必須在f和g中選擇其中一個(gè)時(shí)，
他自愿選擇了彩票f才有$ f\gtrsim \small s \large g $

給定的關(guān)系($ f\gtrsim \small s $) 我們可以定義關(guān)系 ($ \succ $) 和 ($ \sim$) 因此

$\sim \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\gtrsim \small s \normalsize f \\ f \succ \small s \large g \tiny \qquad 當(dāng)且僅當(dāng) \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\nsim \small s \normalsize f$
這就是說，$f \sim \small s \large g $ 意味著，如果決策者在知道S之后只能在f和g之間選擇，他認(rèn)為二者之間毫無差異；
而 $\succ \small s \large g$ 則意味著在同樣的情況下，他嚴(yán)格偏向于f.

第二個(gè)公式解讀

當(dāng)決策者知道S之后只能在f和g之間選擇，他認(rèn)為二者之間有差異，且偏向于f,則他嚴(yán)格偏向于f

對(duì)于滿足 $0\le \alpha \le 1$ 中的任意一個(gè)數(shù) $\alpha$ 和L中任意兩個(gè)彩票f與g, $\alpha f+(1-\alpha )g$ 表示L中這樣的彩票，使得
$\lbrack \alpha f+(1-\alpha )g\rbrack (x\mid t) = \alpha f(x\mid t)+(1-\alpha)g(x\mid t),\\ \forall x \isin X, \forall t\in \varOmega$

公式解讀

我們假設(shè)從一個(gè)裝有白色球和黑色球的袋子里面抽取一個(gè)球，袋中黑色球的比例是 $\alpha$ ，那么白球的比例是 $(1-\alpha)$ 。
設(shè)想若取出的是黑球，則決策者抽取的彩票為f,若取出的是白球，則決策者抽取的彩票為g。
于是，如果t是真實(shí)的狀態(tài)，該決策者最終得到彩票的概率是 $\alpha f(x\mid t)+(1-\alpha)g(x\mid t)$

因而， $\alpha f+(1-\alpha )g$ 表示基于f和g并按照隨機(jī)的彩票選擇過程而產(chǎn)生的復(fù)合彩票。

對(duì)任意彩金x，我們令 $\lbrack x\rbrack$ 表示一個(gè)總是一定能給出彩金x的彩票。即，對(duì)每個(gè)狀態(tài)t都有
$\lbrack x\rbrack (y\mid t)=1 \quad 若y=x, \qquad \lbrack x\rbrack (y\mid t)=0 \quad 若y\neq x$

因而， $\alpha \lbrack x\rbrack + (1-\alpha)\lbrack y\rbrack$ 表示概率 $\alpha$ 和 $(1-\alpha)$ 給出彩金x和彩金y的彩票

總結(jié)

以上是生活随笔為你收集整理的决策理论的基本概念的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： CSP 201609-3 炉石传说
下一篇：网络编程之什么是计算机网络