當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

All-Pay Contests 论文定理推导（博弈论+机制设计）

發布時間：2023/12/16 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 All-Pay Contests 论文定理推导（博弈论+机制设计）小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

All-Pay Contests 論文定理推導（博弈論+機制設計）

- - 一、Theorem 1 證明過程
  - 二、Theorem 2 證明過程
  - 三、Corollary 1 證明過程
  - 四、存在的問題

本文針對于全支付競賽（準確來說是標準競賽）提出兩大結論：Theorem 1有關標準競賽中參賽者的均衡收益情況；Theorem 2有關標準競賽中參賽者的均衡參與情況。 Theorem1、2需依賴于均衡存在性定理（原文中Corollary 1）。因此本文證明大體分為三部分。
三部分的證明之間存在聯系。Corollary 1證明獨立，是Theorem1,2成立的基礎。Theorem 1證明依賴于Generic Condition。Theorem 2證明依賴于Generic Condition與Theorem 1。

一、Theorem 1 證明過程

總體來說：Theorem 1的證明分為四部分，提出四個Lemma并分別證明，四個Lemma組合可推出Theorem 1的內容。（基于Generic Condition+均衡存在性）
Theorem 1內容：在標準競賽的任意均衡中，每個參賽者的期望收益都等于其power值與0之間的較大值。（ $N_W$ 中參賽者期望收益為power， $N_L$ 中參賽者期望收益為0。）
選擇一個標準競賽以及一個競賽的均衡 $G=(G_1,...,G_N)$ 。（任意標準競賽均衡存在+任意競賽的任意均衡滿足定理1 $→\rightarrow$ 定理1得以證明）

LEAST LEMMA：參賽者在任意均衡 $G$ 中的期望收益至少等于其power與0之間的較大值。
證明：初始分數的存在使得每位參賽者的收益都大于等于0（ $N_L$ 中參賽者 $i$ 選擇分數 $si∈[ai,ri)s_i\in[a_i,r_i)$ ，如果獲勝那么期望收益為正，如果失敗那么不如選擇初始分數保證收益為0）。參賽者劃分為 $N_W,N_L$ 兩部分， $N_L$ 中參賽者power小于0故已滿足引理。 $N_W$ 中任意參賽者選擇分數 $max{ai,T+?},?>0max\{a_i,T+\epsilon\},\epsilon>0$ 都可以打敗 $N_L$ 中所有 $n ? m$ 位參賽者而獲勝（ $N_L$ 中參賽者reach<T，因此不會出價大于等于T）。由此可得：（參賽者 $i$ 百分百選擇最高的分數獲勝，伴隨著最大的代價，因此是期望收益的下界）
$ui≥vi(max{ai,T+?})→?→0vi(max{ai,T})=wiu_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i$
由上式可得 $N_W$ 中參賽則期望收益大于等于其power（ $N_W$ 中參賽則的power>0）。綜上，LEAST LEMMA得證。
作用：證明了任意均衡中所有參賽者期望收益都至少為power與0之間的較大值（定理1的下界部分）。

TIE LEMMA：假設在均衡 $G$ 中兩個以上的參賽者為分數 $x$ 分配了概率，也就是說以嚴格正值概率選擇 $x$ 。那么為分數 $x$ 分配了概率的參賽者們如果選擇 $x$ 要么一定一起獲勝要么一定一起失敗。
證明：為分數 $x$ 分配了概率的參賽者集合為 $N′,∣N′∣≥2N',|N'|\ge 2$ 。事件 $N^{'}$ 中所有參賽者選擇分數 $x$ 定義為 $E$ 。 $x$ 為獲獎分數并且 $x$ 出現同分數的事件定義為 $D$ （ $m^{'}$ 個獎項分配給 $N^{'}$ 中 $∣ N^{'} ∣$ 個參賽者，且 $1≤m′<∣N′∣1\le m' <|N'|$ ）。假設 $D$ 有嚴格正值概率，在 $D$ 的基礎上，至少有一位參賽者 $i∈N′i\in N'$ 可以通過選擇略大于 $x$ 的分數從而獲勝。因此事件 $D$ 并不滿足最優響應，換句話說任意均衡中不可能出現事件 $D$ 。因此 $P(E)=P(E^L)+P(E^W)$ ，其中， $P(E^L)$ 表示出現事件 $E$ 且 $N^{'}$ 中所有參賽者全部失敗， $P(E^W)$ 表示出現事件 $E$ 且 $N^{'}$ 中所有參賽者全部獲勝， $D$ 事件不存在均衡中，因此無第三種部分獲勝部分失敗的情況。因此在 $E$ 的基礎上，要么 $E^W$ 成立要么 $E^L$ 成立。TIE LEMMA得證。
作用：均衡中可能會有多位參賽者為某個分數附以概率。TIE LEMMA消除了那些平分數參賽者中部分獲勝的情況。均衡中無上述情況有助于確定哪些參賽者的期望收益為0。
（該引理說的是，在均衡中不會出現平局卡在分數 $x$ 上，因為從結果反推的角度，平局中至少有一個參賽者可以略微提高分數從而必勝。但實際上，參賽者不會知道是否會發生平局，因此也無法做出策略調整規避掉平局的均衡？其實還是考慮博弈的過程是否會向著均衡的方向演化）

ZERO LEMMA：在均衡 $G$ 中，至少有 $n ? m$ 位參賽者針對于他們獲勝概率等于0或者接近于0的情況做出最優響應。這些參賽者期望收益最大是0。
證明：用 $J$ 表示某個 $m + 1$ 位參賽者的集合。用 $S~\tilde{S}$ 表示 $J$ 中參賽者最優響應集合的聯合。用 $s_{inf}$ 表示 $S~\tilde{S}$ （笛卡爾積）的下確界。一共有三種情況：（1） $J$ 有兩個及以上的參賽者針對分數 $s_{inf}$ 附以正值概率。（2） $J$ 只有一個的參賽者針對分數 $s_{inf}$ 附以正值概率。（3） $J$ 沒有參賽者針對分數 $s_{inf}$ 附以正值概率。
情況（1）：用 $N^{'}$ 表示 $J$ 中針對分數 $s_{inf}$ 附以正值概率的參賽者。對于 $N^{'}$ 中每位參賽者來說不可能成立 $P_i(s_{inf})=1$ ，由此根據TIE LEMMA得到：對于 $N^{'}$ 中每位參賽者來說一定成立 $P_i(s_{inf})=0$ 。
情況（2）：用 $i$ 來表示 $J$ 中唯一一個針對分數 $s_{inf}$ 附以正值概率的參賽者。 $P_i(s_{inf})=0$ 一定成立（因為 $J$ 中其余m位參賽者選擇分數一定大于 $s_{inf}$ ）。由此(1)(2)可得：任意m+1位參賽者的集合 $J$ 中，可能選擇分數下確界的參賽者一定成立 $P_i(s_{inf})=0$ ，并且針對獲勝概率為0的情況選擇分數 $s_{inf}$ 也是其最優響應。
情況（3）：根據下確界 $s_{inf}$ 的定義，一定存在某位參賽者i其最優響應 ${xn}n=1∞\{x_n\}^\infty _{n=1}$ 接近于 $s_{inf}$ 。當 $n$ 趨向于無窮時， $P_i(x_n)$ 接近于0。
因為 $J$ 是任意一個包含m+1位參賽者的集合，因此任意均衡中至少有n-m位參賽者是針對其獲勝概率等于0或接近于0做出的最優響應。（類似鴿籠原理，假設只有n-m-1個人成立，那么存在某個m+1個人中沒有人成立）獲勝概率等于0或接近于0，那么期望收益至多為0。
作用： $N_L$ 中 $n ? m$ 位參賽者的任意均衡下期望收益為0。（LEAST LEMMA中得到 $N_W$ 中參賽者期望收益至少為Power，那么n-m個只能是 $N_L$ 中的。）

THRESHOLD LEMMA： $N_W$ 中的參賽者最優響應是接近或者超過threshold，因此期望收益最多為其power值。
證明：1.對于 $NL\{m+1}N_L\backslash \{m+1\}$ 中的參賽者來說，其最優響應的上確界為 $s_{sup}<T$ 。為了證明 $N_W$ 中每位參賽者都為接近或者超過threshold的分數附以了概率，使用反證法。假設存在一位 $N_W$ 中參賽者，沒有為接近或者超過threshold的分數附以概率。那么marginal player可以純策略在范圍 $max\{a_{m+1},s\},T)$ 中選擇分數從而百分百贏得比賽。此時marginal player期望收益為正，與上面結論相違背。（證明 $N_W$ 中參賽者的最優響應）
2.在 $N_W$ 中任選一位參賽者 $i$ 。其最優響應 ${xn}n=1∞\{x_n\}^\infty _{n=1}$ 接近于某個 $zi≥Tz_i\ge T$ 。根據LEAST LEMMA， $v_i(x_n)>0$ 。根據 $v_i$ 的連續性，我們可以得到：（證明 $N_W$ 中參賽者的期望收益上界）
$ui=ui(xn)=Pi(xn)vi(xn)?(1?Pi(xn))ci(xn)≤vi(xn)→xn→zivi(zi)≤vi(T)=wiu_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i$
作用：證明了 $N_W$ 中參賽者期望收益的上界為power。
綜合以上引理及其證明。LEAST LEMMA與THRESHOLD LEMMA共同證明了 $N_W$ 中參賽者所有均衡下期望收益等于其power。TIE LEMMA輔助證明ZERO LEMMA，從而證明了 $N_L$ 中參賽者所有均衡下期望收益等于0。（均在標準競賽的前提下）綜合上述兩點，定理1得證。

二、Theorem 2 證明過程

總體來說：Theorem 2的證明采用反證法，通過假設反面推理與已證明的Theorem 1部分結論產生矛盾。（基于Generic Condition+均衡存在性+Theorem 1）
正常情況下，全支付競賽所有參賽者的初始分數都是0，不存在初始優勢。因此m+1以后的參賽者很少會參與。
每位參賽者的伯努利效用函數除以 $u_i(a_i)$ 后并不影響均衡中所有參賽者的策略表現，（伯努利效用函數為： $u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)$ ）因此利用所有參賽者 $u_i(a_i)=1$ 的競賽證明即可代表所有競賽。（這也是為何定理2中有正則化）
證明方法使用反證法。選擇該競賽中的一個均衡 $G$ ，假設存在某位參賽者 $i > m + 1$ 滿足定理2的條件并且參與到了競賽中。即
$cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai)for?all?x∈Sivm+1(max{am+1,x})vm+1(am+1)≥vi(x)vi(ai)for?all?x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\$
令 $t_i=inf\{x:G_i(x)=1\}<T$ 。 $t_i$ 可理解為參賽者 $i$ 混合策略中所選擇分數的最大值， $ti≤ri<Tt_i\le r_i<T$ 。令 $ti~=max{am+1,ti}<T\tilde{t_i}=max\{a_{m+1},t_i\}<T$ ，那么 $P_i(t_i)<1$ （由Threshold引理證明過程可得， $N_W$ 中m位參賽者選擇分數接近或者超過threshold，參賽者 $i$ 最高分數才為 $t_i<T$ ，因此不可能必勝），并且對于任意 $δ>0:Pm+1(ti~+δ)≥Pi(ti)\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$ （ $ti~+δ>ti\tilde{t_i}+\delta>t_i$ ，在獎項估值相同為1且代價函數遞增的情況下，分數越高獲獎概率越大，也稱為競賽的單調性）（競賽的單調性也是可研究的因素）。因此對于任意 $δ>0\delta>0$ 使得 $ti~+δ<rm+1=T\tilde{t_i}+\delta<r_{m+1}=T$ 我們有：
$vm+1(ti~+δ)>0≥?cm+1(ti~+δ))v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta))$
上式的含義是，參賽者m+1選擇分數 $ti~+δ\tilde{t_i}+\delta$ 時代價函數大于等于0且獲勝效用大于0。
我們可以得到：
$um+1≥Pm+1(ti~+δ)vm+1(ti~+δ)?(1?Pm+1(ti~+δ))cm+1(ti~+δ)≥Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)(根據Pm+1(ti~+δ)≥Pi(ti))u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根據$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)}$
根據定理2中的定義可得， $ci(ti)>cm+1(ti~+δ),vm+1(ti~+δ)≥vi(ti)c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)$ ，由此可得：
$Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)>Pi(ti)vi(ti)?(1?Pi(ti))ci(ti)=ui(ti)≥0P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0$
由此可得 $um+1>ui(ti)≥0u_{m+1}>u_i(t_i)\ge 0$ ，即 $u_{m+1}>0$ 這有違定理1。（定理1表明 $u_{m+1}=0$ ）根據反證法可得，定理2成立。

三、Corollary 1 證明過程

總體來說：Corollary 1的證明通過特殊化競賽，利用一些現有結論或特殊性質找到一定存在的均衡，再證明該均衡也存在于原競賽中即可。（該部分證明獨立）
推論1：所有的全支付競賽中都存在均衡。
考慮一個競賽 $C$ 與一個受限的競賽 $C^{'}$ ，其中每位參賽者選擇分數在 $Si′=[ai,K],K=maxi∈Nri<∞S_i'=[a_i,K],K=max_{i\in N}r_i<\infty$ 范圍內。（正常競賽每位參賽者的分數選擇范圍是 $[ai,∞)[a_i,\infty)$ ）任何 $C^{'}$ 中的均衡都是 $C$ 中的均衡（K是所有參賽者最大的reach，選擇大于K的分數一定使得任何參賽者收益為負，不如選擇初始分數收入為0），因此我們只要證明 $C^{'}$ 中一定存在均衡即可。
令 $S?=×i∈NSi′\{(s1,...,sn)∣?i≠j:si=sj}S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}$ ，換句話說 $S^*$ 是所有參賽者備選分數組合然后去掉存在相同分數選擇的情況。根據Simon and Zame的研究成果，存在某種打破平局規則，從而使得 $C^{'}$ 有一個混合策略均衡 $G$ 。將應用了該種打破平局規則的競賽表示為 $C~\tilde{C}$ ，均衡 $G$ 中參賽者的收益為 $ui~\tilde{u_i}$ 。我們只需證明競賽 $C~\tilde{C}$ 中的均衡 $G$ 也是競賽 $C^{'}$ 的均衡即可。換句話說，只需證明在 $C^{'}$ 中 $G$ 的混合策略對每位參賽者來說都是最優響應即可。
證明分兩步驟進行。第一步證明在競賽 $C^{'}$ 中按照均衡 $G$ 的混合策略決策，參賽者的效用等于 $ui~\tilde{u_i}$ 。第二步證明不存在其他分數選擇使參賽者獲得相較于 $ui~\tilde{u_i}$ 的更高收益。綜上 $G$ 中混合策略在競賽 $C^{'}$ 中也是最優響應，即 $G$ 也是競賽 $C^{'}$ 的均衡。從而證明了 $C^{'}$ 中一定存在均衡，從而得到任意全支付競賽中都存在均衡。

四、存在的問題

1.Corollary 1的證明過程中通過特殊化競賽以及利用現有結論證明均衡存在性，請問該方法是否是均衡存在性證明的一貫方法？
2.Tie-Breaking Rule在證明中多次出現，該因素是不是影響競賽表現的一大關鍵因素？有無文章關注于該因素？
3.最優響應為何表示為矩陣序列 ${xn}n=1∞\{x_n\}^\infty_{n=1}$ ？n趨向于無窮的極限代表著什么？

總結

以上是生活随笔為你收集整理的All-Pay Contests 论文定理推导（博弈论+机制设计）的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：《人月神话》（The Mythical
下一篇：计算机课包括什么东西,计算机全课程包括什