日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

All-Pay Contests 论文定理推导(博弈论+机制设计)

發布時間:2023/12/16 编程问答 42 豆豆
生活随笔 收集整理的這篇文章主要介紹了 All-Pay Contests 论文定理推导(博弈论+机制设计) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

All-Pay Contests 論文定理推導(博弈論+機制設計)

      • 一、Theorem 1 證明過程
      • 二、Theorem 2 證明過程
      • 三、Corollary 1 證明過程
      • 四、存在的問題

  • 本文針對于全支付競賽(準確來說是標準競賽)提出兩大結論:Theorem 1有關標準競賽中參賽者的均衡收益情況;Theorem 2有關標準競賽中參賽者的均衡參與情況。 Theorem1、2需依賴于均衡存在性定理(原文中Corollary 1)。因此本文證明大體分為三部分。
  • 三部分的證明之間存在聯系。Corollary 1證明獨立,是Theorem1,2成立的基礎。Theorem 1證明依賴于Generic Condition。Theorem 2證明依賴于Generic Condition與Theorem 1。

一、Theorem 1 證明過程

  • 總體來說:Theorem 1的證明分為四部分,提出四個Lemma并分別證明,四個Lemma組合可推出Theorem 1的內容。(基于Generic Condition+均衡存在性)
  • Theorem 1內容:在標準競賽的任意均衡中,每個參賽者的期望收益都等于其power值與0之間的較大值。(NWN_WNW?中參賽者期望收益為power,NLN_LNL?中參賽者期望收益為0。
  • 選擇一個標準競賽以及一個競賽的均衡G=(G1,...,GN)G=(G_1,...,G_N)G=(G1?,...,GN?)。(任意標準競賽均衡存在+任意競賽的任意均衡滿足定理1→\rightarrow定理1得以證明

  • LEAST LEMMA:參賽者在任意均衡GGG中的期望收益至少等于其power與0之間的較大值。
    證明:初始分數的存在使得每位參賽者的收益都大于等于0(NLN_LNL?中參賽者iii選擇分數si∈[ai,ri)s_i\in[a_i,r_i)si?[ai?,ri?),如果獲勝那么期望收益為正,如果失敗那么不如選擇初始分數保證收益為0)。參賽者劃分為NW,NLN_W,N_LNW?,NL?兩部分,NLN_LNL?中參賽者power小于0故已滿足引理。NWN_WNW?中任意參賽者選擇分數max{ai,T+?},?>0max\{a_i,T+\epsilon\},\epsilon>0max{ai?,T+?},?>0都可以打敗NLN_LNL?中所有n?mn-mn?m位參賽者而獲勝(NLN_LNL?中參賽者reach<T,因此不會出價大于等于T)。由此可得:(參賽者iii百分百選擇最高的分數獲勝,伴隨著最大的代價,因此是期望收益的下界
    ui≥vi(max{ai,T+?})→?→0vi(max{ai,T})=wiu_i\ge v_i(max\{a_i,T+\epsilon\})\rightarrow_{\epsilon\rightarrow0}v_i(max\{a_i,T\})=w_i ui?vi?(max{ai?,T+?})?0?vi?(max{ai?,T})=wi?
    由上式可得NWN_WNW?中參賽則期望收益大于等于其power(NWN_WNW?中參賽則的power>0)。綜上,LEAST LEMMA得證。
    作用:證明了任意均衡中所有參賽者期望收益都至少為power與0之間的較大值(定理1的下界部分)。

  • TIE LEMMA:假設在均衡GGG中兩個以上的參賽者為分數xxx分配了概率,也就是說以嚴格正值概率選擇xxx。那么為分數xxx分配了概率的參賽者們如果選擇xxx要么一定一起獲勝要么一定一起失敗。
    證明:為分數xxx分配了概率的參賽者集合為N′,∣N′∣≥2N',|N'|\ge 2N,N2。事件N′N'N中所有參賽者選擇分數xxx定義為EEExxx為獲獎分數并且xxx出現同分數的事件定義為DDDm′m'm個獎項分配給N′N'N∣N′∣|N'|N個參賽者,且1≤m′<∣N′∣1\le m' <|N'|1m<N)。假設DDD有嚴格正值概率,在DDD的基礎上,至少有一位參賽者i∈N′i\in N'iN可以通過選擇略大于xxx的分數從而獲勝。因此事件DDD并不滿足最優響應,換句話說任意均衡中不可能出現事件DDD。因此P(E)=P(EL)+P(EW)P(E)=P(E^L)+P(E^W)P(E)=P(EL)+P(EW),其中,P(EL)P(E^L)P(EL)表示出現事件EEEN′N'N中所有參賽者全部失敗,P(EW)P(E^W)P(EW)表示出現事件EEEN′N'N中所有參賽者全部獲勝,DDD事件不存在均衡中,因此無第三種部分獲勝部分失敗的情況。因此在EEE的基礎上,要么EWE^WEW成立要么ELE^LEL成立。TIE LEMMA得證。
    作用:均衡中可能會有多位參賽者為某個分數附以概率。TIE LEMMA消除了那些平分數參賽者中部分獲勝的情況。均衡中無上述情況有助于確定哪些參賽者的期望收益為0。
    該引理說的是,在均衡中不會出現平局卡在分數xxx上,因為從結果反推的角度,平局中至少有一個參賽者可以略微提高分數從而必勝。但實際上,參賽者不會知道是否會發生平局,因此也無法做出策略調整規避掉平局的均衡?其實還是考慮博弈的過程是否會向著均衡的方向演化

  • ZERO LEMMA:在均衡GGG中,至少有n?mn-mn?m位參賽者針對于他們獲勝概率等于0或者接近于0的情況做出最優響應。這些參賽者期望收益最大是0。
    證明:用JJJ表示某個m+1m+1m+1位參賽者的集合。用S~\tilde{S}S~表示JJJ中參賽者最優響應集合的聯合。sinfs_{inf}sinf?表示S~\tilde{S}S~(笛卡爾積)的下確界。一共有三種情況:(1)JJJ有兩個及以上的參賽者針對分數sinfs_{inf}sinf?附以正值概率。(2)JJJ只有一個的參賽者針對分數sinfs_{inf}sinf?附以正值概率。(3)JJJ沒有參賽者針對分數sinfs_{inf}sinf?附以正值概率。
    情況(1):用N′N'N表示JJJ中針對分數sinfs_{inf}sinf?附以正值概率的參賽者。對于N′N'N中每位參賽者來說不可能成立Pi(sinf)=1P_i(s_{inf})=1Pi?(sinf?)=1,由此根據TIE LEMMA得到:對于N′N'N中每位參賽者來說一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0
    情況(2):用iii來表示JJJ中唯一一個針對分數sinfs_{inf}sinf?附以正值概率的參賽者。Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0一定成立(因為JJJ中其余m位參賽者選擇分數一定大于sinfs_{inf}sinf?)。由此(1)(2)可得:任意m+1位參賽者的集合JJJ中,可能選擇分數下確界的參賽者一定成立Pi(sinf)=0P_i(s_{inf})=0Pi?(sinf?)=0,并且針對獲勝概率為0的情況選擇分數sinfs_{inf}sinf?也是其最優響應。
    情況(3):根據下確界sinfs_{inf}sinf?的定義,一定存在某位參賽者i其最優響應{xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1?接近于sinfs_{inf}sinf?nnn趨向于無窮時,Pi(xn)P_i(x_n)Pi?(xn?)接近于0。
    因為JJJ是任意一個包含m+1位參賽者的集合,因此任意均衡中至少有n-m位參賽者是針對其獲勝概率等于0或接近于0做出的最優響應。類似鴿籠原理,假設只有n-m-1個人成立,那么存在某個m+1個人中沒有人成立)獲勝概率等于0或接近于0,那么期望收益至多為0。
    作用NLN_LNL?n?mn-mn?m位參賽者的任意均衡下期望收益為0。(LEAST LEMMA中得到NWN_WNW?中參賽者期望收益至少為Power,那么n-m個只能是NLN_LNL?中的。

  • THRESHOLD LEMMANWN_WNW?中的參賽者最優響應是接近或者超過threshold,因此期望收益最多為其power值。
    證明:1.對于NL\{m+1}N_L\backslash \{m+1\}NL?\{m+1}中的參賽者來說,其最優響應的上確界為ssup<Ts_{sup}<Tssup?<T。為了證明NWN_WNW?中每位參賽者都為接近或者超過threshold的分數附以了概率,使用反證法。假設存在一位NWN_WNW?中參賽者,沒有為接近或者超過threshold的分數附以概率。那么marginal player可以純策略在范圍(max{am+1,s},T)(max\{a_{m+1},s\},T)(max{am+1?,s},T)中選擇分數從而百分百贏得比賽。此時marginal player期望收益為正,與上面結論相違背。(證明NWN_WNW?中參賽者的最優響應
    2.在NWN_WNW?中任選一位參賽者iii。其最優響應{xn}n=1∞\{x_n\}^\infty _{n=1}{xn?}n=1?接近于某個zi≥Tz_i\ge Tzi?T。根據LEAST LEMMA,vi(xn)>0v_i(x_n)>0vi?(xn?)>0。根據viv_ivi?的連續性,我們可以得到:(證明NWN_WNW?中參賽者的期望收益上界
    ui=ui(xn)=Pi(xn)vi(xn)?(1?Pi(xn))ci(xn)≤vi(xn)→xn→zivi(zi)≤vi(T)=wiu_i=u_i(x_n)=P_i(x_n)v_i(x_n)-(1-P_i(x_n))c_i(x_n)\le v_i(x_n)\\ \rightarrow_{x_n\rightarrow z_i}v_i(z_i)\le v_i(T)=w_i ui?=ui?(xn?)=Pi?(xn?)vi?(xn?)?(1?Pi?(xn?))ci?(xn?)vi?(xn?)xn?zi??vi?(zi?)vi?(T)=wi?
    作用:證明了NWN_WNW?中參賽者期望收益的上界為power。
  • 綜合以上引理及其證明。LEAST LEMMA與THRESHOLD LEMMA共同證明了NWN_WNW?中參賽者所有均衡下期望收益等于其power。TIE LEMMA輔助證明ZERO LEMMA,從而證明了NLN_LNL?中參賽者所有均衡下期望收益等于0。(均在標準競賽的前提下)綜合上述兩點,定理1得證。

二、Theorem 2 證明過程

  • 總體來說:Theorem 2的證明采用反證法,通過假設反面推理與已證明的Theorem 1部分結論產生矛盾。(基于Generic Condition+均衡存在性+Theorem 1)
  • 正常情況下,全支付競賽所有參賽者的初始分數都是0,不存在初始優勢。因此m+1以后的參賽者很少會參與。
  • 每位參賽者的伯努利效用函數除以ui(ai)u_i(a_i)ui?(ai?)后并不影響均衡中所有參賽者的策略表現,(伯努利效用函數為:ui(s)=Pi(s)vi(si)?(1?Pi(s))ci(si)u_i(s)=P_i(s)v_i(s_i)-(1-P_i(s))c_i(s_i)ui?(s)=Pi?(s)vi?(si?)?(1?Pi?(s))ci?(si?)因此利用所有參賽者ui(ai)=1u_i(a_i)=1ui?(ai?)=1的競賽證明即可代表所有競賽。(這也是為何定理2中有正則化
  • 證明方法使用反證法。選擇該競賽中的一個均衡GGG,假設存在某位參賽者i>m+1i>m+1i>m+1滿足定理2的條件并且參與到了競賽中。即
    cm+1(max{am+1,x})vm+1(am+1)<ci(x)vi(ai)for?all?x∈Sivm+1(max{am+1,x})vm+1(am+1)≥vi(x)vi(ai)for?all?x∈Si\frac{c_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}<\frac{c_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ \frac{v_{m+1}(max\{a_{m+1},x\})}{v_{m+1}(a_{m+1})}\ge\frac{v_i(x)}{v_i(a_i)}\text{ for all $x\in S_i$}\\ vm+1?(am+1?)cm+1?(max{am+1?,x})?<vi?(ai?)ci?(x)??for?all?xSi?vm+1?(am+1?)vm+1?(max{am+1?,x})?vi?(ai?)vi?(x)??for?all?xSi?
  • ti=inf{x:Gi(x)=1}<Tt_i=inf\{x:G_i(x)=1\}<Tti?=inf{x:Gi?(x)=1}<Ttit_iti?可理解為參賽者iii混合策略中所選擇分數的最大值,ti≤ri<Tt_i\le r_i<Tti?ri?<T。令ti~=max{am+1,ti}<T\tilde{t_i}=max\{a_{m+1},t_i\}<Tti?~?=max{am+1?,ti?}<T,那么Pi(ti)<1P_i(t_i)<1Pi?(ti?)<1由Threshold引理證明過程可得,NWN_WNW?中m位參賽者選擇分數接近或者超過threshold,參賽者iii最高分數才為ti<Tt_i<Tti?<T,因此不可能必勝),并且對于任意δ>0:Pm+1(ti~+δ)≥Pi(ti)\delta>0:P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)δ>0:Pm+1?(ti?~?+δ)Pi?(ti?)ti~+δ>ti\tilde{t_i}+\delta>t_iti?~?+δ>ti?,在獎項估值相同為1且代價函數遞增的情況下,分數越高獲獎概率越大,也稱為競賽的單調性)(競賽的單調性也是可研究的因素)。因此對于任意δ>0\delta>0δ>0使得ti~+δ<rm+1=T\tilde{t_i}+\delta<r_{m+1}=Tti?~?+δ<rm+1?=T我們有:
    vm+1(ti~+δ)>0≥?cm+1(ti~+δ))v_{m+1}(\tilde{t_i}+\delta)>0\ge -c_{m+1}(\tilde{t_i}+\delta)) vm+1?(ti?~?+δ)>0?cm+1?(ti?~?+δ))
    上式的含義是,參賽者m+1選擇分數ti~+δ\tilde{t_i}+\deltati?~?+δ時代價函數大于等于0且獲勝效用大于0。
  • 我們可以得到:
    um+1≥Pm+1(ti~+δ)vm+1(ti~+δ)?(1?Pm+1(ti~+δ))cm+1(ti~+δ)≥Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)(根據Pm+1(ti~+δ)≥Pi(ti))u_{m+1}\ge P_{m+1}(\tilde{t_i}+\delta)v_{m+1}(\tilde{t_i}+\delta)-(1-P_{m+1}(\tilde{t_i}+\delta))c_{m+1}(\tilde{t_i}+\delta)\\ \ge P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \text{(根據$P_{m+1}(\tilde{t_i}+\delta)\ge P_i(t_i)$)} um+1?Pm+1?(ti?~?+δ)vm+1?(ti?~?+δ)?(1?Pm+1?(ti?~?+δ))cm+1?(ti?~?+δ)Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)(根據Pm+1?(ti?~?+δ)Pi?(ti?))
  • 根據定理2中的定義可得,ci(ti)>cm+1(ti~+δ),vm+1(ti~+δ)≥vi(ti)c_i(t_i)>c_{m+1}(\tilde{t_i}+\delta),v_{m+1}(\tilde{t_i}+\delta)\ge v_i(t_i)ci?(ti?)>cm+1?(ti?~?+δ),vm+1?(ti?~?+δ)vi?(ti?),由此可得:
    Pi(ti)vm+1(ti~+δ)?(1?Pi(ti))cm+1(ti~+δ)>Pi(ti)vi(ti)?(1?Pi(ti))ci(ti)=ui(ti)≥0P_i(t_i)v_{m+1}(\tilde{t_i}+\delta)-(1-P_i(t_i))c_{m+1}(\tilde{t_i}+\delta)\\ \\>P_i(t_i)v_i(t_i)-(1-P_i(t_i))c_i(t_i)=u_i(t_i)\ge 0 Pi?(ti?)vm+1?(ti?~?+δ)?(1?Pi?(ti?))cm+1?(ti?~?+δ)>Pi?(ti?)vi?(ti?)?(1?Pi?(ti?))ci?(ti?)=ui?(ti?)0
  • 由此可得um+1>ui(ti)≥0u_{m+1}>u_i(t_i)\ge 0um+1?>ui?(ti?)0,即um+1>0u_{m+1}>0um+1?>0這有違定理1。(定理1表明um+1=0u_{m+1}=0um+1?=0)根據反證法可得,定理2成立。

三、Corollary 1 證明過程

  • 總體來說:Corollary 1的證明通過特殊化競賽,利用一些現有結論或特殊性質找到一定存在的均衡,再證明該均衡也存在于原競賽中即可。(該部分證明獨立)
  • 推論1:所有的全支付競賽中都存在均衡。
  • 考慮一個競賽CCC與一個受限的競賽C′C'C,其中每位參賽者選擇分數在Si′=[ai,K],K=maxi∈Nri<∞S_i'=[a_i,K],K=max_{i\in N}r_i<\inftySi?=[ai?,K],K=maxiN?ri?<范圍內。(正常競賽每位參賽者的分數選擇范圍是[ai,∞)[a_i,\infty)[ai?,))任何C′C'C中的均衡都是CCC中的均衡(K是所有參賽者最大的reach,選擇大于K的分數一定使得任何參賽者收益為負,不如選擇初始分數收入為0),因此我們只要證明C′C'C中一定存在均衡即可。
  • S?=×i∈NSi′\{(s1,...,sn)∣?i≠j:si=sj}S^*=\times _{i\in N}S_i'\backslash \{(s_1,...,s_n)|\exists i\neq j:s_i=s_j\}S?=×iN?Si?\{(s1?,...,sn?)?i?=j:si?=sj?},換句話說S?S^*S?是所有參賽者備選分數組合然后去掉存在相同分數選擇的情況。根據Simon and Zame的研究成果,存在某種打破平局規則,從而使得C′C'C有一個混合策略均衡GGG。將應用了該種打破平局規則的競賽表示為C~\tilde{C}C~,均衡GGG中參賽者的收益為ui~\tilde{u_i}ui?~?。我們只需證明競賽C~\tilde{C}C~中的均衡GGG也是競賽C′C'C的均衡即可。換句話說,只需證明在C′C'CGGG的混合策略對每位參賽者來說都是最優響應即可。
  • 證明分兩步驟進行。第一步證明在競賽C′C'C中按照均衡GGG的混合策略決策,參賽者的效用等于ui~\tilde{u_i}ui?~?。第二步證明不存在其他分數選擇使參賽者獲得相較于ui~\tilde{u_i}ui?~?的更高收益。綜上GGG中混合策略在競賽C′C'C中也是最優響應,即GGG也是競賽C′C'C的均衡。從而證明了C′C'C中一定存在均衡,從而得到任意全支付競賽中都存在均衡。

四、存在的問題

1.Corollary 1的證明過程中通過特殊化競賽以及利用現有結論證明均衡存在性,請問該方法是否是均衡存在性證明的一貫方法?
2.Tie-Breaking Rule在證明中多次出現,該因素是不是影響競賽表現的一大關鍵因素?有無文章關注于該因素?
3.最優響應為何表示為矩陣序列{xn}n=1∞\{x_n\}^\infty_{n=1}{xn?}n=1??n趨向于無窮的極限代表著什么?

總結

以上是生活随笔為你收集整理的All-Pay Contests 论文定理推导(博弈论+机制设计)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。