日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Peer Pressure(博弈论+机制设计) 论文阅读笔记

發布時間:2023/12/16 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Peer Pressure(博弈论+机制设计) 论文阅读笔记 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Peer Pressure 論文閱讀筆記

      • 一、基本信息
      • 二、文章摘要
      • 三、核心模型
      • 四、本文總結

一、基本信息

  • 題目含義:同伴(鄰居)壓力
  • 作者:Antoni Calvó-Armengol、Matthew O. Jackson

二、文章摘要

  • 以下內容摘自原文摘要部分:
  • 我們提出一種模型,在該模型中代理者關心鄰居的動作并且可以施壓壓力來讓他們采取既定的動作。施加壓力對于施加者來說是代價昂貴的,并且可以通過降低采取動作代價(積極壓力)或者提高不采取動作代價(消極壓力)的方式來逼迫鄰居。我們表明,當行動是策略互補時,采取行動成本較低的代理者會對成本較高的代理者施加壓力,而這種積極的壓力可以改善社會福利。更一般化,我們詳細說明了在壓力中誰會收益、誰會失利,以及明確了哪些環境中施壓可以導致完全帕累托最優的結果,哪些不可以。我們也指出了積極、校級壓力之間的區別。
  • 核心研究問題有:
    1.在施壓機制中誰會獲益?誰會失利
    2.環境對于施壓結果的影響
    3.積極壓力、消極壓力之間的區別

三、核心模型

  • 參與者數量n>=2n>=2n>=2,每位代理者的決策空間是選擇是否參與某項活動xi∈{0,1}x_i\in\{0,1\}xi?{0,1}。代理者的收益依賴于自己的決策以及他人的決策,基礎收益(不包含同伴壓力)定義如下:(其中cic_ici?代表決定參與某項活動的代價)
    vi(xi,x?i)?cixiv_i(x_i,x_{-i})-c_ix_i vi?(xi?,x?i?)?ci?xi?
  • 參與者博弈定義如下:如果決策為0的參與者的收益針對其他人決策是漠不關心的,那么該博弈是一個參與者博弈。在參與者博弈中,決策為1的代理者關心其他人的決策;決策為0的代理者不關心其他人的決策。
  • 模型舉例:NNN個代理者決定是否參加某項游行活動。如果選擇不參加,那么游行活動的成功與否與你無關,獲得固定效用;如果選擇參加,那么需要付出一定的風險代價,并且游行活動的成功概率作為效用,參與的人數越多成功概率越大,效用也就越大。
  • 積極同伴壓力在該模型中是指:降低該代理者選擇動作1的代價。在積極同伴壓力的設定下,代理者的總體效用為:
    vi(xi,x?i)?(ci?∑jpij)xi?∑jpijv_i(x_i,x_{-i})-(c_i-\sum_jp_{ij})x_i-\sum_jp_{ij} vi?(xi?,x?i?)?(ci??j?pij?)xi??j?pij?
  • 消極同伴壓力在該模型中是指:提升該代理者不選擇動作1(也就是選擇動作0)的代價。在消極同伴壓力的設定下,代理者的總體效用為:
    vi(xi,x?i)?cixi?(∑jpij)(1?xi)?∑jpijv_i(x_i,x_{-i})-c_ix_i-(\sum_jp_{ij})(1-x_i)-\sum_jp_{ij} vi?(xi?,x?i?)?ci?xi??(j?pij?)(1?xi?)?j?pij?
  • 無論是積極同伴壓力還是消極同伴壓力,采取動作1與采取動作0的效用差值如下:(分別帶入兩組函數,會發現消項之后結果相同)。分析下式發現,無論是積極、消極同伴壓力,提升被施壓程度都會促使代理者選擇動作1
    di(x?i,p)=vi(1,x?i)?vi(0,x?i)?ci+∑jpjid_i(x_{-i},p)=v_i(1,x_{-i})-v_i(0,x_{-i})-c_i+\sum_jp_{ji} di?(x?i?,p)=vi?(1,x?i?)?vi?(0,x?i?)?ci?+j?pji?
  • 設計為兩階段博弈。第一階段每位代理者決定向其他人施加多少壓力pip_ipi?。第二階段代理者觀察自身壓力做出最優響應決策xix_ixi?。以下四個定義十分重要:
    1.σi(p)\sigma_i(p)σi?(p)表示在觀察到壓力矩陣ppp后第二階段代理者iii選擇動作1的概率。
    2.ui(σ,p)u_i(\sigma,p)ui?(σ,p)表示在壓力矩陣ppp以及策略向量σ\sigmaσ確定后代理者iii的期望效用。
    3.Φi\Phi_iΦi?表示第一階段中iii施壓向量的混合分布。Φ=(Φ1,...,Φn)\Phi=(\Phi_1,...,\Phi_n)Φ=(Φ1?,...,Φn?)。
    4.Ui(Φ,σ)U_i(\Phi,\sigma)Ui?(Φ,σ)表示第一階段的施壓策略組合Φ\PhiΦ以及第二階段的響應策略組合σ\sigmaσ確定后,代理者iii的期望效用。
  • 帕累托完美均衡、最大化均衡、均衡存在性(第一遍沒看懂…有待再次理解)

四、本文總結

  • 本文對同伴壓力的均衡分析提供了基本的存在性結論,明確了了誰對誰施加壓力。結果表明,盡管同伴壓力在某些情況下可以導致帕累托改善,但它并不總會導致完全帕累托有效。此外,積極和消極的同伴壓力之間有明顯的差異。這個模型建議進一步分析同伴壓力中尚未建模的其他現象。

總結

以上是生活随笔為你收集整理的Peer Pressure(博弈论+机制设计) 论文阅读笔记的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。