當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

通俗理解博弈论相关术语

發布時間：2023/12/9 编程问答 50 豆豆

生活随笔收集整理的這篇文章主要介紹了通俗理解博弈论相关术语小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

20 世紀著名的諾貝爾經濟學獎得主莎繆爾森（Paul A. Samuelson， 1915-2009）曾經說過：
要想在現代社會做一個有文化的人，必須對博弈論有一個大致的了解。
博弈論中有很多看似復雜的術語，本篇文章就一一對其進行剖析，附上一些案例有助于更好理解。

囚徒困境

囚徒困境是博弈論中最經典的例子：
兩個共謀犯罪的人被關入監獄，不能互相溝通情況。如果兩個人都不揭發對方，則由于證據不確定，每個人都坐牢一年；若一人揭發，而另一人沉默，則揭發者因為立功而立即獲釋，沉默者因不合作而入獄十年；若互相揭發，則因證據確實，二者都判刑五年。

C、D兩人的收益矩陣如下圖所示：

納什均衡

納什均衡指的是這樣一種策略組合，即在給定別人策略的情況下，沒有人愿意單方面改變自己的策略，從而打破這種均衡。

簡單來說，納什均衡就是指當前狀態是對自己的最優狀態，在納什均衡狀態下，改變決策就會讓自己收益降低。

回到上面的囚徒困境的例子，該例子存在一個納什均衡：（D，D）（兩個人都選擇告發)

先看橫行：
假設第一個人選擇D(告發)，那么第二個人只能在藍色方框中進行選擇，對他來說只有兩個選擇，選擇告發D，那么收益-5，選擇不告發，收益為-10，對它來說，選D自然是最好的選擇。

先看縱列：

假設第二個人選擇D(告發)，那么第一個人只能在藍色方框中進行選擇，對他來說只有兩個選擇，選擇告發D，那么收益-5，選擇不告發，收益為-10，對它來說，選D自然是最好的選擇。‘

當兩人都處于告發狀態時，任何一方單方面改變策略，不會讓自己的收益增加，所以D,D狀態就是一個納什均衡。

啟示：
兩人囚徒都選擇告發，集體利益不如都選擇不告發更好，然而，為了讓自己的利益盡可能不受損，它們仍然選擇告發。這就是博弈的威力——猜疑！對于不信任的對方，自己采取的策略往往是最保險的。

合作博弈

合作博弈亦稱為正和博弈，是指博弈雙方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受損害，因而整個集體的利益有所增加。

合作博弈存在的兩個基本條件：
1、對聯盟來說，整體收益大于其每個成員單獨經營時的收益之和。
2、對聯盟內部而言，應存在具有帕累托改進性質的分配規則，即每個成員都能獲得比不加入聯盟時多一些的收益。

合作博弈的例子：董事會投票、超市聯盟

非合作博弈

在參與人利益相互沖突中如何選擇策略使自己的收益最大，即策略選擇問題。是一種不可能達成具有約束力的協議的博弈類型。

典型例子：零和博弈、負和博弈、囚徒博弈

完全信息博弈

指每一參與者都擁有所有其他參與者的特征、策略及收益函數等方面的準確信息的博弈。

不完全信息博弈

參與人并不完全清楚有關博弈的一些信息

典型例子：市場上的討價還價、工作崗位競爭

靜態博弈

指博弈中參與者同時采取行動，或者盡管參與者行動的采取有先后順序，但后行動的人不知道先采取行動的人采取的是什么行動。

典型例子：囚徒博弈

動態博弈

指參與人的行動有先后順序，而且行動在后者可以觀察到行動在先者的選擇，并據此作出相應的選擇。

典型例子：下棋

純策略博弈

在完全信息博弈中，如果在每個給定信息下，只能選擇一種特定策略。

純策略的收益可以用效用表示。

混合策略博弈

在每個給定信息下只以某種概率選擇不同策略。

混合策略的收益只能以期望效用表示。

這類博弈雖然在一次操作中有輸有贏，但將這個博弈多次重復進行，可以研究各個戰略應賦予多大的概率，能獲得最大的期望（平均）收益。

占優策略

在參與人各自的策略集中，如果存在一個與其他競爭對手可能采取的策略無關的最優選擇，則稱其為占優策略。

典型案例：智豬博弈、天塌下來有大個子頂著

簡單來說，占優策略即“不管你怎么做，我所做的都是我能做得最好的。”

帕累托改善/帕累托最優均衡

如果從一種策略組合到另一種策略組合的變化中，在沒有使任何人境況變壞（收益變少）的前提下，使得至少一個人變得更好，這就是帕累托改善。

帕累托最優的狀態就是不可能再有更多的帕累托改善的策略組合；換句話說，不可能再改善某些人的境況，而不使任何其他人受損。

看個例子：

該情況下，A和B都可以是C的帕累托改善，但A不能是B的帕累托改善，因為B變成A，f1的利益增加，f2的利益卻受損。

帕累托最優：在給定現有資源條件下，不存在任何其他配置結果使某些人情況更好，而又不使任何其他人處境更壞。

帕累托最優均衡：滿足帕累托最優條件的均衡。

網絡博弈

網絡博弈指多參與人博弈。

演化博弈：從一個隨機的初始狀態開始，博弈人依次調整自己的策略使自己的收益最大化，整個網絡處于一個演化的過程中。

典型案例：網絡節點最小覆蓋問題

下篇博文將對該問題進行剖析。

總結

以上是生活随笔為你收集整理的通俗理解博弈论相关术语的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：重学java基础第十课:windows快
下一篇： [react] 在react中页面重新加