博弈论的一些例子
囚徒博弈
兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由于證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確鑿,二者都判刑八年。由于囚徒無法信任對方,因此傾向于互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。
智豬博弈
假設豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若小豬先到槽邊,大小豬吃到食物的收益比是6∶4;同時到槽邊,大小豬收益比是7∶3;大豬先到槽邊,大小豬收益比是9∶1。那么,在兩頭豬都有智慧的前提下,最終結果是小豬選擇等待。
在大豬選擇行動的前提下,小豬選擇等待的話,小豬可得到4個單位的純收益,大豬得到的6個單位,付出2個單位的成本,實得4個單位;而小豬和大豬同時行動的話,則它們同時到達食槽,分別得到1個單位和5個單位的純收益(付出4個單位的成本);在大豬選擇等待的前提下,小豬如果行動的話,小豬只能吃到1個單位,則小豬的收入將不抵成本,純收益為-1單位;如果小豬也選擇等待的話,那么小豬的收益為零,成本也為零,總之,小豬等待還是要優于行動。
槍手博弈
彼此痛恨的甲乙丙三個槍手準備決斗。甲槍法最好,十發八中。乙槍法次之,十發六中。丙槍法最差,十發四中。假設他們了解彼此實力,也能做出理性判斷。
問題一:如果三人同時開槍,并且每人只發一槍。第一輪槍戰后,誰活下來的機會大?問題二:如果三人輪流開槍,并且由槍法最差的丙先開槍。
問題一:第一輪槍戰,槍法最差的丙竟然存活概率最大——肯定存活,而槍法好的甲和乙存活概率遠低于丙。如果在第一輪槍戰中甲乙均被擊中,則丙成為最終幸存者;只要甲乙在第一輪槍戰中有一人存活,那最終勝出的很可能是甲和乙中的幸存者。
問題二:因為甲的最佳策略仍然是向乙開槍,乙的最佳策略也仍然是解決甲。經過充分計算,完全理性的他倆會一直死磕下去,直到一人把另一人消滅。而這時正好又輪到丙開槍。雖然丙獨自面對甲或者乙時勝算都不大,但好歹還占據主動,比他選擇一開始就試圖消滅甲或乙要劃算很多。只要丙不打中甲或者乙,在后面的對決中他就處于相對有利的形勢。
臟臉博弈
恍然大悟的博弈。是指一件事一旦在某個群體中成為共同知識,則從任何一個個體出發,他對這件事的理解都已達到了與這個群體的完全統一。
三個人在屋子里,不許說話。美女進來說:你們當中至少一個人臉是臟的。三人相互看一眼,沒有反應。美女又說:“你們知道嗎?”三人再看,頓悟,臉都紅了。為什么?
當只有一張臉是臟的時候,一旦美女宣布至少有一張臉是臟的時候,那么,臉臟的那個人看到兩張干凈的臉,他馬上就會臉紅。而且所有的參與人都知道,如果僅有一張臟臉,臉臟的那個人一定會臉紅。在美女第一次宣布時,三個人中沒有人臉紅,那么每個人就知道至少有兩張臟臉。如果只有兩張臟臉,兩張臟臉的人各自看到一張干凈的,這兩個臟臉的人就會臉紅。而此時如果沒有人臉紅,那么所有人都知道三張臉就是臟的,因此在打量第二眼時所有人都會臉紅。
在博弈的世界里,任何一個博弈者都不可能在行動之前得知另一方的整個計劃。這樣就需要當事人在行動之前就要識破對方的策略從而試試自己的策略。很多時候,你并不能看見自己,沒有條件給你看清自己的處境,這個時候你能做的就是要通過別人的角色來揣測分析自己。
獵鹿博弈
兩個人出去打獵,獵物為鹿和兔,他們互不知道對方選擇的獵物。如果選擇鹿,則需要另一人也選擇鹿,產生合作才能成功狩獵。而選擇兔為獵物,不需要合作也能成功,但是獵兔的收益要小于獵鹿。兩個人合作獵鹿的好處比各自打兔子的好處要大得多,但是要求兩個獵人的能力和貢獻相等。如果一個獵人的能力強、貢獻大,他就會要求得到較大的一份,這可能會讓另一個獵人覺得利益受損而不愿意合作。“合則雙贏”的道理大家都懂,在實際中很難合作的原因就在于此。合作要求博弈雙方學會與對手共贏,充分照顧到合作者的利益。
博傻理論
之所以完全不管某件藝術品的真實價值,即使它一文不值,也愿意花高價買下,是因為你預期會有更大的笨蛋花更高的價格從你手中買走它。而投資成功的關鍵就在于能否準確判斷究竟有沒有比自己更大的笨蛋出現。只要你不是最大的笨蛋,就僅僅是賺多賺少的問題。如果再也找不到愿意出更高價格的更大笨蛋從你手中買走這件藝術品的話,那么,很顯然你就是最大的笨蛋了。
該理論認為,股票市場上的一些投資者根本就不在乎股票的理論價格和內在價值,他們購入股票的原因,只是因為他們相信將來會有更傻的人以更高的價格從他們手中接過“燙山芋”。支持博傻的基礎是投資大眾對未來判斷的不一致和判斷的不同步。對于任何部分或總體消息,總有人過于樂觀估計、也總有人趨向悲觀,有人過早采取行動,而也有人行動遲緩,這些判斷的差異導致整體行為出現差異,并激發市場自身的激勵系統,導致博傻現象的出現。
蜈蚣博弈
由羅森塞爾(Rosenthal)提出的。它是這樣一個博弈:兩個參與者A、B輪流進行策略選擇,可供選擇的策略有“合作”和“背叛”(“不合作”)兩種。
假定A先選,然后是B,接著是A,如此交替進行。A、B之間的博弈次數為有限次,比如100次。假定這個博弈各自的支付給定如下:
合作 合作 合作 合作...合作 合作
A B A B …… AB (100,100)
合作 合作 合作 合作...合作 背叛
A B A B …… AB (98,101)
現在的問題是:A、B是如何進行策略選擇的?
這個博弈因形狀像一只蜈蚣,而被命名成“蜈蚣博弈”。
當A決策時,他考慮博弈的最后一步即第100步;B在“合作”和“背叛”之間作出選擇時,因“合作”給B帶來100的收益,而“ 不合作”帶來101的收益,根據理性人的假定,B會選擇“背叛”。但是,要經過第99步才到第100步,在99步,A考慮到B在100步時會選擇“背叛” ——此時A的收益是98,小于B合作時的100,那么在第99步時,他的最優策略是“背叛”——因為“背叛”的收益99大于“合作”的收益98……如此推論下去,最后的結論是:在第一步A將選擇“不合作”,此時各自的收益為1,遠遠小于大家都采取“合作”策略時的收益:A:100,B:100-99。
當A決策時,他考慮博弈的最后一步即第100步;B在“合作”和“背叛”之間作出選擇時,因“合作”給B帶來100的收益,而“ 不合作”帶來101的收益,根據理性人的假定,B會選擇“背叛”。但是,要經過第99步才到第100步,在99步,A考慮到B在100步時會選擇“背叛” ——此時A的收益是98,小于B合作時的100,那么在第99步時,他的最優策略是“背叛”——因為“背叛”的收益99大于“合作”的收益98……如此推論下去,最后的結論是:在第一步A將選擇“不合作”,此時各自的收益為1,遠遠小于大家都采取“合作”策略時的收益:A:100,B:100-99。
A一開始采取合作性策略的收益有可能為0,但1或者0與100相比實在是太小了。直覺告訴我們采取合作策略是好的。而從邏輯的角度看,一開始A應取不合作的策略。
實驗發現,不會出現一開始選擇“不合作”策略而雙方獲得收益1的情況。雙方會自動選擇合作性策略,從而走向合作。這種做法違反倒推法,但實際上雙方這樣做,要好于一開始A就采取不合作的策略。
斗雞博弈
斗雞博弈其實是Chicken Game的誤譯。Chicken在美國口語中是“懦夫”之意,Chicken Game本應譯成懦夫博弈,斗雞博弈有兩個納什均衡,就是一方勝利,前進一步,一方退縮,做一些讓步。
兩只公雞狹路相逢,即將展開一場撕殺。結果有四種可能:兩只公雞對峙,誰也不讓誰?;蛘邇烧呦喽?。這兩種可能性的結局一樣——兩敗俱傷,這是誰也不愿意的。另兩種可能是一退一進。但退者有損失、丟面子或消耗體力,誰退誰進呢?雙方都不愿退,也知道對方不愿退。在這樣的博弈中,要想取勝,就要在氣勢上壓倒對方,至少要顯示出破釜沉舟、背水一戰的決心來,以迫使對方退卻。但到最后的關鍵時刻,必有一方要退下來,除非真正抱定魚死網破的決心。但把自己放在對方的位置上考慮,如果進的一方給予退的一方以補償?只要這種補償與損失相當,就會有愿意退者。
協和謬誤
當你進行了一項不理性的行動后,應該忘記已經發生的行為和你支付的成本,只要考慮這項活動之后需要耗費的精力和能夠帶來的好處,再綜合評定它能否給自己帶來正效用。比如進行投資時,把目光投向前方,審時度勢,如果發現這項投資并不能贏利,應該及早停掉,不要惋惜已投下去的各項成本:精力、時間、金錢
我們把那些已經發生、不可收回的支出,如時間、金錢、精力稱為“沉沒成本”。沉沒的意思是說,你在正式完成交易之前投入的成本,如果一旦交易不成,就會白白損失掉。但如果對沉沒成本過分眷戀,就會繼續原來的錯誤,造成更大的虧損。
總結
- 上一篇: 文献记录(part67)--基于决策树模
- 下一篇: cdr怎么保存jpg格式(jpg图片怎么