當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

演化博弈论----gyy参考总结

發布時間：2023/12/9 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了演化博弈论----gyy参考总结小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

演化博弈論----gyy參考總結

生物學家認為，進化就是剔除無效戰略的過程，因此博弈論可以預測進化的結果。

演進穩定戰略（evolutionarily stable strategyy,ESS）

人的理性是有限的，由于受認知能力的限制，有限理性的人類通常是根據習慣、常規以及經驗法則行事，人類不可能如博弈論所描述的那樣，通過復雜的計算來獲得最佳反應戰略。人類懂得學習，具有有限理性。人類的學習和生物的進化史沒有本質區別的，演進穩定戰略適用于有限理性學習的人類。

ESS隱含著復制動態博弈的動態思想。動態學中的研究結果和演進穩定戰略的研究結果是一致的。

結論

（1）ESS是一個納什均衡。在種群生活在演進穩定戰略中時，每種生物所采取的都是最優反應戰略。

（2）由于并非所有的納什均衡在復制動態博弈研究中都是穩定的，所以并非所有的納什均衡都是都是穩定戰略。

博弈論可以有效地運用至非人類領域的研究中。博弈論在生物學應用中的兩個關鍵性概念------演進穩定戰略以及復制動態博弈，同樣也可以研究人類及其戰略的演化過程。

模仿者動態=復制動態=replicator dynamic

演化博弈論

演化博弈論（evolutionary stable strategy）整合了理性經濟學與演化生物學的思想，不再將人模型化為超級理性的博弈方，認為人類通常是通過試錯的方法達到博弈均衡的，與生物演化具有共性，所選擇的均衡是達到均衡的均衡過程的函數，因而歷史、制度因素以及均衡過程的某些細節均會對博弈的多重均衡的選擇產生影響。

演化博弈理論最早源于Fisher，Hamilton，Tfive~等遺傳生態學家對動物和植物的沖突與合作行為的博弈分析，他們研究發現動植物演化結果在多數情況下都可以在不依賴任何理性假設的前提下用博弈論方法來解釋。但直到Smith and Price(1973)在他們發表的創造性論文中首次提出演化穩定策略(evolutionary stable strategy)概念以后，才標志著演化博弈理論的正式誕生。

生態學家Taylor and Jonker(1978)在考察生態演化現象時首次提出了演化博弈理論的基本動態概念——模仿者動態(replicator dynamic)，這是演化博弈理論的又一次突破性發展。模仿者動態與演化穩定策略(RD&ESS)一起構成了演化博弈理論最核心的一對基本概念，它們分別表征演化博弈的穩定狀態和向這種穩定狀態的動態收斂過程，ESS概念的拓展和動態化構成了演化博弈論發展的主要內容。

基于經典博弈論，演化博弈論為研究自然界及人類社會經濟系統中的合作行為提供了一個方便的數學框架。

演化博弈論放棄了經典博弈中 Nash均衡的概念，而引入了演化穩定策略（Evolutionarily Stable Strategy, ESS）的概念。

假設策略I 為 ESS，則必須滿足條件：如幾乎所有的個體（Population）都采取策略I，那么所有采用策略I的個體的適應度要比任何可能的變異策略要大。如不滿足這些條件，變異策略可以入侵種群，那么I將會消減，即變得不穩定。

有了ESS的概念，就可以判斷策略的穩定性。

與傳統的 Nash 均衡相比，ESS 這個概念要更加嚴格一些，因此可用于平衡點選擇。

因為所有的 ESS 必定是 Nash 均衡，但只有嚴格對稱的 Nash均衡才有可能是 ESS。

值得一提的是，這里的ESS是一個“靜態”的概念，其假設只要求表現更好的策略具有更快的復制（增長）速率，并不涉及具體的博弈動力學。

引入了復制動力學的概念（Replicator Dynamics），進一步拓展了演化動力學的研究。

復制動力學的主要假設為給定的策略類型的單位復制率正比于適應度之差。

復制動力學是關于博弈動力學（策略更新）的連續確定性方程，從而可以賦予前面介紹的ESS這一靜態的概念以動力學含義。復制方程在不動點附近的穩定性將對應于策略的演化穩定性（ESS）。?

演化博弈論

-------------------------------------------------------------------------------------------------------------------------------

Smith and Price(1973)在他們發表的創造性論文中首次提出演化穩定策略(evolutionary stable strategy)概念以后，才標志著演化博弈理論的正式誕生。

生態學家Taylor and Jonker(1978)在考察生態演化現象時首次提出了演化博弈理論的基本動態概念——模仿者動態(replicator dy—namic)，這是演化博弈理論的又一次突破性發展。模仿者動態與演化穩定策略(RD&ESS)一起構成了演化博弈理論最核心的一對基本概念，它們分別表征演化博弈的穩定狀態和向這種穩定狀態的動態收斂過程，ESS概念的拓展和動態化構成了演化博弈論發展的主要內容。

演化博弈論與傳統博弈理論不同，演化博弈理論并不要求參與人是完全理性的，也不要求完全信息的條件。

???演化博弈論是把博弈理論分析和動態演化過程分析結合起來的一種理論。在方法論上，它不同于博弈論將重點放在靜態均衡和比較靜態均衡上，強調的是一種動態的均衡。演化博弈理論源于生物進化論，它曾相當成功地解釋了生物進化過程中的某些現象。

對演化博弈論的特征以及基本概念不夠清晰，演化博弈并不是演化的觀點和博弈的思想簡單相加，動態演化的博弈模型也不一定就是演化博弈模型；

理論淵源

?阿爾欽（Alchian，1950）認為，在選擇機制下，即使不把行為主體看作是理性的，但來自社會的演化壓力（優勝劣汰）也將促使每個行為主體采取最適合自身生存的行動，從而使得達到的演化均衡為納什均衡。

納什認為，不需要假設參加者有關于總體博弈結構的充分知識，也不要求參加者有進行任何復雜推理的愿望和能力，只需假定參加者能夠積累關于各種純策略被采用時的相對優勢的實證信息，納什均衡仍可達到。

基本特征

??演化博弈論一般的演化博弈理論具有如下特征：它的研究對象是隨著時間變化的某一群體，理論探索的目的是為了理解群體演化的動態過程，并解釋說明為何群體將達到的這一狀態以及如何達到。影響群體變化的因素既具有一定的隨機性和擾動現象（突變），又有通過演化過程中的選擇機制而呈現出來的規律性。大部分演化博弈理論的預測或解釋能力在于群體的選擇過程，通常群體的選擇過程具有一定的慣性，同時這個過程也潛伏著突變的動力，從而不斷地產生新變種或新特征。

尼爾森-溫特給出了個體在演化過程中的幾個重要特征，我把他們列在下面

1、個體永遠不會完美信息（局部知識或吉爾茲的地方性知識，而不是全局性知識）
2、個體行為受制度（正式和非正式），規范，習俗，意識系統等條件約束
3、個體（或者企業）可以模仿對手
4、開發和模仿（也就是R&D）既有“積聚效應”（可以參考Becker關于“上癮”以及孩子教育的論文）和路徑依賴的效果，又與原創性科學研究相關。
5、個體競爭的結果往往是非均衡的－即敗者出局（被淘汰）
6、個體的特征是非決定性的――這里他們是在反駁“決定論”的批評。同時，演進的結果通常是不可逆的。
7、主流經濟學喜歡討論“潛在的”均衡（也就是往往達不到的，但理論上可能的均衡），而對非均衡狀態的分析要遠比那些均衡來的重要。

--------------摘自演化博弈論簡介

?? ?演化博弈論在經濟學領域的應用與運用演化博弈理論解釋生物進化現象有所不同，演化博弈論中的一些生物進化的概念在經濟學領域中無法應用。 ?演化博弈論在經濟學領域的應用主要是考慮微觀個體在演化的過程中可以學習和模仿其他個體的行為。

一般的演化博弈模型的建立主要基于兩個方面：選擇（Selection）和突變（Mutation）。選擇是指能夠獲得較高支付的策略在以后將被更多的參與者采用；突變是指部分個體以隨機的方式選擇不同于群體的策略（可能是能夠獲得高支付的策略，也可能是獲得較低支付的策略）。突變其實也是一種選擇，但只有好的策略才能生存下來。突變是一種不斷試錯的過程，也是一種學習與模仿的過程，這個過程是適應性且是不斷改進的。不具備這兩個方面的模型不能稱為演化博弈模型。

演化理論中有兩條最重要的機制。一個叫自然選擇，即不是每種生物都有相同的概率在下一期存活。在這個世界上，有些生物個體（或者人）特別幸運，他們能活下去，但還有些個體就倒霉了，他們會被淘汰。我們今天都活著，可見我們的祖先都還是幸運的，他們有后代繼承了他們的基因。我特別要強調自然選擇，對于我們來說是被選擇(be selected)，我們能決定我們的行為和策略，但不能決定我們是否被選擇，那是上帝的事情。嚴復說物競天擇，就是這個意思。

另一種機制叫突變機制(mutant),這保證了種群的變化。如果沒有突變，那么這個世界上存活下來的物種就會越來越少，最后只剩下一種。對于突變機制，我也要強調它是沒有方向性的，可能會提高個體的適應性，但更有可能降低個體的適應性。突變同樣是上帝的選擇，微觀個體無能為力。--------------摘自演化博弈論簡介

比如，艾格則等（Agiza，Hegazi&Elsadany，2001）提出了一個動態演化的博弈模型，它在有限理性的企業都采取一定的行為規則（產量調整機制）下研究企業重復博弈是否可以達到納什均衡。這個模型雖然研究的是有限理性個體和動態演化過程，但不屬于演化博弈模型，因為沒有包含選擇和突變的過程。如果把這個模型作如下修改，便可以看作演化博弈模型：假設企業有許多不同的行為規則，而采用某些行為規則的企業比那些不采用這些行為規則的企業獲益更大；隨著時間的推移，采用這些行為規則的企業生存下來，而不采用這些行為規則的企業被淘汰。這樣修改后的模型既有選擇過程又有突變過程，便成為一個演化博弈模型。

總之，演化博弈模型有如下幾個特征：第一，以參與人群體為研究對象，分析動態的演化過程，解釋群體為何達到以及如何達到這一狀態；第二，群體的演化既有選擇過程也有突變過程；第三，經群體選擇下來的行為具有一定的慣性。

應用優勢

方法論

演化博弈論摒棄了完全理性的假設，以達爾文生物進化論和拉馬克的遺傳基因理論為思想基礎，從系統論出發，把群體行為的調整過程看作為一個動態系統，在其中每個個體的行為及其與群體之間的關系得到了單獨的刻畫。

認識論

演化博弈論對于行為主體采取的是有限理性假設，因此，這些個體不具備博弈論中行為主體的“全知全能”，無法在經濟活動中瞬間能夠獲得最優的結果。

時間的不可逆性

博弈論注重均衡狀態的研究，忽視達到均衡的過程。在博弈論中，行為主體能夠立即對外部環境作出完美判斷，達到均衡狀態。博弈論忽視時間問題，強調行為主體瞬問的均衡，即使考慮時間問題，也把時間看作對稱或可逆的。

在演化博弈論中，時間占有非常重要的地位。行為主體在演化過程中不斷修正和改進自己的行為，模仿成功的策略等等。

隨機因素

在演化博弈模型中，隨機（突變）因素起著關鍵的作用。

選擇機制及均衡

傳統的博弈理論中的行為主體是完全理性的，通常，在完全理性的假設下，如果納什均衡存在，那么博弈雙方博弈一次就可直接達到納什均衡。這個結果不依賴于市場的初始狀態，所以不需要任何的動態調整過程。

而演化博弈論認為，納什均衡的達到應當是在多次博弈后才能達到的，需要有一個動態的調整過程，均衡的達到依賴于初始狀態，是路徑依賴的。

當博弈存在多個納什均衡時，即使假設博弈方都是完全理性的，也無法預測博弈的結果是什么。當存在多個納什均衡時，可以利用后向歸納法來實現對納什均衡的精煉，但這種方法的前提條件是參與人需要滿足一個比完全理性更強的理性假定——序貫理性。（序貫理性是在每個信息集上都必須采取最佳策略，以解決相機行為中的不可信威脅-----動態博弈）。

而在演化博弈理論中，均衡的精煉通過前向歸納法來實現，即參與人根據博弈的歷史來選擇其未來的行為策略，是一個動態的選擇及調整過程。因此，盡管參與人都是有限理性的，但動態的選擇機制將使得在有多個納什均衡存在的情形下達到其中的某一個納什均衡，實現納什均衡的精練。

?復制動力學是選擇過程的顯性模型，它說明種群是如何分配博弈中有聯系的不同純策略隨時間而演化的。

復制動態方程——一種學習機制--------------------------------選自《博弈論與誠信機制》

博弈方學習模仿的速度取決于兩個因素：?

一是模仿對象的數量大小（可用相應類型博弈方的比例表示），這關系到觀察和模仿的難易程度；?

二是模仿對象的成功程度（可用模仿對象得益超過平均得益的幅度表示），這關系到判斷差異的難易程度和對模仿激勵的大小。

最常見的選擇機制動態方程有三類：第一類為正支付動態方程，在這類動態方程中，所有獲得的支付大于群體的平均支付的純策略都有正增長率，所有獲得的支付小于群體的平均支付的純策略都有負增長率；第二類為單調動態方程，在這類動態方程中，若一個純策略或混合策略獲得的支付大于另一個純策略所獲得的支付，則前者的增長率大于后者；第三類為弱正支付動態方程，在這類動態方程中，至少有某些獲得支付比群體的平均支付高的純策略（若存在）有正的增長率。顯然，弱正支付動態方程包含了正支付動態方程和單調動態方程。

????在演化博弈理論中運用最為廣泛的選擇機制動態方程是泰勒和朱克（Taylor&Jonker，1978）提出的復制者動態方程。在復制者動態方程中，純策略的增長率與相對支付或適應度（純策略所獲得的支付與群體的平均支付之差）成正比。顯然，復制者動態方程包括在前三類選擇機制動態方程中。復制者動態方程在經濟領域的應用最為廣泛，學者們運用復制者動態方程對社會習俗、制度、行為規范等一系列社會經濟問題進行了成功的研究。

???怎樣把演化博弈論的基本概念——演化穩定策略與選擇機制動態方程聯系起來呢？是否通過選擇機制所獲得的均衡的精練就是演化穩定策略？從直觀看來，演化穩定策略似乎可以保證均衡是穩定的。但正式的穩定性的定義針對的是動態系統，而不是博弈的支付或適應度函數，并且演化穩定策略只能描述系統的局部動態性質，它不能夠表現均衡與動態的選擇過程之間的關系。因此，演化穩定策略與選擇機制動態方程所達到的動態均衡并不一定是同一個概念。因此，為了更好地描述動態的演化過程，把演化博弈理論中的靜態概念與動態過程統一起來，荷什勒佛（Hirshleifer，1982）提出了演化均衡的概念。按照荷什勒佛的概念，若從使得動態系統的某平衡點的任意小鄰域內出發的軌線最終都演化趨向于該平衡點，則稱該平衡點是局部漸近穩定的，這樣的動態穩定平衡點就是演化均衡（Evolutionary Equilibrium）。

?演化穩定策略是納什均衡的精煉。

演化均衡與演化穩定策略、納什均衡之間的關系是怎樣的呢？弗里德曼（Friedman，1998）指出：

（1）每一個納什均衡都是動態系統的平衡點；

（2）演化均衡一定是納什均衡；

（3）演化穩定策略不一定是演化均衡。

復制者動態方程可以保證演化穩定策略為演化均衡，但在一般的動態方程中演化穩定策略卻既不是演化均衡的充分條件也不是演化均衡的必要條件。弗里德曼還認為，演化博弈論中最為有用、運用最為廣泛的均衡概念并不是演化穩定策略，而是演化均衡。因為行為按照某種動態隨時間變化的假設是合乎情理的。

理論評述

演化博弈論摒棄了完全理性的假設以達爾文生物進化論和拉馬克的遺傳基因理論為思想基礎，從系統論出發，把群體行為的調整過程看作為一個動態系統，在其中每個個體的行為及其與群體之間的關系得到了單獨的刻畫，可以把從個人行為到群體行為的形成機制以及其中涉及到的各種因素都納入到演化博弈模型中去，構成一個具微觀基礎的宏觀模型，因此能夠更真實地反映行為主體的多樣性和復雜性，并且可以為宏觀調控群體行為提供理論依據。

在演化博弈論中，行為主體被假設為程序化地采用某一既定行為，它對于經濟規律或某種成功的行為規則、行為策略的認識是在演化的過程中得到不斷的修正和改進的，成功的策略被模仿，進而產生出一些一般的“規則”和“制度”作為行為主體的行動標準。在這些一般的規則下，行為主體獲得“滿意”的收益。

行為主體在演化過程中不斷修正和改進自己的行為，模成功的策略等等，都需要一個相對較長的時間。演化博弈論認為，時間是不可逆的，過去時間內的狀態與未來時間的狀態是不對稱的，因而，行為主體狀態的演化跟初始的時間狀態息息相關。在演化博弈模型中，隨機(突變)因素起著關鍵的作用，演化過程常被看成是一種試錯的過程。行為人會嘗試各種不同的行為策略，并且每一次都將發生部分替代。

演化博弈論的理論研究以及演化博弈論在經濟學的應用研究，成為國外學術界最熱門的研究領域之一。演化博牟論還是經濟學尤其是博弈論中的一個新領域，可以預見，在未來相長的時期內，演化博棄滄仍將是經濟研究中最具發展潛力的前沿領域之一。

參考

?《百度文庫》

《網絡、群體與市場》

總結

以上是生活随笔為你收集整理的演化博弈论----gyy参考总结的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： django1.4.9 OMserver
下一篇： Taro+react开发（98):问答模