日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

蒙特卡洛与围棋

發(fā)布時(shí)間:2023/12/20 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 蒙特卡洛与围棋 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

今天看到頭條上有位網(wǎng)友提出了一個(gè)蒙特卡洛和圍棋的問題,以為大佬的回答我覺得很有意思,特摘抄與此。

蒙特卡洛算法是20世紀(jì)十大最偉大的算法,阿法狗就采用了蒙特卡洛算法。蒙特卡洛樹不是一種算法,蒙特卡洛才是一種算法。
先來個(gè)動(dòng)態(tài)圖感受下蒙特卡洛樹:

在五子棋中,因?yàn)槊恳徊降倪x擇點(diǎn)并不多,以當(dāng)前電腦的計(jì)算力可以用窮舉找到最佳下法。

“圍棋共有361個(gè)點(diǎn),按照沈括的估計(jì)方法,每個(gè)點(diǎn)有三種狀態(tài):黑、白、空。因此圍棋的狀 態(tài)空間復(fù)雜度是3^36110^172=10000^43。根據(jù)圍棋規(guī)則,沒有氣的子不能存活在棋盤 上,因此以上數(shù)字包括了不合法狀態(tài)。通過蒙特卡洛方法,我們可以計(jì)算合法狀態(tài)的比 率為0.012,因此圍棋的狀態(tài)空間復(fù)雜度為2x10^170.”這個(gè)數(shù)字可能有些抽象,但下面 的對比能讓我們形象地了解計(jì)算機(jī)圍棋的復(fù)雜程度。 “相比較而言,圍棋的狀態(tài)空間復(fù)雜度是10^48.換句話說,圍棋比象棋復(fù)雜10^122倍。這 是個(gè)什么概念呢?圍棋相比于整個(gè)太陽系相對于單個(gè)原子核更龐大、跟復(fù)雜。”

顯然,以當(dāng)前電腦的計(jì)算力,無法對圍棋進(jìn)行暴力窮舉。
那么,蒙特卡洛算法有什么神奇之處呢?

一、為什么叫蒙特卡洛(蒙特.卡洛)

20世紀(jì)40年代美國“曼哈頓計(jì)劃”的成員S.M.烏拉姆和J.馮·諾伊曼首先提出的,用馳名世界的賭城—摩納哥的Monte Carlo命名。

二、原理

本質(zhì)是一種統(tǒng)計(jì)方法,即用大量的隨機(jī)樣本,以出現(xiàn)概率當(dāng)作問題的解。
比如計(jì)算圓周率π:

顯然上圖1/4圓與正方形的面積比為:

πr2(2r)2=π4πr2(2r)2=π4
那么,如果在正方形內(nèi)隨機(jī)產(chǎn)生n個(gè)點(diǎn),通過計(jì)算這些點(diǎn)和原點(diǎn)的距離,判斷這些點(diǎn)是否在1/4圓內(nèi)。
在1/4圓內(nèi)的點(diǎn)數(shù)/n = π/4 。即點(diǎn)落在1/4圓內(nèi)的概率*4 = π。

隨機(jī)模擬30000個(gè)點(diǎn),$ \pi$的估算值與真實(shí)值相差0.07%.

原來概率與統(tǒng)計(jì)可以這么用。
推而廣之,可以計(jì)算任意一個(gè)積分的值。

關(guān)于蒙特卡洛還有許多神奇的應(yīng)用,請移步

《A Business Planning Example》

《蒙特卡羅(Monte Carlo)模擬的一個(gè)應(yīng)用實(shí)例》

《微觀不可預(yù)測的交通的蒙特卡羅模擬》

《基于蒙特卡羅數(shù)值模擬的大跨橋梁狀態(tài)評(píng)估》

回到問題上,阿法狗是怎么選擇下一步的呢?

簡單的說

  • 根據(jù)一定的策略選出可能的下法
  • 然后進(jìn)行蒙特卡羅模擬計(jì)算勝率
  • 以上2步反復(fù)進(jìn)行,顯然,模擬的次數(shù)越多,越有可能得到最優(yōu)解。

    這也就是為什么同樣的zen7軟件,電腦越快、計(jì)算時(shí)間越久,下法越厲害。

    總結(jié)

    以上是生活随笔為你收集整理的蒙特卡洛与围棋的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。