生活随笔
收集整理的這篇文章主要介紹了
动态规划 —— 动态规划概述
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
【概述】
動(dòng)態(tài)規(guī)劃:解決多階段決策問(wèn)題的一種方法。實(shí)際上就是一種排除重復(fù)計(jì)算的算法,更具體的說(shuō),動(dòng)態(tài)規(guī)劃就是用空間換取時(shí)間。多階段決策問(wèn)題:若一類(lèi)問(wèn)題的求解過(guò)程可分為若干個(gè)互相聯(lián)系的階段,在每一個(gè)階段都需作出決策,并影響到下一個(gè)階段的決策。這類(lèi)問(wèn)題的解決,就是要在可以選擇的那些策略間,選一個(gè)最優(yōu)策略,使在預(yù)定的標(biāo)準(zhǔn)下達(dá)到最好的效果。階段:將所給求解問(wèn)題的過(guò)程恰當(dāng)?shù)胤殖扇舾蓚€(gè)相互聯(lián)系的階段,以便于求解,過(guò)程不同,階段數(shù)就可能不同,描述階段的變量稱(chēng)“階段變量”。狀態(tài):描述事物的性質(zhì),不同事物有不同的性質(zhì),因而用不同的狀態(tài)來(lái)刻畫(huà)。對(duì)問(wèn)題的求解狀態(tài)的描述是分階段的。描述狀態(tài)的量稱(chēng)“狀態(tài)變量”決策:一個(gè)階段的狀態(tài)給定以后,從該狀態(tài)演變到下一階段某個(gè)狀態(tài)的選擇性操作。描述決策的變量稱(chēng)決策變量。決策變量的范圍稱(chēng)“允許決策集合”。無(wú)后效性:我們要求狀態(tài)具有下面的性質(zhì):如果給定某一階段的狀態(tài),則在這一階段以后過(guò)程的發(fā)展不受這階段以前各段狀態(tài)的影響,所有各階段都確定時(shí),整個(gè)過(guò)程也就確定了。換句話(huà)說(shuō),過(guò)程的每一次實(shí)現(xiàn)可以用一個(gè)狀態(tài)序列表示,這個(gè)性質(zhì)稱(chēng)為“無(wú)后效性”。策略:由每個(gè)階段的決策組成的序列稱(chēng)為策略。對(duì)于每一個(gè)實(shí)際的多階段決策過(guò)程,可供選取的策略有一定的范圍限制,這個(gè)范圍稱(chēng)“允許策略集合”。允許策略集合中達(dá)到最優(yōu)效果的策略稱(chēng)“最優(yōu)策略”。狀態(tài)轉(zhuǎn)移方程:用數(shù)學(xué)公式描述與階段相關(guān)的狀態(tài)間的演變規(guī)律。是本階段的狀態(tài)往往是上一階段狀態(tài)和上一階段決策的結(jié)果。如果給定了第K階段的狀態(tài)Sk以及決策uk(Sk),則第K+1階段的狀態(tài)Sk+1也就完全確定。
【最優(yōu)性原理】
不論初始狀態(tài)和第一步?jīng)Q策是什么,余下的決策相對(duì)于前一次決策所產(chǎn)生的新?tīng)顟B(tài),構(gòu)成一個(gè)最優(yōu)決策序列。最優(yōu)決策序列的子序列,一定是局部最優(yōu)決策子序列。包含非局部最優(yōu)的決策子序列,一定不是最優(yōu)決策序列。
【無(wú)后效性原則】
某階段的狀態(tài)一旦確定,則此后過(guò)程的演變不再受此前各狀態(tài)及決策的影響。當(dāng)前狀態(tài)是此前歷史的一個(gè)完整的總結(jié),此前的歷史只能通過(guò)當(dāng)前的狀態(tài)去影響過(guò)程未來(lái)的演變。
【指導(dǎo)思想】
在做每一步?jīng)Q策時(shí),列出各種可能的局部解。依據(jù)某種判定條件,舍棄那些肯定不能得到最優(yōu)解的局部解。以每一步都是最優(yōu)的來(lái)保證全局是最優(yōu)的。
【基本特征】
問(wèn)題具有多階段決策的特點(diǎn)。每一階段都有相應(yīng)的“狀態(tài)”與之對(duì)應(yīng)。每一階段都面臨一個(gè)決策,選擇不同的決策將會(huì)導(dǎo)致下一階段不同的狀態(tài)。每一階段的最優(yōu)解問(wèn)題可以遞歸地歸結(jié)為下一階段各個(gè)可能狀態(tài)的最優(yōu)解問(wèn)題,各子問(wèn)題與原問(wèn)題具有完全相同的結(jié)構(gòu)。
【一般解題步驟】
判斷問(wèn)題是否具有最優(yōu)子結(jié)構(gòu)性質(zhì),若不具備則不能用動(dòng)態(tài)規(guī)劃把問(wèn)題分成若干個(gè)子問(wèn)題(分階段)建立狀態(tài)轉(zhuǎn)移方程(遞推公式)找出邊界條件將已知邊界值帶入方程遞推求解
【問(wèn)題分類(lèi)】
背包問(wèn)題:點(diǎn)擊這里線(xiàn)性 DP:點(diǎn)擊這里區(qū)間 DP:點(diǎn)擊這里狀壓 DP:點(diǎn)擊這里數(shù)位 DP:點(diǎn)擊這里樹(shù)型 DP:點(diǎn)擊這里
?
總結(jié)
以上是生活随笔為你收集整理的动态规划 —— 动态规划概述的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。