《人工智能:一种现代的方法》笔记(一)
本章的主要問(wèn)題就是理解什么是Agent,如何根據(jù)特定問(wèn)題構(gòu)建出合適的Agent模型以及可以構(gòu)建出什么樣的Agent的問(wèn)題。
智能Agent
- 理性Agent
- 環(huán)境的性質(zhì)
- Agent的結(jié)構(gòu)
- 基于反射的Agent
- 基于模型的Agent
- 基于目標(biāo)的Agent
- 基于效用的Agent
理性Agent
理性的判斷依賴(lài)于以下四個(gè)方面:
- 定義成功標(biāo)準(zhǔn)的性能度量(P)
- Agent 對(duì)環(huán)境的先驗(yàn)知識(shí)(E)
- Agent可以完成的行動(dòng)(A)
- Agent截止到此時(shí)的感知序列(S)
理性Agent的定義:對(duì)每一個(gè)可能的感知序列,根據(jù)已知的感知序列提供的證據(jù)和Agent具有的先驗(yàn)知識(shí),理性Agent應(yīng)該選擇能使其性能度量最大化的行動(dòng)。
環(huán)境的性質(zhì)
考慮任務(wù)環(huán)境是理性Agent要“求解”的基本“問(wèn)題”。
根據(jù)理性的定義,我們的任務(wù)環(huán)境也必須將上述的四個(gè)方面性能度量、環(huán)境·、Agent執(zhí)行器、傳感器歸結(jié)在一起才能構(gòu)建出合適的任務(wù)環(huán)境。(根據(jù)四方面的首字母定義該描述為PEAS描述)
簡(jiǎn)單例子:自動(dòng)駕駛出租車(chē)系統(tǒng)
更多示例:
Agent的結(jié)構(gòu)
Agent程序,它實(shí)現(xiàn)的是把感知信息映射到行動(dòng)的Agent 函數(shù)。
假設(shè)該程序要在某個(gè)具備物理傳感器和執(zhí)行器的計(jì)算裝置上運(yùn)行——我們稱(chēng)為體系結(jié)構(gòu)。
Agent =體系結(jié)構(gòu)+程序
基于反射的Agent
這類(lèi)Agent基于當(dāng)前的感知和內(nèi)置的規(guī)則集選擇行動(dòng),不關(guān)注感知?dú)v史。雖然結(jié)構(gòu)簡(jiǎn)單,但只感知當(dāng)前的信息,對(duì)于許多需要考慮歷史對(duì)當(dāng)前影響的場(chǎng)景是不適用的。
基于模型的Agent
這類(lèi)Agent不僅僅是有規(guī)則集,還有它需要知道Agent的行動(dòng)會(huì)對(duì)環(huán)境造成什么影響,即知道世界如何運(yùn)轉(zhuǎn),在內(nèi)部需要有一個(gè)世界模型(model)
基于目標(biāo)的Agent
這類(lèi)Agent除了知道自己當(dāng)前的狀態(tài),還可以用目標(biāo)信息來(lái)描述想要達(dá)到的狀態(tài),基于目標(biāo)的Agent更加的明確,通過(guò)目標(biāo)的指引,利用自己已知的模型和感知的信息不斷更新自己的狀態(tài)以達(dá)到目標(biāo)。
此類(lèi)決策與前面描述的條件-行動(dòng)規(guī)則有根本的不同,原因是它考慮了未來(lái)——包括“如果我這樣做會(huì)發(fā)生什么?”和“這樣做會(huì)讓我高興嗎?”這樣的問(wèn)題。基于目標(biāo)用的做動(dòng)作是是推理,而基于反射是基于規(guī)則進(jìn)行行動(dòng)的。
基于效用的Agent
這類(lèi)Agent是對(duì)于基于目標(biāo)Agent更加精細(xì)化的描述,如果說(shuō)基于目標(biāo)的Agent對(duì)于性能度量是二值的,那么基于效用的Agent對(duì)于目標(biāo)的性能度量是從0到1的連續(xù)值。
總結(jié)
以上是生活随笔為你收集整理的《人工智能:一种现代的方法》笔记(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 人工智能 一种现代方法 第7章 逻辑Ag
- 下一篇: 基于ROS的机械臂手眼标定-常见错误排查