當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

《人工智能：一种现代的方法》笔记（一）

發(fā)布時(shí)間：2023/12/31 编程问答 34 豆豆

生活随笔收集整理的這篇文章主要介紹了《人工智能：一种现代的方法》笔记（一）小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本章的主要問(wèn)題就是理解什么是Agent，如何根據(jù)特定問(wèn)題構(gòu)建出合適的Agent模型以及可以構(gòu)建出什么樣的Agent的問(wèn)題。

智能Agent

理性Agent
環(huán)境的性質(zhì)
Agent的結(jié)構(gòu)
- 基于反射的Agent
- 基于模型的Agent
- 基于目標(biāo)的Agent
- 基于效用的Agent

理性Agent

理性的判斷依賴(lài)于以下四個(gè)方面：

定義成功標(biāo)準(zhǔn)的性能度量（P）
Agent 對(duì)環(huán)境的先驗(yàn)知識(shí)（E）
Agent可以完成的行動(dòng)（A）
Agent截止到此時(shí)的感知序列（S）

理性Agent的定義：對(duì)每一個(gè)可能的感知序列，根據(jù)已知的感知序列提供的證據(jù)和Agent具有的先驗(yàn)知識(shí)，理性Agent應(yīng)該選擇能使其性能度量最大化的行動(dòng)。

環(huán)境的性質(zhì)

考慮任務(wù)環(huán)境是理性Agent要“求解”的基本“問(wèn)題”。

根據(jù)理性的定義，我們的任務(wù)環(huán)境也必須將上述的四個(gè)方面性能度量、環(huán)境·、Agent執(zhí)行器、傳感器歸結(jié)在一起才能構(gòu)建出合適的任務(wù)環(huán)境。（根據(jù)四方面的首字母定義該描述為PEAS描述）

簡(jiǎn)單例子：自動(dòng)駕駛出租車(chē)系統(tǒng)

性能度量：油耗、到達(dá)目的地的時(shí)間長(zhǎng)短、安全性、乘客舒適度等等

環(huán)境：各種道路、路上的行人車(chē)輛、天氣等等

執(zhí)行器：個(gè)人感覺(jué)可以理解成action，如踩油門(mén)，方向盤(pán)的控制，與顧客的交流等等

傳感器：主要是車(chē)上搭載的攝像頭來(lái)感知環(huán)境變化

更多示例：

Agent的結(jié)構(gòu)

Agent程序，它實(shí)現(xiàn)的是把感知信息映射到行動(dòng)的Agent 函數(shù)。
假設(shè)該程序要在某個(gè)具備物理傳感器和執(zhí)行器的計(jì)算裝置上運(yùn)行——我們稱(chēng)為體系結(jié)構(gòu)。
Agent =體系結(jié)構(gòu)＋程序

基于反射的Agent

這類(lèi)Agent基于當(dāng)前的感知和內(nèi)置的規(guī)則集選擇行動(dòng)，不關(guān)注感知?dú)v史。雖然結(jié)構(gòu)簡(jiǎn)單，但只感知當(dāng)前的信息，對(duì)于許多需要考慮歷史對(duì)當(dāng)前影響的場(chǎng)景是不適用的。

基于模型的Agent

這類(lèi)Agent不僅僅是有規(guī)則集，還有它需要知道Agent的行動(dòng)會(huì)對(duì)環(huán)境造成什么影響，即知道世界如何運(yùn)轉(zhuǎn)，在內(nèi)部需要有一個(gè)世界模型（model）

基于目標(biāo)的Agent

這類(lèi)Agent除了知道自己當(dāng)前的狀態(tài)，還可以用目標(biāo)信息來(lái)描述想要達(dá)到的狀態(tài)，基于目標(biāo)的Agent更加的明確，通過(guò)目標(biāo)的指引，利用自己已知的模型和感知的信息不斷更新自己的狀態(tài)以達(dá)到目標(biāo)。
此類(lèi)決策與前面描述的條件-行動(dòng)規(guī)則有根本的不同，原因是它考慮了未來(lái)——包括“如果我這樣做會(huì)發(fā)生什么?”和“這樣做會(huì)讓我高興嗎?”這樣的問(wèn)題。基于目標(biāo)用的做動(dòng)作是是推理，而基于反射是基于規(guī)則進(jìn)行行動(dòng)的。

基于效用的Agent

這類(lèi)Agent是對(duì)于基于目標(biāo)Agent更加精細(xì)化的描述，如果說(shuō)基于目標(biāo)的Agent對(duì)于性能度量是二值的，那么基于效用的Agent對(duì)于目標(biāo)的性能度量是從0到1的連續(xù)值。

總結(jié)

以上是生活随笔為你收集整理的《人工智能：一种现代的方法》笔记（一）的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：人工智能一种现代方法第7章逻辑Ag
下一篇：基于ROS的机械臂手眼标定-常见错误排查