日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

《人工智能:一种现代的方法》笔记(一)

發(fā)布時(shí)間:2023/12/31 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 《人工智能:一种现代的方法》笔记(一) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

本章的主要問(wèn)題就是理解什么是Agent,如何根據(jù)特定問(wèn)題構(gòu)建出合適的Agent模型以及可以構(gòu)建出什么樣的Agent的問(wèn)題。

智能Agent

  • 理性Agent
  • 環(huán)境的性質(zhì)
  • Agent的結(jié)構(gòu)
    • 基于反射的Agent
    • 基于模型的Agent
    • 基于目標(biāo)的Agent
    • 基于效用的Agent

理性Agent

理性的判斷依賴(lài)于以下四個(gè)方面:

  • 定義成功標(biāo)準(zhǔn)的性能度量(P)
  • Agent 對(duì)環(huán)境的先驗(yàn)知識(shí)(E)
  • Agent可以完成的行動(dòng)(A)
  • Agent截止到此時(shí)的感知序列(S)

理性Agent的定義:對(duì)每一個(gè)可能的感知序列,根據(jù)已知的感知序列提供的證據(jù)和Agent具有的先驗(yàn)知識(shí),理性Agent應(yīng)該選擇能使其性能度量最大化的行動(dòng)

環(huán)境的性質(zhì)

考慮任務(wù)環(huán)境是理性Agent要“求解”的基本“問(wèn)題”。

根據(jù)理性的定義,我們的任務(wù)環(huán)境也必須將上述的四個(gè)方面性能度量、環(huán)境·、Agent執(zhí)行器、傳感器歸結(jié)在一起才能構(gòu)建出合適的任務(wù)環(huán)境。(根據(jù)四方面的首字母定義該描述為PEAS描述)

簡(jiǎn)單例子:自動(dòng)駕駛出租車(chē)系統(tǒng)

  • 性能度量:油耗、到達(dá)目的地的時(shí)間長(zhǎng)短、安全性、乘客舒適度等等
  • 環(huán)境:各種道路、路上的行人車(chē)輛、天氣等等
  • 執(zhí)行器:個(gè)人感覺(jué)可以理解成action,如踩油門(mén),方向盤(pán)的控制,與顧客的交流等等
  • 傳感器:主要是車(chē)上搭載的攝像頭來(lái)感知環(huán)境變化

    更多示例:
  • Agent的結(jié)構(gòu)

    Agent程序,它實(shí)現(xiàn)的是把感知信息映射到行動(dòng)的Agent 函數(shù)。
    假設(shè)該程序要在某個(gè)具備物理傳感器和執(zhí)行器的計(jì)算裝置上運(yùn)行——我們稱(chēng)為體系結(jié)構(gòu)。
    Agent =體系結(jié)構(gòu)+程序

    基于反射的Agent

    這類(lèi)Agent基于當(dāng)前的感知和內(nèi)置的規(guī)則集選擇行動(dòng),不關(guān)注感知?dú)v史。雖然結(jié)構(gòu)簡(jiǎn)單,但只感知當(dāng)前的信息,對(duì)于許多需要考慮歷史對(duì)當(dāng)前影響的場(chǎng)景是不適用的。

    基于模型的Agent

    這類(lèi)Agent不僅僅是有規(guī)則集,還有它需要知道Agent的行動(dòng)會(huì)對(duì)環(huán)境造成什么影響,即知道世界如何運(yùn)轉(zhuǎn),在內(nèi)部需要有一個(gè)世界模型(model)

    基于目標(biāo)的Agent

    這類(lèi)Agent除了知道自己當(dāng)前的狀態(tài),還可以用目標(biāo)信息來(lái)描述想要達(dá)到的狀態(tài),基于目標(biāo)的Agent更加的明確,通過(guò)目標(biāo)的指引,利用自己已知的模型和感知的信息不斷更新自己的狀態(tài)以達(dá)到目標(biāo)。
    此類(lèi)決策與前面描述的條件-行動(dòng)規(guī)則有根本的不同,原因是它考慮了未來(lái)——包括“如果我這樣做會(huì)發(fā)生什么?”和“這樣做會(huì)讓我高興嗎?”這樣的問(wèn)題。基于目標(biāo)用的做動(dòng)作是是推理,而基于反射是基于規(guī)則進(jìn)行行動(dòng)的。

    基于效用的Agent

    這類(lèi)Agent是對(duì)于基于目標(biāo)Agent更加精細(xì)化的描述,如果說(shuō)基于目標(biāo)的Agent對(duì)于性能度量是二值的,那么基于效用的Agent對(duì)于目標(biāo)的性能度量是從0到1的連續(xù)值。

    總結(jié)

    以上是生活随笔為你收集整理的《人工智能:一种现代的方法》笔记(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。