當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

人工智能一种现代方法第2章智能Agent

發布時間：2023/12/31 编程问答 33 豆豆

生活随笔收集整理的這篇文章主要介紹了人工智能一种现代方法第2章智能Agent 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

- - Agent及其理性
  - - 理性的概念
  - PEAS及環境特性
  - Agent的結構
  - Agent程序的部件如何運轉
  - 小結
  - 資源分享

Agent及其理性

Agent：通過傳感器感知所處環境并通過執行器對該環境產生作用的智能體
Agent感知序列：該Agent所接收到的是所有輸入數據的完整歷史
感知信息：智能體的感知輸入
感知序列：感知信息的集合
Agent函數：描述Agent行為，將任意給定感知序列映射為行動
Agent程序：實現Agent函數

The agent function describes what the agent does in all circumstances
The agent program calculates the agent function

理性的概念

理性：Agent的一種屬性，考慮到迄今為止的感知，他們選擇能夠最大化其預期效用的行為。
理性（Rationality）Agent：對于每個可能的感知序列，根據已知的序列提供的證據和智能體內建的先驗知識，理性智能體應該選擇期望能使其性能最大化的行動。
Rationality depends on：

The performance measure that defines the criterion of success
The agent’s prior knowledge of the environment
The actions that the agent can perform
The agent’s percept sequence to date
性能度量、先驗知識、可執行行動、感知序列

全知Agent:全知Agent明確知道他的行動產生的實際結果并做出相應的動作，現實中不可能。理性 ≠ 全知
完美Agent：理性Agent使期望性能最大化；完美Agent使實際性能最大化。理性 ≠ 完美

理性Agent還應該是自主的，它應該學習，以彌補不完整的或者不正確的先驗知識。

PEAS及環境特性

任務環境的規范包括：
To design a rational agent we need to specify a task environment

Performance measure
Environment
Actuators
Sensors

PEAS（性能Performance，環境 Environment，執行器Actuators，傳感器Sensors）

例如，在Spam Filtering垃圾郵件過濾中

Performance measure: spam block
Environment: email client or server
Actuators: mark as spam, transfer messages
Sensors: emails (possibly across users), etc.

任務環境的屬性

完全可觀測和部分可觀測
Agent的Sensors在每個時間點上都能獲取環境的完整狀態。若監測到的信息與行動決策相關，則該任務環境是有效完全可觀察的。
單Agent和多Agent
確定的和隨機的
片段式的和延續式的
片段：下一個片段不依賴于以前片段采取的行動（如大部分的分類任務）。
連續：當前決策會影響到所有未來決策。
靜態的和動態的
取決于環境在Agent計算時是否會改變。
離散的和連續的
環境狀態，時間處理方式，Agent感知信息和行動都有離散和連續之分。

Agent的結構

Agent = 體系結構 + 程序（Agent程序）
體系結構，具有物理傳感器和執行器的計算裝置
智能體程序，每接收到一個新的感知信息，就將其添加到感知序列中，并根據先驗知識的對應表得到一個行動，把傳感器的感知信息映射到行動的Agent函數

All agents have the same skeleton

Input = current percepts
Output = action
Program= manipulates input to produce
output

Four basic types in order of increasing generality

Simple reflex agents 簡單反射agent，忽略感知序列，而只針對當前感知選擇行動。
Model-based reflex agents 基于模型的agent
Goal-based agents 基于目標的agent
基于目標的agent會考慮將要采取的行動及行動的后果，即與目標還有多遠
Utility-based agents 基于效用的agent，最大化期望
Learning agents 學習agent
All these can be turned into learning agents

Agent程序的部件如何運轉

各部件的工作

原子表示
要素化表示（狀態有特征向量）
結構化表示（特征向量+其他對象的關系）

小結

要點回顧如卜:
Agent是可以感知環境并在環境中行動的事物。
Agent函數指定Agent響應任何感知序列所采取的行動。

性能度量評價Agent在環境中的行為表現。給定Agent的感知序列,理性Agent行動追求性能度量預期值最大化。

任務環境的規范包括性能度量,外部環境,執行器和傳感器。設計Agent時,第一步總是把任務空間定義得盡可能完全。

任務環境從不同的維度看有很多變化。它們可能是完全或部分可觀察的,單Agent或多Agent的,確定性的或隨機的,片段式的或延續式的,靜態的或動態的,離散的或連續的,已知的和未知的。

Agent程序是Agent函數的實現。 有各種基本的Agent程序的設計,反映出顯式表
現的以及用于決策過程的信息種類。設計可能在效率、壓縮性和靈活性方面有變化。適當的 Agent 程序的設計依賴于環境的本性。

簡單反射Agent直接對感知信息做出反應?；谀Ｐ偷姆瓷銩gent保持內部狀態,其操作直接從當前世界狀態的內部模型派生，并隨時間更新。基于目標的Agent選擇能實現顯示表示的目標的動作,而基于效用的Agent試圖選擇能最大化它期望效用的動作。

所有Agent都可以通過學習來改進它們性能。

資源分享

實驗代碼下載：
https://github.com/yyl424525/AI_Homework
人工智能-一種現代方法中文第三版pdf、課件、作業及解答、課后習題答案、實驗代碼和報告、歷年考博題下載：https://download.csdn.net/download/yyl424525/11310392

總結

以上是生活随笔為你收集整理的人工智能一种现代方法第2章智能Agent的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： matlab 安装matpower,MA
下一篇： WinRAR 5.60 无广告正式版