概率机器人阅读笔记
第一章 緒論
機器人學是一門通過計算機控制設備來感知和操縱物理世界的科學,脫離開結構化的工作環境,客觀世界中存在著大量的不確定性:
- 機器人環境的不可預測
- 傳感器感知信息的局限性
- 執行機構的不確定性
- 機器人軟件中抽象模型的誤差。
為了使機器人接納這些不確定性,《概率機器人》致力于將機器人感知與行為的不確定性用概率理論明確地表示出來,推測整個空間中概率分布信息,表示出每種可能的模糊性和置信度,形成相對魯棒的控制方式。
概率理論是有其局限性的,主要在計算的復雜性和近似的必要性上。
機器人技術的發展已經經歷了基于模型的范式和基于行為的范式,前者依賴于給定的環境和機器人的完整的精確的模型,后者則依賴于機器人與物理世界交互過程中的檢測的精確性,現代概率機器人學從20世紀90年代中期已經出現,通過將模型和傳感器測量兩者相結合,設計出控制行為。
第二章 遞歸狀態估計
本章節介紹的貝葉斯濾波,是狀態估計的遞歸算法,是本書幾乎每一項技術的基礎。
概率
可以將普通的一維正態分布表示為:
p(x)=(2πσ2)?12exp?{?12(x?μ)2σ2}p(x)=(2{\pi}{\sigma}^2)^{-\frac{1}{2}}\exp\{-\frac{1}{2}\frac{(x-\mu)^2}{{\sigma}^2}\} p(x)=(2πσ2)?21?exp{?21?σ2(x?μ)2?}
拓展到多維可以寫為
p(x)=det(2πΣ)?12exp?{?12(x?μ)TΣ?1(x?μ)}p(x)=det(2{\pi}{\Sigma})^{-\frac{1}{2}}\exp\{-\frac{1}{2}(x-\mu)^T{\Sigma}^{-1}(x-\mu)\} p(x)=det(2πΣ)?21?exp{?21?(x?μ)TΣ?1(x?μ)}
其中 μ\muμ 為均值矢量,Σ\SigmaΣ 為一個半正定對稱矩陣,稱為協方差矩陣。
全概率定理
p(x)=∑yp(x∣y)p(y)(離散情況)p(x)=∫p(x∣y)p(y)dy(連續情況)p(x)={\sum_y}p(x|y)p(y)\ \ \ \ \ \ (離散情況) \\ p(x)={\int}p(x|y)p(y)dy\ \ \ \ \ \ (連續情況) p(x)=y∑?p(x∣y)p(y)??????(離散情況)p(x)=∫p(x∣y)p(y)dy??????(連續情況)
進而得到貝葉斯準則
p(x∣y)=p(y∣x)p(x)p(y)=...(離散/連續情況)p(x|y)=\frac{p(y|x)p(x)}{p(y)}=...\ \ \ \ \ \ (離散/連續情況) p(x∣y)=p(y)p(y∣x)p(x)?=...??????(離散/連續情況)
在這個公式中,xxx 是希望由 yyy 推測出來的數值,p(x)p(x)p(x) 是先驗概率分布(前一次概率計算結果),yyy 為傳感器測量值,得出了 XXX 的后驗概率分布 p(x∣y)p(x|y)p(x∣y) 。
狀態
環境特征以狀態表征,本書中認為狀態是所有會對未來產生影響的機器人和其環境的所有方面因素,典型的狀態變量包括:
- 機器人位姿:
- 執行機構配置:
- 速度和角速度:
- 環境中周圍物體的位置和特征:
總結