无限场景开放式仿真器 PGDrive:Improving the Generalization of End-to-End Driving through Procedural Generation
本文介紹一個(gè)擁有無(wú)限場(chǎng)景開(kāi)放式駕駛仿真器:PGDrive,通過(guò) Procedural Generation 技術(shù)可以生成無(wú)限多的駕駛場(chǎng)景,由香港中文大學(xué)周博磊團(tuán)隊(duì)開(kāi)發(fā)。
論文地址:https://arxiv.org/pdf/2012.13681.pdf
項(xiàng)目地址:https://decisionforce.github.io/pgdrive/
0. Absrtact
(這里先給出本文摘要)
在過(guò)去的幾年中,基于學(xué)習(xí)的自動(dòng)駕駛系統(tǒng)(learning-based self driving system)受到了越多越多的關(guān)注。為了保證安全性,自動(dòng)駕駛系統(tǒng)首先在模擬器中開(kāi)發(fā)和驗(yàn)證,然后再應(yīng)用到真實(shí)世界中。但是,大多數(shù)現(xiàn)有的駕駛模擬器僅包含一組固定的場(chǎng)景和數(shù)量有限的配置設(shè)置。這很容易造成系統(tǒng)的過(guò)擬合,以及缺乏對(duì)未見(jiàn)場(chǎng)景的泛化能力。
為了更好地評(píng)估和改善端到端駕駛系統(tǒng)的泛化能力,本文將介紹一個(gè)開(kāi)放、高度可配置的駕駛模擬器 PGDrive,模擬器具有procedural generation 的特征。模擬器首先通過(guò)提出的生成算法從基本blocks中采樣來(lái)生成多樣化的道路網(wǎng)絡(luò)。然后將它們轉(zhuǎn)變?yōu)榻换ナ接?xùn)練環(huán)境,在該環(huán)境中以逼真的運(yùn)動(dòng)學(xué)方法渲染車輛附近的交通流。實(shí)驗(yàn)結(jié)果證實(shí)隨著procedural generation的場(chǎng)景數(shù)量的增加,能夠提高自動(dòng)駕駛汽車在不同交通密度和道路網(wǎng)絡(luò)場(chǎng)景的泛化能力。
1. Introduction & Related Work
( 本文的引言部分和第二部分研究現(xiàn)狀這里就不詳細(xì)介紹了,大家可以查看原文,我在這里大致總結(jié)下。)
- Self Driving
自動(dòng)駕駛研究可以分為兩類:模塊化(modular)和端到端(end-to-end)。在模塊化研究中,自動(dòng)駕駛系統(tǒng)由許多子系統(tǒng)組成,如感知,定位,規(guī)劃,控制,決策等。模塊化設(shè)計(jì)的優(yōu)勢(shì)是可解釋性,如果發(fā)生故障或意外行為,則可以輕松識(shí)別出發(fā)生故障的模塊。 但是,設(shè)計(jì)和維護(hù)模塊需要花費(fèi)大量的人力,并且還可能會(huì)因人工設(shè)計(jì)而導(dǎo)致系統(tǒng)內(nèi)部冗余。另一方面,一種流行的端到端方法是通過(guò)強(qiáng)化學(xué)習(xí) 駕駛汽車。近年來(lái),強(qiáng)化學(xué)習(xí)能夠通過(guò)與環(huán)境交互來(lái)發(fā)現(xiàn)特定于任務(wù)的知識(shí),因此大大減輕了對(duì)精心設(shè)計(jì)和領(lǐng)域知識(shí)的需求。 同時(shí),強(qiáng)化學(xué)習(xí)主體通過(guò)對(duì)環(huán)境的探索來(lái)學(xué)習(xí),因此其能力不限于訓(xùn)練數(shù)據(jù)。 - Driving Simulators
這里介紹了8種常用的駕駛模擬器,CARLA,GTA V,SUMMIT,Flow,TORCS,Duckietown,Highway-env,SMARTS。它們的主要劣勢(shì)是地圖場(chǎng)景有限,不能提供多樣的訓(xùn)練場(chǎng)景來(lái)幫助自動(dòng)駕駛汽車提高泛化能力。 - Procedural Feneration
這里介紹了過(guò)程生成技術(shù),使用到了數(shù)據(jù)增強(qiáng),域隨機(jī)化,GAN等技術(shù)來(lái)設(shè)計(jì)過(guò)程生成算法。 - Generalization
這里提出強(qiáng)化學(xué)習(xí)可以解決過(guò)擬合現(xiàn)象,在本文作者中比較了SAC和PPO兩種強(qiáng)化學(xué)習(xí)算法的學(xué)習(xí)能力。
2. PGDrive Simulator
下表給出了PGDrive與其它駕駛模擬器的比較,可以看到,PGDrive最突出的特征是支持Procedural Generation,可以生成無(wú)限多的駕駛場(chǎng)景。
A. Road Blocks
如下圖所示,有7種基本道路塊(road block):Straight,Ramp,Fork,Roundabout,Curve,T-Intersection,Intersection。 它們是基本的道路塊,可以任意組合來(lái)形成道路網(wǎng)絡(luò)。
B. Procedural Generation of Driving Scene (重點(diǎn))
下面將介紹本文提出的Procedural Generation算法(如下圖所示)。
- 首先隨機(jī)選擇一個(gè)基本road block:GwG_wGw?。
- 隨機(jī)旋轉(zhuǎn)所選擇的road block,判斷GwG_wGw?和GnetG_{net}Gnet?之間是否能連接起來(lái),如果成功的話,則將新塊GwG_wGw?添加到GnetG_{net}Gnet?中,這里至多進(jìn)行TTT次嘗試,每個(gè)GnetG_{net}Gnet?包含nnn個(gè)blocks。
- 最后是對(duì)交通流進(jìn)行初始化設(shè)置,包括汽車類型,運(yùn)動(dòng)學(xué)參數(shù),目標(biāo)速度等。
3. Experiments
Results on Generalization
論文比較了SAC和PPO兩種強(qiáng)化學(xué)習(xí)算法的泛化能力,可以看到隨著訓(xùn)練場(chǎng)景數(shù)量的增加,算法在測(cè)試集上的性能不斷提高,其中SAC算法性能優(yōu)于PPO。
最后,作者在項(xiàng)目網(wǎng)站上也給出了一個(gè)視頻demo。
Reinforcement Learning 自動(dòng)駕駛仿真
總結(jié)
以上是生活随笔為你收集整理的无限场景开放式仿真器 PGDrive:Improving the Generalization of End-to-End Driving through Procedural Generation的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 交行信用卡账单日怎么查询 账单日修改只允
- 下一篇: Waymo研发经理:《自动驾驶感知前沿技