长篇自动驾驶技术综述论文(下)
長(zhǎng)篇自動(dòng)駕駛技術(shù)綜述論文(下)
三維目標(biāo)檢測(cè)
鑒于經(jīng)濟(jì)性,可用性和研究的廣泛性,幾乎所有的算法都使用相機(jī)作為主要的感知方式。把相機(jī)應(yīng)用在ADS中,限制條件除了前面討論到的光照等因素外,還有一個(gè)問(wèn)題就是目標(biāo)檢測(cè)是在圖像空間的,忽略了場(chǎng)景的尺度信息。而當(dāng)需要進(jìn)行避障等動(dòng)態(tài)駕駛?cè)蝿?wù)時(shí),我們需要將二維圖像映射到三維空間來(lái)獲得三維的信息。實(shí)際上利用單個(gè)相機(jī)來(lái)估計(jì)深度也是可行的[30],當(dāng)然利用立體相機(jī)或者多相機(jī)的系統(tǒng)更具魯棒性。從二維到三維的映射必然需要解決一個(gè)圖像匹配問(wèn)題,這給已經(jīng)夠復(fù)雜的感知過(guò)程又增加了大量的計(jì)算處理成本。
所以我們換一種思路,是否可以直接在三維進(jìn)行目標(biāo)檢測(cè)。我們知道3D雷達(dá)收集的數(shù)據(jù)是三維的,從本質(zhì)上已經(jīng)解決了尺度問(wèn)題,而且3D雷達(dá)不依賴于光照條件,不容易受到惡劣天氣的影響。3D雷達(dá)收集的是場(chǎng)景表面的稀疏3D點(diǎn),這些點(diǎn)很難用于對(duì)象檢測(cè)和分類,分割反而相對(duì)容易。傳統(tǒng)方法使用基于歐式距離的聚類(Euclidean clustering)或者區(qū)域生長(zhǎng)(region-growing)算法[31]來(lái)將點(diǎn)劃分為不同對(duì)象。結(jié)合一些濾波技術(shù),比如地面濾波(ground filtering)[32]或者基于地圖(map-based filtering)的濾波[33],可以使該方法更具魯棒性。下圖我們展示了一個(gè)從原始點(diǎn)云輸入中獲取聚類對(duì)象的例子。
與基于圖像的方法發(fā)展趨勢(shì)一樣,機(jī)器學(xué)習(xí)最近也取代了傳統(tǒng)3D檢測(cè)方法,而且這種方法還特別適用于RGB-D數(shù)據(jù)。RGB-D產(chǎn)生的數(shù)據(jù)與點(diǎn)云類似,不過(guò)包含顏色信息,由于范圍比較有限而且可靠性不高,尚未應(yīng)用于ADS系統(tǒng)。[34]利用3D占據(jù)柵格(occupancy
grid)表示的方法完成了RGB-D數(shù)據(jù)的對(duì)象檢測(cè)。此后不久,類似的方法被應(yīng)用于激光雷達(dá)創(chuàng)建的點(diǎn)云。受基于圖像的方法的啟發(fā),盡管計(jì)算開(kāi)銷(xiāo)很大,但仍然使用了3D CNN。VoxelNet[35]首次給出了令人信服的點(diǎn)云上三維邊界框估計(jì)的結(jié)果。SECOND[36]利用激光雷達(dá)數(shù)據(jù)的自然稀疏性,改進(jìn)了這些工作的準(zhǔn)確性和計(jì)算效率。最近提出的幾種算法比較如下表所示:
數(shù)據(jù)集是KITTI[42],結(jié)果以中等類別精度排序,算法中只使用點(diǎn)云數(shù)據(jù)。
基于激光雷達(dá)的感知的另一個(gè)選擇是點(diǎn)云數(shù)據(jù)的二維投影。點(diǎn)云數(shù)據(jù)在2D中有兩種主要表示形式,一種是深度圖,主要是受通過(guò)深度估計(jì)執(zhí)行3D對(duì)象檢測(cè)[37]和在RGB-D數(shù)據(jù)上進(jìn)行操作方法的啟發(fā)。VeloFCN網(wǎng)絡(luò)[38]提出使用單通道深度圖像作為淺層單級(jí)卷積神經(jīng)網(wǎng)絡(luò)的輸入,生成3D車(chē)輛候選,許多其他算法也都采用了這種方法。深度圖的另一個(gè)用途是用于激光雷達(dá)點(diǎn)的語(yǔ)義分類(semantic classification)[39]。
另一種2D投影是指對(duì)鳥(niǎo)瞰圖(bird’s eye view,BV)的投影,該方式越來(lái)越受歡迎。不過(guò)鳥(niǎo)瞰圖僅有單純的2D離散信息,因此如果激光雷達(dá)點(diǎn)的值僅有高度變化的話,在2D中必定會(huì)互相遮擋。MV3D算法[40]使用相機(jī)圖像,深度圖像以及多通道BV圖像(這里不同通道對(duì)應(yīng)不同的高度),來(lái)最小化這種遮擋。一些工作重復(fù)使用基于相機(jī)的算法,并訓(xùn)練了有效的網(wǎng)絡(luò)來(lái)在2D BV圖像上進(jìn)行3D對(duì)象檢測(cè)[41]。這些算法都是在KITTI數(shù)據(jù)集和nuScenes[43]數(shù)據(jù)集上進(jìn)行測(cè)試的。2D的方法計(jì)算成本要比3D小得多,而且利用稀疏性改進(jìn)這些工作的準(zhǔn)確性和效率之后[36],這些方法可以迅速接近ADS系統(tǒng)所需的精度。
目標(biāo)跟蹤
對(duì)于復(fù)雜和高速情況下的自動(dòng)駕駛,僅僅估計(jì)位置是不夠的,為了避免碰撞,還需要估計(jì)動(dòng)態(tài)目標(biāo)的航向和速度,以便應(yīng)用運(yùn)動(dòng)模型跟蹤目標(biāo)并預(yù)測(cè)目標(biāo)未來(lái)的運(yùn)動(dòng)軌跡。同樣的,一般都通過(guò)多個(gè)相機(jī),激光雷達(dá)或者雷達(dá)來(lái)獲取傳感器信息,且未來(lái)更好地應(yīng)對(duì)不同傳感器的局限性和不確定性,通常采用傳感器融合的策略進(jìn)行跟蹤。
常用目標(biāo)跟蹤算法依賴于簡(jiǎn)單的數(shù)據(jù)關(guān)聯(lián)技術(shù)和傳統(tǒng)的過(guò)濾方法。當(dāng)在三維空間中以高幀速率跟蹤對(duì)象時(shí),最近鄰方法通常足以建立對(duì)象之間的關(guān)聯(lián)。基于圖像的方法一般需要建立一些外觀模型,例如使用顏色直方圖,梯度或者其他特征(如KLT)等來(lái)評(píng)估相似度[44]。基于點(diǎn)云的方法也使用一些相似性度量,例如點(diǎn)密度,Hausdorff距離[45]。由于總是可能出現(xiàn)關(guān)聯(lián)錯(cuò)誤的情況,因此經(jīng)常使用多假設(shè)跟蹤(multiple hypothesis tracking)算法[46],這確保了跟蹤算法可以從任一時(shí)間內(nèi)的不良數(shù)據(jù)關(guān)聯(lián)中回復(fù)。一般我們都是在每幀中使用占據(jù)地圖(occupancy maps),然后在幀之間進(jìn)行數(shù)據(jù)關(guān)聯(lián),尤其是在使用多個(gè)傳感器時(shí)。為了獲得平滑的動(dòng)態(tài)特性,采用傳統(tǒng)的Bayes濾波器對(duì)檢測(cè)結(jié)果進(jìn)行濾波。
對(duì)于簡(jiǎn)單的線性模型,Kalman濾波一般是足夠的,而擴(kuò)展Kalman濾波器(EKF)和無(wú)跡Kalman濾波器(UKF)可用于處理非線性動(dòng)態(tài)模型。我們實(shí)現(xiàn)了一個(gè)基本的基于粒子濾波的目標(biāo)跟蹤算法,利用相機(jī)和3D激光雷達(dá)來(lái)跟蹤行人,結(jié)果如下(白色的表示軌跡)。
為了使跟蹤更具魯棒性,經(jīng)常會(huì)用到被跟蹤對(duì)象的物理模型。在這種情況下,首先使用諸如粒子濾波器之類的非參數(shù)化方法,之后利用一些物理參數(shù)(如大小)來(lái)進(jìn)行動(dòng)態(tài)跟蹤[47]。更為復(fù)雜的濾波方法,如raoblockwelled粒子濾波器,被用于跟蹤L型車(chē)輛模型的動(dòng)態(tài)變量和車(chē)輛幾何變量(dynamic variables and vehicle geometry variables)[48]。針對(duì)車(chē)輛和行人,現(xiàn)在有各種各樣的模型,甚至一些模型可以推廣到任何動(dòng)態(tài)對(duì)象。此外,深度學(xué)習(xí)也開(kāi)始被應(yīng)用于跟蹤問(wèn)題,尤其是對(duì)圖像領(lǐng)域。[49]通過(guò)基于CNN的方法實(shí)現(xiàn)了單目圖像的實(shí)時(shí)跟蹤。利用多任務(wù)網(wǎng)絡(luò)來(lái)估計(jì)物體動(dòng)力學(xué)的方法也在涌現(xiàn)[50],這進(jìn)一步表明了能夠處理多種感知任務(wù)的廣義網(wǎng)絡(luò)可能是ADS感知的未來(lái)。
道路和車(chē)道線檢測(cè)
前面介紹的邊界框估計(jì)方法對(duì)于某些感興趣的對(duì)象十分有用,但對(duì)于一些連續(xù)曲面(如道路)則不適用。可行駛曲面的確定是ADS的關(guān)鍵,所以把該問(wèn)題從檢測(cè)問(wèn)題中單獨(dú)出來(lái)作為一個(gè)子類研究。從理論上講,利用語(yǔ)義分割可以解決該問(wèn)題。一個(gè)簡(jiǎn)單的做法是從車(chē)輛自身來(lái)確定可駕駛區(qū)域,將道路分為若干個(gè)車(chē)道,并確立主車(chē)道,該技術(shù)被應(yīng)用在許多ADAS中,如車(chē)道偏離警告,車(chē)道保持和自適應(yīng)巡航控制[51]。更有挑戰(zhàn)性的任務(wù)就是怎么確定其他車(chē)道和對(duì)應(yīng)的方向,并在此基礎(chǔ)之上理解更復(fù)雜的語(yǔ)義,比如轉(zhuǎn)向和合并[52]。上述具體不同的任務(wù)對(duì)ADS的探測(cè)距離和可靠性要求各不相同,但是自動(dòng)駕駛需要對(duì)道路結(jié)構(gòu)有一個(gè)完整的語(yǔ)義理解以及長(zhǎng)距離探測(cè)多條車(chē)道的能力。
前面提到的數(shù)據(jù)預(yù)處理(包括圖像和點(diǎn)云)的方法,在道路處理中也同樣適用,比如歸一化照明條件(normalize lighting
conditions),濾波,顏色,強(qiáng)度,梯度信息統(tǒng)計(jì)等。另外,利用道路的均勻性和邊緣的突變(elevation gap at the
edge )我們可以使用區(qū)域生長(zhǎng)方法(region growing)[53]。也有一些基于機(jī)器學(xué)習(xí)的方法,包括將地圖與數(shù)據(jù)融合[54]或者完全基于外觀的分割[55]。一旦曲面被估計(jì)出來(lái)之后,就可以利用一些模型擬合來(lái)保證道路和車(chē)道的連續(xù)性,包括參數(shù)化模型(比如直線、曲線)和非參數(shù)化模型的幾何擬合。[56]提出了一個(gè)集成了拓?fù)湓?#xff08;如車(chē)道分割與合并)的模型,還可以結(jié)合車(chē)輛動(dòng)力學(xué)和動(dòng)態(tài)信息,利用濾波算法獲得更平滑的結(jié)果。
目前道路和車(chē)道線檢測(cè)已經(jīng)有許多方法,并且有些已經(jīng)集成到了ADAS系統(tǒng)中,但是大多數(shù)方法仍然依賴于各種假設(shè)與限制,能夠處理復(fù)雜道路拓?fù)涞恼嬲耐ㄓ孟到y(tǒng)尚未開(kāi)發(fā)出來(lái)。通過(guò)對(duì)拓?fù)浣Y(jié)構(gòu)進(jìn)行編碼來(lái)獲得標(biāo)準(zhǔn)化的道路圖并結(jié)合新興的基于機(jī)器學(xué)習(xí)的道路與車(chē)道線分類方法,也許會(huì)形成一個(gè)魯棒的可應(yīng)用于自動(dòng)駕駛的系統(tǒng)。
評(píng)估( ASSESSMENT)
一個(gè)魯棒的ADS系統(tǒng)應(yīng)該能夠不斷地評(píng)估當(dāng)前狀況的總體風(fēng)險(xiǎn)水平并預(yù)測(cè)周?chē){駛員和行人的意圖,缺乏敏銳的評(píng)估機(jī)制可能會(huì)導(dǎo)致事故。本節(jié)主要討論以下三類評(píng)估:總體風(fēng)險(xiǎn)和不確定性評(píng)估,人類駕駛行為評(píng)估和駕駛風(fēng)格識(shí)別。
總體風(fēng)險(xiǎn)和不確定性評(píng)估
總體評(píng)估可以理解為去量化駕駛場(chǎng)景的不確定性和風(fēng)險(xiǎn)水平,目的是為了提高ADS的安全性。[57]提出了一種利用貝葉斯方法來(lái)量化深度神經(jīng)網(wǎng)絡(luò)的不確定性。[3]設(shè)計(jì)了一個(gè)貝葉斯深度學(xué)習(xí)體系結(jié)構(gòu),并在一個(gè)模擬場(chǎng)景中展示了它相對(duì)于傳統(tǒng)方法的優(yōu)勢(shì)。這種方法的總體邏輯是每個(gè)模塊在系統(tǒng)中的傳遞與輸入都服從概率分布,而不是一個(gè)精確的結(jié)果。
另一種方法就是單獨(dú)評(píng)估駕駛場(chǎng)景下的風(fēng)險(xiǎn)水平,可以理解為前者是從系統(tǒng)內(nèi)部評(píng)估,后者是從系統(tǒng)外部評(píng)估。[58]將傳感器數(shù)據(jù)輸入到一個(gè)風(fēng)險(xiǎn)推理框架中,利用隱馬爾科夫模型(Hidden Markov Models ,HMMs)和語(yǔ)言模型檢測(cè)不安全的車(chē)道變更事件。[59]引入了一個(gè)深度時(shí)空網(wǎng)絡(luò)來(lái)推斷駕駛場(chǎng)景的總體風(fēng)險(xiǎn)水平,也可以利用來(lái)評(píng)估車(chē)道變更的風(fēng)險(xiǎn)水平。下圖是一個(gè)示例,代表兩種圖像序列下的風(fēng)險(xiǎn)評(píng)估結(jié)果
周?chē){駛行為評(píng)估
實(shí)際環(huán)境中的自動(dòng)駕駛決策還有周?chē){駛員的意圖與行為相關(guān)。目前該技術(shù)在ADS領(lǐng)域尚不常見(jiàn)。[60]用隱馬爾可夫模型(HMM)對(duì)目標(biāo)車(chē)輛的未來(lái)行為進(jìn)行了預(yù)測(cè),通過(guò)學(xué)習(xí)人類駕駛特征,將預(yù)測(cè)時(shí)間范圍延長(zhǎng)了56%。這里主要是利用了預(yù)定義的移動(dòng)行為來(lái)標(biāo)記觀測(cè)值,然后再使用HMM以數(shù)據(jù)位中心學(xué)習(xí)每種類型的特征。除此之外,還有一些其他的方法,比如貝葉斯網(wǎng)絡(luò)分類器,混合高斯模型和隱馬爾科夫模型相結(jié)合[61],支持向量機(jī)等。這一類評(píng)估的主要問(wèn)題在于觀測(cè)時(shí)間短,實(shí)時(shí)計(jì)算量要求高,大多數(shù)情況下,ADS只能觀測(cè)周?chē)?chē)輛幾秒鐘,因此不能使用需要較長(zhǎng)觀察周期的復(fù)雜模型。
駕駛風(fēng)格識(shí)別
人和機(jī)器最大的不同在于人是有情緒的,有些駕駛員比較激進(jìn),有些比較穩(wěn)重。2016年,谷歌的自動(dòng)駕駛汽車(chē)在換道時(shí)和迎面而來(lái)的巴士相撞,原因就是自動(dòng)駕駛汽車(chē)以為巴士會(huì)減速,而巴士司機(jī)卻加速了。如果能事先知道司機(jī)的駕駛風(fēng)格,并結(jié)合進(jìn)行預(yù)測(cè),這場(chǎng)事故也許是可以避免的。當(dāng)然,駕駛風(fēng)格目前還沒(méi)有一個(gè)準(zhǔn)確的定義,因此分類的依據(jù)也有很多種,比如油耗,均速,跟車(chē)行為等。一般來(lái)說(shuō),對(duì)駕駛風(fēng)格的分類大多是將其分為若干類,對(duì)應(yīng)于不同的離散值,但是也有連續(xù)型的駕駛風(fēng)格分類算法,比如[62]將其描述為介于-1到+1之間的值。
同樣,也有一些基于機(jī)器學(xué)習(xí)的方法。[63]采用主成分分析法( Principal component analysis, PCA),以無(wú)監(jiān)督的方式檢測(cè)出5個(gè)不同的駕駛類別。[64]使用了基于GMM的駕駛員模型來(lái)識(shí)別單個(gè)駕駛員的行為,主要研究了跟車(chē)行為和踏板操作(pedal operation)。[65]使用詞袋(Bag-of-words)和K均值聚類來(lái)表示個(gè)體的駕駛特征。[66]使用了一個(gè)自編碼網(wǎng)絡(luò)(autoencoder network)來(lái)提取基于道路類型的駕駛特征。類似的還有將駕駛行為編碼到3通道RGB空間中,利用一個(gè)深度稀疏的自編碼器(deep sparse autoencoder)來(lái)可視化各個(gè)駕駛風(fēng)格[67]。將駕駛風(fēng)格識(shí)別成功應(yīng)用到真實(shí)的ADS系統(tǒng)的目前還沒(méi)有相關(guān)報(bào)道,但是這些研究可能是未來(lái)ADS發(fā)展的一個(gè)方向。
規(guī)劃與決策
全局規(guī)劃
全局規(guī)劃是比較成熟的一個(gè)研究領(lǐng)域,幾乎所有車(chē)都已經(jīng)配備了導(dǎo)航系統(tǒng),利用GPS和離線地圖能夠輕易規(guī)劃全局路徑。全局路徑規(guī)劃可以分為以下四種:目標(biāo)導(dǎo)向(goal-directed),基于分割( separator-based),分級(jí)規(guī)劃( hierarchical)和有界跳躍(bounded-hop)。目標(biāo)導(dǎo)向最常見(jiàn),比如Djikstra和A*,已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域。基于分割的邏輯有點(diǎn)像路由算法,刪去一些邊或者頂點(diǎn),計(jì)算每個(gè)子區(qū)域間的最短路徑,這種方法可以有效加快計(jì)算速度。
基于分級(jí)的技術(shù)利用了道路的層次邏輯,比如道路有國(guó)道省道鄉(xiāng)道等,對(duì)于路線的查詢,層次結(jié)構(gòu)的重要性應(yīng)該隨著距離的增長(zhǎng)而增加。有界跳躍是一種典型的空間換時(shí)間做法,很明顯,計(jì)算一對(duì)頂點(diǎn)間的所有可能路徑是不切實(shí)際的,事先保存若干選定頂點(diǎn)之間的距離和路徑并在導(dǎo)航中使用才是一種合理的做法,對(duì)于路徑規(guī)劃的查詢可以利用標(biāo)簽集線器(hub labeling)[68]來(lái)加快查詢速度。當(dāng)然,這些方法并不互斥,互相組合的方法也很常見(jiàn)。[69]將分割法與有界跳躍法相結(jié)合,提出了Transit Node Routing
with Arc Flags(TNR + AF)算法。
局部規(guī)劃
局部規(guī)劃實(shí)際可以理解為為了實(shí)現(xiàn)全局規(guī)劃來(lái)找到一條足夠優(yōu)化且能避開(kāi)障礙物的軌跡。同樣可以分為四類:基于圖搜索(graph-based planners),基于采樣( sampling-based planners),曲線插值( interpolating curve
planners)和數(shù)值優(yōu)化( numerical optimization)方法。當(dāng)然,后續(xù)還有一些基于深度學(xué)習(xí)的方法。基于圖搜索的方法基本和基于圖的全局規(guī)劃差不多,Dijkstra和A*以及其改進(jìn)算法依然是最常見(jiàn)的方法。基于圖搜索常見(jiàn)的做法都是將地圖離散成狀態(tài)格,這種做法在高維的情況下會(huì)產(chǎn)生指數(shù)爆炸。因此就有了基于采樣的方法,最常見(jiàn)的基于采樣的方法是概率圖(PRM)和快速隨機(jī)搜索樹(shù)(RRT)。
這類方法的缺陷主要是不穩(wěn)定,在某些特定環(huán)境下可能要很長(zhǎng)時(shí)間才能收斂。曲線插值是在一系列已知點(diǎn)上擬合一條可行的軌跡曲線,常見(jiàn)的曲線有回旋線,多項(xiàng)式曲線,貝塞爾曲線等,這種方法的避障策略一般是插入新的無(wú)碰撞的軌跡,如果偏離了初始軌跡,則避開(kāi)障礙之后再返回初始軌跡。這種方法生成的軌跡較光滑,計(jì)算量也比較大,但是在實(shí)際ADS中,軌跡光滑一般意味著對(duì)乘客比較友好。
數(shù)值優(yōu)化一般可以用來(lái)改善已有的軌跡,比如[^70]利用非線性數(shù)值函數(shù)(numeric non-linear functions )來(lái)優(yōu)化A*得到的軌跡,[71]利用牛頓法解決了勢(shì)場(chǎng)法(Potential Field Method,PFM)的固有震蕩問(wèn)題。
隨著人工智能的火熱,一些基于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)方法的規(guī)劃策略也開(kāi)始涌現(xiàn)出來(lái)。[72]利用三維全卷積神經(jīng)網(wǎng)絡(luò)(Fully convolutional 3D neural networks)從激光雷達(dá)等輸入設(shè)備獲取點(diǎn)云并生成未來(lái)的軌跡。[73]利用深度強(qiáng)化學(xué)習(xí)在仿真環(huán)境下實(shí)現(xiàn)了交叉路口的安全路徑規(guī)劃。基于深度學(xué)習(xí)的缺陷前面已經(jīng)提到過(guò)了,缺乏硬編碼的安全措施,除此之外還有泛化能力問(wèn)題,數(shù)據(jù)來(lái)源問(wèn)題等,但總的來(lái)說(shuō),這一類方法應(yīng)該是未來(lái)的趨勢(shì)之一。
人機(jī)交互
車(chē)輛一般通過(guò)人機(jī)模塊(HMI)與駕駛員或乘客交互。互動(dòng)的強(qiáng)度取決于自動(dòng)化程度,傳統(tǒng)的L0的車(chē)需要持續(xù)的用戶操作輸入,而理論上L5級(jí)別的車(chē)僅需要在行程開(kāi)始的時(shí)候給予一個(gè)輸入即可。根據(jù)目的不同大致可以把交互任務(wù)分為兩類:首要任務(wù)(與駕駛相關(guān))和次要任務(wù),理論上講,次要任務(wù)的交互輸入更期望是非視覺(jué)選項(xiàng),因?yàn)橐曈X(jué)在駕駛?cè)蝿?wù)中是不可替代的,需要視覺(jué)的次要任務(wù)界面會(huì)影響首要任務(wù),從而影響駕駛的可靠性[72]。一個(gè)可替代的方案就是聽(tīng)覺(jué)用戶界面(Auditory User Interfaces ,AUI),聽(tīng)覺(jué)不需要刻意集中注意力于某個(gè)界面之上。音頻交互的主要挑戰(zhàn)是自動(dòng)語(yǔ)音識(shí)別(automatic speech recognition, ASR)。ASR算是一個(gè)比較成熟的領(lǐng)域,但是在車(chē)輛領(lǐng)域還有一些挑戰(zhàn),比如一些不可控的噪聲(駕駛噪聲,風(fēng)聲,道路噪聲等)。
除此之外,如何與ADS實(shí)現(xiàn)對(duì)話也是一個(gè)尚未解決的挑戰(zhàn)。人機(jī)交互最大的挑戰(zhàn)應(yīng)該是出現(xiàn)在L3和L4,這兩個(gè)階段需要人和ADS互相理解對(duì)方的意圖來(lái)實(shí)現(xiàn)手動(dòng)和自動(dòng)的切換。在監(jiān)控自動(dòng)駕駛時(shí),駕駛員會(huì)表現(xiàn)出較低的主觀認(rèn)知欲望,盡管可以通過(guò)一些基于頭部和眼睛追蹤的攝像機(jī)來(lái)識(shí)別駕駛員的活動(dòng),并使用視覺(jué)和聽(tīng)覺(jué)來(lái)提示駕駛員做好切換準(zhǔn)備,但目前主要是在模擬環(huán)境下實(shí)現(xiàn)[73],在真實(shí)環(huán)境中能夠高效切換的系統(tǒng)目前還未出現(xiàn)。這是一個(gè)懸而未決的問(wèn)題,未來(lái)的研究應(yīng)著重于提供更好的方法來(lái)告知駕駛員以簡(jiǎn)化過(guò)渡過(guò)程。
數(shù)據(jù)集和開(kāi)源工具
數(shù)據(jù)集對(duì)于研究人員和開(kāi)發(fā)人員來(lái)說(shuō)至關(guān)重要,因?yàn)榇蠖鄶?shù)算法和工具在上路之前都必須經(jīng)過(guò)測(cè)試和訓(xùn)練。通常的做法是將傳感器數(shù)據(jù)輸入到一系列具有不同目標(biāo)的算法中,并在標(biāo)注過(guò)的數(shù)據(jù)集上測(cè)試和驗(yàn)證這些算法。有些算法的測(cè)試是相互關(guān)聯(lián)的,有些則是單獨(dú)的。CV領(lǐng)域已經(jīng)有很多專門(mén)用于目標(biāo)檢測(cè)和跟蹤的標(biāo)注數(shù)據(jù)集,而對(duì)于端到端系統(tǒng),還需要額外的車(chē)輛信號(hào),主要包括轉(zhuǎn)向和徑向控制信號(hào)。
隨著學(xué)習(xí)方法的出現(xiàn),支持它們的訓(xùn)練數(shù)據(jù)集也隨之出現(xiàn)。從2005年一直增長(zhǎng)到2012年,PASCAL
VOC數(shù)據(jù)集是第一個(gè)包含大量ADS相關(guān)數(shù)據(jù)的數(shù)據(jù)集之一。但是這些數(shù)據(jù)通常以單個(gè)對(duì)象為特征,不能代表駕駛場(chǎng)景中遇到的情況。2012年,KITTI
Vision Benchmark通過(guò)提供大量的標(biāo)記駕駛場(chǎng)景彌補(bǔ)了這一缺陷,直到現(xiàn)在它仍然是自動(dòng)駕駛中使用最廣泛的數(shù)據(jù)集之一。當(dāng)然,從數(shù)量上來(lái)說(shuō),它遠(yuǎn)遠(yuǎn)比不上ImageNet和COCO這樣的通用圖像數(shù)據(jù)庫(kù)。
通用數(shù)據(jù)庫(kù)在訓(xùn)練某一特定模塊是有用的,但是由于缺少前后關(guān)聯(lián)信息(the adequate context),不足以用來(lái)測(cè)試ADS的能力。加州大學(xué)伯克利分校DeepDrive是一個(gè)帶有注釋圖像數(shù)據(jù)的最新數(shù)據(jù)集。牛津的RobotCar在英國(guó)使用六個(gè)攝像頭、激光雷達(dá)、GPS和慣性導(dǎo)航系統(tǒng)收集了超過(guò)1000公里的駕駛數(shù)據(jù),不過(guò)這些數(shù)據(jù)沒(méi)有標(biāo)注。還有一些其他的數(shù)據(jù)集可以見(jiàn)下表。
開(kāi)源框架和模擬器
常見(jiàn)的ADS開(kāi)源框架包括:Autoware、Apollo、Nvidia
DriveWorks和openpilot等。常見(jiàn)的模擬器包括CARLA、TORCS、Gazebo
、SUMO等。CARLA可以模仿各種城市場(chǎng)景包括碰撞場(chǎng)景,TORCS是一個(gè)賽車(chē)仿真模擬器,Gazebo 是一個(gè)常見(jiàn)的機(jī)器人模擬器,SUMO可以模擬車(chē)流量。
總結(jié)
這篇文章概述了在ADS中現(xiàn)有的一些系統(tǒng)及關(guān)鍵的創(chuàng)新。目前來(lái)看,自動(dòng)駕駛在很多方面都存在著明顯的缺陷。無(wú)論是模塊化還是端到端系統(tǒng),不同的模型都存在著各自的缺陷。具體到算法,建圖,定位,感知等方面,仍然缺乏準(zhǔn)確性和效率,對(duì)不理想的路況或者天氣的魯棒性也仍有待提高。V2X仍然處于起步階段,由于所需的基礎(chǔ)設(shè)施比較復(fù)雜,基于云的集中式信息管理也尚未實(shí)現(xiàn)。人機(jī)交互的研究還比較少,存在著許多問(wèn)題。
總結(jié)
以上是生活随笔為你收集整理的长篇自动驾驶技术综述论文(下)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 长篇自动驾驶技术综述论文(上)
- 下一篇: ISP算法高水平分析(上)