DeepMind助力Waymo!提升自动驾驶AI准确率,还能加快模型训练
魚羊發自凹非寺
量子位報道公眾號 QbitAI
在自動駕駛領域,谷歌 Waymo 無疑是標桿一樣的存在。
現實世界中,Waymo 已經行駛了 1000 多萬英里(約 1600 萬公里),而在模擬駕駛中,行駛里程更是達到 100 億英里。
作為第一家提供自動駕駛出租車服務的自動駕駛汽車公司,Waymo 早在去年 12 月,就落地美國亞利桑那州鳳凰城。但歷經大半年,Waymo One 仍未能開出鳳凰城,商業化進展遠不如公眾預期。
商業化道路走得艱難,與技術進展息息相關,現在,DeepMind 也出手了。
強強聯手
能夠可靠引導無人駕駛汽車的 AI 模型需要無限次的測試和微調,對算力也有很高的要求。
為了提高 AI 算法訓練的有效性和效率,Waymo 正在與 DeepMind 展開合作,DeepMind 在博文中提到,這次,他們受到了達爾文進化論的啟發。
Waymo 的工程師解釋,AI 算法通過反復測試實現自我提升,這一過程就是不斷嘗試并根據反饋進行調整。這樣,模型的表現在很大程度上是取決于訓練方案的。
找到最佳方案通常需要依靠研究人員和工程師豐富的經驗。他們會精心挑選訓練中的 AI 模型,剔除表現最差的模型并釋放資源,從頭開始訓練新算法。
手動調整自然可以快速產生更好地結果,但這太過依靠人力了。
于是,DeepMind 設計了一種基于進化競爭(Population Based Training)的自動優化超參數的方法。
基于進化競爭
基于進化競爭,簡稱 PBT,結合了手動調整和隨機搜索的優點。該方法從隨機變量(超參數)開始,訓練多個機器學習模型。
模型會被定期評估,并以進化的方式相互競爭,表現不佳的模型就會被“后代”(變量發生些許變化的表現更好的成員的副本)取代。
PBT 不需要從頭開始重新訓練,因為每個后代都會繼承其父網絡的狀態,并且在整個訓練過程中積極地更新超參數。
也就是說,PBT 能將大部分資源用于訓練良好的超參數值。
但是,PBT 也并不完美。它傾向于優化當前的結果而不考慮長期效應,這不利于后期發力的 AI 模型。
DeepMind 的研究人員考慮到了這一點,他們為此訓練了更多群體,并創建了稱為利基(niches)的子群體,它們的算法僅允許它們進行內部競爭。最后,這個子群體通過提供更多獨特模型在競爭中獲得優勢,這就鼓勵了多樣性。
成效如何
DeepMind 和 Waymo 將 PBT 應用于行人,自行車和摩托車駕駛員識別任務,目的是調查是否可以提高召回率(確定的障礙物在場景障礙物總數上的比例)和精度(檢測到的障礙物的一部分實際上是障礙而不是誤報)。
最終,他們試圖訓練單一的 AI 模型,以保持超過 99% 的召回率,同時減少誤報。
Waymo 報告說,這些實驗為評估真實世界模型的魯棒性提供了一個“現實的”框架,這反過來又為 PBT 算法的選擇競爭提供了依據。
實驗表明,進化競爭需要快速評估的支持,PBT 模型每 15 分鐘就要評估一次。Google 數據中心的數百分布式機器的并行化使這一需求成為可能。
Waymo 還說,PBT 算法能夠實現更高的精度,并且減少 24% 的誤報,同時也能保持較高的召回率。
此外,PBT 所需的訓練時間和計算資源僅為原來的一半。根據 Waymo 的說法, PBT 已被直接納入 Waymo 的技術基礎架構。
傳送門
DeepMind 博客:
https://deepmind.com/blog/how-evolutionary-selection-can-train-more-capable-self-driving-cars/
作者系網易新聞·網易號“各有態度”簽約作者
總結
以上是生活随笔為你收集整理的DeepMind助力Waymo!提升自动驾驶AI准确率,还能加快模型训练的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 华为2018年收入超阿里腾讯总和,任正非
- 下一篇: SpaceX星舰原型“星虫”成功进行了自