华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典
本文授權轉載自公眾號機器之心
原文:https://mp.weixin.qq.com/s/YRcajgSTJq_evwtn7ZFo4A
點擊**加入極市CV技術交流群**,交流更多計算機視覺相關的技術干貨
剛剛,CVPR 2019 頒發了今年的所有獎項。來自 CMU 的辛書冕等人獲得了最佳論文獎,而最佳學生論文獎被 UCSB 王鑫等人獲得。李飛飛、李佳等人因 ImageNet 的貢獻獲得最具影響力論文獎。
作為計算機視覺領域內最負盛名的學術會議,今年的 CVPR 已于當地時間 6 月 16 日在美國加州長灘開幕。
與很多討論 AI 技術的會議相同,CVPR 如同往屆一樣異常火熱,吸引了大量來自學術界、產業界的研究員、開發者以及非技術人員的參與,以至于今年大會官方不得不「因注冊人數太多」而提前截止了注冊,并取消現場注冊。
當然,這并沒有難倒我們,機器之心的小編還是成功注冊了這一盛會,為大家帶來最及時、全面的報道。
大會主席之一朱松純教授開場
據朱松純教授介紹,今年大會共有 9227 人注冊參會,突破歷屆記錄,其中來自國內的參會人數達到 1044 位,僅次于大會舉辦地美國(4743 位)。
在論文方面,CVPR 作為計算機視覺領域的頂級學術會議,今年論文提交與接收數量也突破記錄:來自全球 14,104 位作者提交了 5160 篇論文(這個數字比 CVPR 2018 增加 56%),最終接收了 1294 篇,接收率約為 25%。
照這個增長速度預計,在 CVPR 2028 年就會有 108 億篇投稿了?

和去年一樣,CVPR 2019 投稿論文作者中來自中國的最多,占 39%。
在介紹完數據情況之后,就進入了今天的重頭戲:獲獎論文。
最佳論文
今年的最佳論文由卡耐基梅隆大學、倫敦大學學院、多倫多大學獲得,論文一作辛書冕是卡耐基梅隆大學機器人研究院的博士二年級學生,主要研究方向是計算機視覺和計算機圖形學,師從 Srinivasa Narasimhan 和 Ioannis Gkioulekas 教授。
辛書冕本科就讀于西安交大,畢業后赴美讀書,并于 2016 年 12 月在 CMU 獲得電子與計算機工程碩士學位。
最佳論文解決了什么問題?
據獲獎詞所言,這篇最佳論文對于非視距(non-line-of-sight/NLOS)重建作出了重大貢獻,特別是為智能體賦予了看到角落的能力。
那么什么是非視距問題呢?就是我們不再假設攝像頭能直接看到某些場景,很多光子會因為散射或反射等情況朝著與鏡頭相反的方向前進。
而這些光子又會因為不可見場景的反射,重新回到鏡頭前,它們會帶有不可見場景的各種信息。
這些不可見場景返回的信息對于重建該場景非常重要。例如圖 1 顯示了一個硬幣浮雕的微米級估計,該硬幣可以從拐角處看到,也可以通過厚紙(漫射器)看到。
例如在 a 圖中,本來紅色的 detector 是觀察不到隱藏的硬幣的,它只能直接觀察到可見的表面。但是有一些光子會因為漫射而觀察到硬幣,并反回 detector,從而能獲取隱藏目標的信息。
圖 1:非視距成像。研究人員考慮了一些重建物體表面的情況:a)處于傳感器的視野之外;b)被漫射器遮擋。在 c)中,研究人員對比了他們的重建結果,和對物體進行深度掃描的真實結果。
值得一提的是,機器之心昨天發布的一篇論文也與非視距成像有關,但是那項研究使用的是聲學系統,即利用聲波「看到」墻角后面的物體。
與光學成像相比,該聲學系統的硬件系統沒有那么昂貴,但重建圖像所用的時間較短,距離卻比光學方法高出 2 倍。有興趣的讀者可以對比一下兩篇論文。
論文:A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
論文鏈接:http://imaging.cs.cmu.edu/fermat_paths/assets/cvpr2019.pdf
摘要:研究者提出了一種新的光費馬路徑(Fermat path)理論,該光在已知的可見場景和不處于瞬態攝像機視線范圍內的未知物體之間。這些光的路徑要么從鏡面反射,要么被物體的邊界反射,因此編碼了隱藏物體的形狀。
研究者證明,費馬路徑對應于瞬態測量中的不連續性。然后他們推導出一個新的約束,該約束將這些不連續處路徑長度的空間導數與曲面法線聯系起來。
基于該理論,研究者提出了一個名為 Fermat Flow 的算法,來估計非視距物體的形狀。該方法首次精確恢復復雜物體的形狀,從漫反射到鏡面反射,這些物體隱藏在角落里,也隱藏在漫射器后面。
最后,該方法與瞬態成像使用的特定技術無關。因此,研究者用 SPAD 和超快激光展示了從微微秒尺度瞬態實現毫米尺度的形狀恢復,以及使用干涉法實現從飛秒尺度瞬態到微米尺度的重建。
最佳學生論文
今年的 CVPR 最佳學生論文是加州大學圣巴巴拉分校(UCSB)王威廉組(William Yang Wang)與微軟研究院的合作文章《Reinforced Cross-Modal Matching & Self-Supervised Imitation Learning for Vision-Language Navigation》,第一作者王鑫。
極市之前也曾分享這篇論文的解讀:CVPR2019 | 審稿排名第一滿分論文:讓機器人也能「問路」的視覺語言導航新方法
本文是 CVPR 滿分文章(3 個 Strong Accept),在 5160 篇投稿文章中審稿得分排名第一,在獲獎之前被程序委員會和領域主席評審團確定為 CVPR 2019 口頭報告論文。
在這一研究中,作者在視覺語言導航任務上提出了一種新的方法以探索未知的環境。值得一提的是,王威廉組主攻自然語言處理,這是一次跨方向研究的成功典范。
最佳學生論文講了什么?
「向右轉,到達廚房后再左轉,轉過桌子進入走廊……」使用新技術后的機器人可以根據這樣的路線指令行事了,就像人類一樣。
這篇論文主要解決的是視覺-語言導航(VLN)問題,即研究如何通過自然語言告訴智能體該怎么運動,智能體需要像問路者那樣根據自然語言導航至目的地。
因為自然語言是完整路徑的指導,而智能體只能觀察到當前局部視野,因此重要的是智能體需要知道當前局部視覺對應著語言指導的哪一步。
為了解決視覺-語言導航中出現的各種問題,這篇論文提出結合強化學習(RL)和模仿學習(IL)的解決方案。
如下圖 1 所示為 VLN 任務的示例,左側的 Instruction 是用于指導智能體該怎么走的自然語言,除了接收指令外,智能體只能看到 Local visual 所示的局部圖像視野。
因為智能體并不能獲取全局軌跡的俯視圖,所以它只能將自然語言指令「想象」成全局的視覺軌跡,然后再根據局部視野一點點探索并導航至目標。
圖 1:VLN 任務演示。圖中展示了指令、局部視覺場景和俯視圖的全局軌跡,智能體并不能獲取俯視圖信息。路徑 A 是遵照指令的演示路徑,路徑 B 和 C 是智能體執行的兩個不同路徑。
在這篇論文中,作者主要通過增強型跨模態匹配(RCM)和自監督模仿學習(SIL)處理 VLN 任務。
其中 RCM 會決定當前智能體應該關注自然語言中的哪一個子指令,以及局部視野哪個畫面與之相對。
同時 RCM 還會評估已走的路徑到底和自然語言指令相不相匹配。而 SIL 主要是探索未見過的環境,從而模仿過去的優良經驗而走向目的地。
經典論文:PAMI Longuet-Higgins 獎
Longuet-Higgins 獎是 IEEE 計算機協會模式分析與機器智能(PAMI)技術委員會在每年的 CVPR 頒發的「計算機視覺基礎貢獻獎」,表彰十年前對計算機視覺研究產生了重大影響的 CVPR 論文。該獎項以理論化學家和認知科學家 H. Christopher Longuet-Higgins 命名。
今年的 Longuet-Higgins 獎由 Jia Deng、Wei Dong、Richard Socher、李佳、Kai Li 和李飛飛于 2009 年發表在 CVPR 大會的論文《ImageNet: A Large-Scale Hierarchical Image Database》摘得。
如今,ImageNet 是每個人工智能從業者都耳熟能詳的名詞。這篇論文可以說開啟了一個時代,它在 Google Scholar 上的引用量高達 11508 次。不過 ImageNet 論文在 CVPR 2009 被大會收錄時還僅僅是一篇「普通」的 Poster 論文。這篇論文誕生的第二年,計算機視覺領域盛大賽事 ImageNet 挑戰賽拉開序幕,ImageNet 成為計算機視覺識別領域的標桿,并促進該領域取得巨大突破。
此外,它還催生了深度學習的大發展。著名的卷積神經網絡 AlexNet 在奪得了 2012 年 ImageNet LSVRC 冠軍,且準確率遠超第二名,引起了巨大轟動。之后,沉寂許久的神經網絡重煥生機,取得了長足進步。
在頒獎儀式后,機器之心對李飛飛、李佳、鄧嘉進行了簡單的采訪。談到此次獲獎,李飛飛認為,「做研究要做長遠的有影響的,不要只看眼前的潮流,大家還是致力于做踏踏實實有影響力的研究。」
回顧過去 10 年 ImageNet 的發展,李佳表示,「09 年的時候,參加 CVPR 的人沒有像現在這么多。我們挺想讓更多人知道 ImageNet 的,我們還做了 ImageNet 的筆,到處去宣傳去推廣。鄧嘉在這上面花了非常多的時間,最早的時候我們在想怎么用自動化的方法去網頁上收集所有的圖像,包括我在 07 年的時候有一篇論文叫《OPTIMOL: A Framework for Online Picture Collection via Incremental Model Learning》,我們以前假設用 OPTIMOL 算法就可以來構建包含整個 web 上面圖像的數據庫。飛飛也非常有遠見,想和斯坦福的語言學家合作構建這樣的 web size 圖像數據庫,最后算法還是被人類打敗了哈哈。很多工作是通過 mechanical turk 平臺做得。我們實驗室的一位同事和我們講,mechanical turk 是一個非常強大的工具,可以吸引很多人通過眾包的方式來構建這個 web-based 知識圖庫。鄧嘉一直專注于研究計算機視覺和機器學習和系統,最后才有 ImageNet。」
鄧嘉說,「這個項目很說明一件事情,當時做 ImageNet 不是最主流的工作,但是我們所有做此項目的人都相信它會有很大的影響,所以我們就花了很大力氣做這個事情。確實,它給我自己的一個啟示是,你不一定要做最流行的事情,但要做自己相信會有影響的事情。」
李佳補充說,「當時主流思想不是這方面工作,當時大家主要做理論的、手動編碼的機器學習,用數學的方法去解決通用難題。其實很多臟活苦活需要做,鄧嘉的堅持我們都有目共睹。」
談到這個歷程中最大的困難,鄧嘉說,「現在看來該怎么做很清楚,但當時想做一個數據集需要做很多決定——到底應該從什么來源收集數據?數據應該是什么樣的?你需要什么標簽?整個過程有很多決策需要做。現在看來,這些問題的答案都是很顯然的,每一步你都是對的,但實際上不是這樣,我們很多決定都是經過許多反復,最后才達成了我們想要的效果,這個中間其實有很多思考的。」
「當時我們經過了很多思考,我們無法預測你做了這個以后,社區會怎么利用它,具體會在什么問題上產生巨大影響……但是,這件事情在當時看來顯然是必須要做的。」
「因為數據本身還是要解決某些問題,我們其實是在做一個問題,計算機視覺領域和其他一些領域之間的差別就是我們需要去解決根本問題。不管是建立數據庫還是算法,最終都是為了解決問題。所以開始的時候我們有想要解決的問題,想要得到這個領域的認同則是之后的事情了。」李佳表示。
最佳論文榮譽提名
獲得最佳論文榮譽提名的論文有兩篇,分別是:
A Style-Based Generator Architecture for Generative Adversarial Networks
作者:Tero Karras、Samuli Laine、Timo Aila
論文鏈接:https://arxiv.org/abs/1812.04948
論文:Learning the Depths of Moving People by Watching Frozen People
作者:Zhengqi Li、Tali Dekel、Forrester Cole、Richard Tucker、Ce Liu、Bill Freeman、Noah Snavely
論文鏈接:https://arxiv.org/abs/1904.11111
計算機先驅獎(Computer Pioneer Award)
計算機先驅獎于 1981 年由 IEEE 計算機協會設立,用于表彰至少在十五年以前對計算機領域發展做出突出貢獻的個人。
今年獲得計算機先驅獎的是 Jitendra Malik,是加州大學伯克利分校電氣工程和計算機科學專業的一位教授。他同時也是生物工程專業的一位教授。
Malik 教授的主要研究領域是計算機視覺,特別是在人類視覺、計算機圖形學和生物圖像分析方面有很多突出成果。
一些知名的理論和算法出自 Malik 教授和他領導團隊的研究,包括各向異性擴散(anisotropic diffusion)、歸一化分割(normalzied cut)、高動態范圍成像(high dynamic range imaging)等。
根據 Google Scholar 的數據,Malik 教授有 6 篇論文平均被引用超過千次。
論文新工具與 310 萬美元贊助
比較有趣的是,CVPR 官網發布了一個交互式數據可視化的工具,讓我們能夠通過主題或者機構查閱論文,以及查看這些論文相關日程。
從上圖中我們可以看出,深度學習、識別、人體姿態等是今年大會最為熱門的技術主題,收到了大量的論文。通過這個工具,用戶可以查看自己感興趣主題的論文。
此外,用戶還可以從機構入手查看論文。例如,搜索「Baidu」、「Kwai」(快手)這些關鍵詞,就能夠查到這兩家公司的論文信息,包括論文主題、論文標題、大會上的日程安排。
 百度的論文信息。
快手的論文信息
在小編看來,隨著論文接收數量越來越多,學術會議提供這樣的工具能為社區提供極大的便利。下一屆我們就需要有關大會論文的數據集了。
最后,本屆 CVPR 也收獲了共計 310 萬美元的贊助,共有 284 家贊助商、104 家展商。眾多贊助商包括曠視、商湯、百度、華為、快手和大疆等國內科技公司。
計算機視覺頂會自然少不了科技公司的參與,在本次大會開幕前不久,IEEE「限制華為審稿」事件引發了學界震動,同屬 IEEE 旗下的 CVPR 是否會受影響也曾是人們討論的話題。
不過,PAMI TC 主席 Bryan Morse,CVPR 2019 大會主席 Larry Davis、Philip Torr 與朱松純聯名發布了一份聲明,歡迎包括華為員工在內的所有學界、業界人士前來參會,收獲了人們的廣泛好評。
總結
以上是生活随笔為你收集整理的华人包揽CVPR 2019最佳论文,李飞飞ImageNet成就经典的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: CVPR2019最全整理:全部论文下载,
- 下一篇: 1077篇!ICCV2019接收结果公布