CVPR2022來了:華人學生斬獲最佳學生論文,特設緬懷孫劍博士環節

語言: CN / TW / HK

作者 | 王玥

編輯 | 陳彩嫻

新奧爾良當地時間6月21日上午8:30,計算機視覺領域公認三大頂級會議之一CVPR 2022開幕。

CVPR開幕式伊始,由大會主席Jiri Matas致辭,並介紹了本次大會的4位主席及5位程式主席。

值得一提的是,本次大會有兩位華人主席,分別是主席權龍(Long Quan,上排右二)與程式主席華剛(Gang Hua,下排左二)。

接下來主席Jiri Matas介紹了CVPR 2022的投稿情況:

本屆CVPR一共收到8161份論文投稿,接受論文2064份,截止2022年6月20日有9981位出席者註冊,且實地出席與網路出席幾乎各佔50%。

接下來程式主席華剛介紹道,CVPR的投稿和接收的論文呈現出每年15%的漲勢。華剛博士暢想道, 隨著這樣的漲勢,也許有朝一日地球上每個人都會投稿一篇論文(笑)。

本屆CVPR投稿的8161篇論文由23389位作者投遞, 其中44.59%的作者來自中國, 20.75% 的作者來自美國。

華剛博士繼續介紹道,本屆接收了2064篇論文,接收率為25.3%。

考慮到網路出席與實體出席參半的情況,本屆CVPR將以混合方式舉行。其中將實體會議將舉行344場5分鐘時長的口頭報告以及2064個海報研討。

本屆CVPR的300位AC(Area Chair)來自於北美、歐洲、亞洲、澳大利亞及南美。 其中有55位女性 ,101位首次擔任AC一職。

1

緬懷孫劍博士

由於此前孫劍博士因病去世,本次CVPR特地設定了懷念孫劍博士環節,由程式主席華剛帶領全場緬懷這位傑出學者。

圖注:大會緬懷孫劍博士頁面

孫劍博士於1976年10月出生,曾任微軟亞研院首席研究員,此前他曾兩次獲CVPR最佳論文獎。

2016年7月,孫劍正式加入曠視,任首席科學家、曠視研究院院長,主導曠視技術研發。在他的帶領下,曠視研究院推出了多項具有代表性的工作。

Google Scholar資料顯示,孫劍博士論文引用量達到286002次,h-index為121。

圖注:孫劍博士的Google Scholar頁面

程式主席華剛博士介紹道,作為CV領域的知名學者,孫劍博士研究成果碩果累累。如果要說出孫劍博士的三篇論文代表作,那麼第一篇他認為應該是"Stereo matching using belief propagation"。

論文連結:https://ieeexplore.ieee.org/abstract/document/1206509

第二篇則是他帶領團隊完成的“去霧”論文“Single Image Haze Removal Using Dark Channel Prior",也正是這篇論文獲得了亞洲第一個CVPR最佳論文獎。

論文連結:https://pubmed.ncbi.nlm.nih.gov/20820075/

第三篇則是“Deep Residual Learning for Image Recognition”。正是這篇論文提出了他最為人所熟知的成就——與何愷明等團隊成員攜手創造出的殘差網路ResNet。ResNet在2015年提出之後,拿下過ImageNet冠軍,並斬獲了CVPR 2016最佳論文獎。

殘差神經網路的主要貢獻是發現了“退化現象(Degradation)”,並針對退化現象發明了 “快捷連線(Shortcut connection)”,極大的消除了深度過大的神經網路訓練困難問題。正是由於ResNet,神經網路的深度首次突破了100層、最大的神經網路甚至超過了1000層。

論文連結:https://arxiv.org/abs/1512.03385

在華剛博士介紹後,大會上播放了孫劍博士的親友及同事們所製作的紀念影片,藉以懷念這位良師與益友。

2

頒獎環節

本屆黃煦濤紀念獎(Thomas Huang Memorial Award)由 李飛飛獲得。

黃煦濤紀念獎以計算機視覺領域泰斗黃煦濤命名,其設立是為了表彰在計算機視覺領域長期提供服務、研究和指導的傑出人士。

論文連結:https://arxiv.org/abs/2112.03907

最佳學生論文榮譽提名的是《Ref-NeRF:Structured View-Dependent Appearance for Neural Radiance Fields》。

神經輻射場(NeRF)是一種流行的檢視合成技術,其能夠將場景表示為一個連續的體積函式,由多層感知機引數化,提供每個位置的體積密度和視相關的輻射亮度。雖然基於NeRF的技術擅長於表示具有平滑變化的視相關外觀的精細幾何結構,但它們往往不能準確地捕捉和再現光滑表面的外觀。而這篇論文通過引入Ref-NeRF來解決這個限制問題,Ref-NeRF取代了NeRF的引數化視相關的出射輻亮度與反射輻亮度的表示,並使用一組空間變化的場景屬性來構造這個函式。

論文連結:https://arxiv.org/abs/2203.13254

程式碼地址:https://github.com/tjiiv-cprg/epro-pnp

獲得最佳學生論文的是《EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation》,可以見到這篇論文全部由華人作者合作完成。

其中,第一作者Hansheng Chen來自同濟大學。

這篇論文稱,通過n點透視(Perspective-n-Points, PnP)從單個RGB影象中定位3D物體是計算機視覺中一個長期存在的問題。在這篇論文中,作者提出了EPro-PnP,這是一種用於廣義的端到端姿態估計的概率PnP層,這種PnP層輸出在SE(3)流形上的姿態分佈,本質上將分類Softmax引入連續域。

論文連結:https://openaccess.thecvf.com/content/CVPR2022/papers/Sheinin_Dual-Shutter_Optical_Vibration_Sensing_CVPR_2022_paper.pdf

而最佳論文榮譽提名的是《Dual-Shutter Optical Vibration Sensing》。

在這篇論文中,作者團隊提出了一種新穎的方法,可以使用額定僅為130Hz的感測器感知多場景中的高速震動(高達63kHz)。

論文連結:https://arxiv.org/abs/2112.03424

程式碼地址:https://github.com/petrhruby97/learning_minimal

本屆CVPR獲得最佳論文獎的是《Learning to Solve Hard Minimal Problems》。

這篇論文提出了一種在RANSAC框架下求解困難幾何優化問題的方法。原來的幾何優化問題放寬會產生具有許多偽解的最小問題,而這篇論文提出的方法避免了計算大量的偽解。

影片連結:

https://www.youtube.com/watch?v=GIOyBbSu2gw

雷峰網 (公眾號:雷峰網) 雷峰網

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知