地平线算法工程师胡义涵、邵文昕:基于自动驾驶场景Occupancy和Flow的运动预测 | 自动驾驶新青年讲座01

语言: CN / TW / HK

「自动驾驶新青年讲座」由智东西公开课全新企划,将邀请全球知名高校、顶尖研究机构以及优秀企业的新青年,主讲在环境感知、精准定位、决策规划、控制执行等自动驾驶关键技术上的最新研究成果和开发实践。

有兴趣分享的朋友,可以与智东西公开课教研团队进行邮件([email protected])联系。

运动预测是自动驾驶技术的关键组成部分之一,主要解决了自动驾驶车辆与周围环境中的其它运动物体(车辆、行人等)的协同交互问题。在自动驾驶系统中,运动预测模块扮演了承上启下的作用。其承接上游环境感知的结果,为下游规控提供运动推理,直接影响着自动驾驶系统的安全性和灵活性。

运动预测模块主要用于根据环境感知得到的信息,包括运动物体的位置、速度、朝向、物体分类等,以及环境信息,包括道路拓扑结构、信号灯等,预测运动物体未来一段时间内的行为意图,并将预测的结果转化为时间维度和空间维度的轨迹。

运动预测的常见方法包括基于轨迹的运动预测和基于占据栅格(Occupancy Grids)的运动预测。前者预测准确率比较低、不能充分地利用历史轨迹点数据、对车辆轨迹的波动比较敏感等缺点,后者容易丢失身份信息,并且无法从栅格中提取运动信息。而基于Occupancy和Flow的运动预测算法,可以弥补基于轨迹的运动预测和基于占据栅格的运动预测的不足,并能预测出自动驾驶场景中其他运动物体的运动和位置概率。

6月20日,CVPR 2022自动驾驶研讨会公布了Waymo开放数据集挑战赛结果。地平线算法工程师胡义涵和邵文昕等人提出的层级化时空Occupancy和Flow预测网络HOPE,得到honorable mention,并受到同行的广泛称赞。

HOPE由一个时空编码器、一个多尺度聚合器和一个分层 3D 递归解码器组成。首先,时空编码器从时空输入中生成多尺度特征,之后聚合器在编码器的不同尺度上交互和融合特征,最后通过时空解码器将压缩的特征解码为时间相干预测的路径点。同时,HOPE还重新设计了多个损失函数,并涉及了许多技巧,像Test Time Augmentation (TTA)、Stochastic Weight Average (SWA)等。基于所有这些创新内容,HOPE 在 Flow-Grounded Occupancy AUC 上实现了最高准确度0.8389。

6月29日早10点,智东西公开课邀请到HOPE的主要贡献者地平线算法工程师胡义涵和邵文昕参与「自动驾驶新青年讲座」,进行第1讲的直播讲解,主题为《基于自动驾驶场景Occupancy和Flow的运动预测》。

两位讲者首先将介绍自动驾驶运动预测的研究背景,并分析BEV视角下基于Occupancy和Flow的运动预测算法优势。之后他们会重点讲解HOPE网络,及其实验与可视化结果,并就与上下游感知和规控任务的承接和耦合进行解读。

本次讲座将以视频直播形式进行,包含40分钟主讲和20分钟问答。同时,针对本次讲座,也组建了专属交流群,届时讲者胡义涵和邵文昕将加入,欢迎大家申请。

第1讲

主题

基于自动驾驶场景Occupancy和Flow的运动预测

提纲

1、自动驾驶运动预测算法的研究背景

2、BEV视角下基于Occupancy和Flow的运动预测算法优势

3、HOPE:层级化时空Occupancy和Flow预测网络

4、实验及可视化结果

5、与上下游感知和规控任务的承接和耦合

讲者

胡义涵,地平线算法工程师,毕业于北京大学、加州大学圣地亚哥分校。

邵文昕,地平线算法工程师,毕业于南京大学、伦斯勒理工学院。

课程信息

6月29日10:00-11:00

「其他文章」