专访 | MINIEYE 杨一泓:车内摄像头的坑,不只关乎于技术
封面出处:visagetechnologies.com
本文将包含但不限于以下内容:
为什么政策要推动 DMS 摄像头上车;
为什么车内摄像头容易成为麻烦制造者;
DMS/OMS 技术应用落地过程中的坑可真不少;
为什么车内摄像头在商用车领域普及得比乘用车更快;
社会大众对车内隐私的朴素诉求,行业其实一直都很重视。
名词解释:
DMS——Driver Monitoring System 驾驶员监测系统
OMS——Occupancy Monitoring System 乘员监测系统
正文:
最近,有关车内摄像头造成隐私风险的话题,又一次因为某个事件进入了大众的视野里。
我们在 《被摄像头包围的智能汽车,你的隐私在哪里?》 一文里,就事件背后的逻辑,和用户们的隐私焦虑进行了讨论。
大家先不用急着在「车辆有没有必要装摄像头这类视觉传感器」的问题下结论。实际上,国内就政策层面率先对「两客一危」等商用车车型安装 DMS 系统作出强制要求,乘用车辆的搭载要求也在推进制定中。
地球的另一边,Euro NCAP 已经明确,基于视觉的驾驶员监控功能,将成为新车获得五星评级的必要条件。同时欧盟也颁布法规,2022 年 7 月后,所有具备 L2 及以上自动驾驶系统的车辆(包括载人及载物)将强制装配疲劳分神预警系统(DDAW)。2024 年 7 月之后,所有的新车将强制安装此功能。
喜不喜欢是每个人的权利。无论如何,摄像头在汽车座舱中的落户已经是大势所趋。
跟着大家一起骂街再容易不过。但倾听行业的发声,弄清楚背后的道理,才是我们应该做的。
前几天,我带着好奇,与智能驾驶解决方案供应商 MINIEYE 的智能座舱事业部总经理杨一泓,围绕着车内 DMS/OMS 摄像头的一系列问题聊了聊。
MINIEYE 副总裁,智能座舱事业部总经理 杨一泓
这场知无不言的线上对谈聊下来我才发现,摄像头上车的门道,远比大家想得复杂得多。
以下是对谈的实录(G 为 GeekCar,Y 为杨一泓)
G:从 MINIEYE 作为行业玩家的视角来看的话,世界上的主要汽车大国在政策或标准推动 DMS 功能上车这方面,现在大环境是怎样的状态?
Y:一直以来,大家对我们的认识是一家做智能驾驶解决方案的公司。我们最开始决定进入座舱领域,就是因为敏锐地感受到了市场需求,并看到欧盟开始制定一些相关法规。
2013 年,欧盟颁布了针对新生产的重型商用车搭载 AEB(自动紧急制动系统)、LDW(车道偏离预警)相关的法案。国内跟进的进度,大概会在 3 到 5 年左右,就会出现相关的强制标准。
DMS 和 OMS 也一样,特别是由于现在整体上大家对于技术的追求更高,我们相信国内同类政策出台落地的时间点会缩得越来越短。 特别是今年开始,欧盟强制要求 L2 以上的所有新车型,都必须配备 DMS。所以我们相信,国家也会针对乘用车领域推出政策标准。我们分析,在 2024 年到 2026 年左右会有相关的政策落地。
除了 DMS,欧盟也会对车内儿童检测 CPD(Child Presence Detection),可能会在明年左右推出相关的测试标准。不管是欧盟的强制安装,还是 Euro NCAP 的新车评级,都会作为一个行业标准确定下来。同样的,我们预计国内也会出台相关的法律法规。
G:这么来说的话,国内这种军备竞赛似的竞争,恐怕不止是政策方面的因素在推动吧?
Y:对,其我觉得座舱很有趣的一点,跟自动驾驶还不太一样。在自动驾驶这方面,大家能够明显感觉到,行业标准和法律法规对于整个市场的推动促进作用还是很大的。大家会对更多的新功能,有一些通过法规或行规驱动的诉求。
座舱就很有意思,现在座舱的市场现状更像是内卷的结果。
这些年新品牌、新玩家不断涌现,品牌的定义、调性、个性化,包括品牌针对的消费群体,很多时候是要通过座舱的功能来体现科技感,或者说增强体验感。
所以新品牌新玩家进入行业之后,也带来了高科技属性的各色座舱。这也促使一些传统品牌的决策者们,会认为「新玩家有的,我们作为传统品牌也一定要有」。
所以,其实座舱市场走得比我们最开始计划的还要快和激进,不得不说不完全是行业标准造成的,这是大家之间的竞争造成的一种利好。
OMS 摄像头下儿童检测
G:不管是 DMS 还是 OMS,现在车内视觉方面的行业玩家们,大家在走怎样的技术路径?MINIEYE 走了哪一条路?
Y:视觉相关的大分类里面包括了 3D 和 2D 这两种玩家。
3D 玩家里面就有主要包括像结构光、ToF 这样的传感器。
遵循 2D 技术路径的玩家,包括我们在内走的是视觉+深度学习的技术路径为主。
还有一派就是雷达派,即毫米波雷达。我们可以看到的比如市面上的部分车型,就会利用毫米波雷达来做一些车内的活体监测。
其实每一种技术路径都有各自的长短板。对于我们自己,注重落地是 MINIEYE 的思维方式。 对于车厂来讲,增加任何一款传感器,肯定都希望能够实现它的性价比,实现更多的应用场景。分开看现有的这几大类传感器,2D 路线在延展性和普适性会更有优势。
具体来说还是要看应用。如果只是车机登录这样简单的 FACE ID 操作,2D 都可以实现。而在支付级别的 FACE ID,以及人脸开门等功能,需要用到 3D。
毫米波雷达的技术路径也是如此。毫米波雷达进行活体监测判断的是基于胸腔的起伏,来进行判断。但是除此以外,毫米波雷达只能判断座舱里面有活物,至于活物到底是大人、小孩还是宠物,是没有办法进行判断的。这说明毫米波雷达这类技术在场景上是相对单一的。
前面提到过的 CPD 儿童检测算是实现难度相对较高的一类。未来的法规一定会对车内检测要区分成人和儿童这点上提出要求。
所以综合考虑下来,我们认为 2D 的技术路线相对而言功能性更全。
G:你提到了结合场景来落地。说到这里,短视频平台啊社交网络啊上面也有很多演示车内交互的视频,看上去十分酷炫。
Y:其实我们做了非常多交互类的功能,比如各种各样身体语言的交互。这并不是想象,而是我们确实从客户那里收到了真实需求。
前面提到的短视频平台上这种病毒式传播的内容,催生了很多新颖的交互方式。
不仅仅是在座舱里面,我们甚至也收到了一些需求,需要汽车以一些更加酷炫的方式来进行响应。比如站在车边上做一些车外交互,希望车能配合我跳跳舞、闪闪灯、开开窗。
这是基于品牌在短视频平台上展开一些营销传播活动的需求 ,希望自家产品看起来更加酷炫,大家看到也会觉得有趣,对吧?
我个人认为 对座舱层面而言,还是安全跟舒适导向这两者才是真正的硬需求,也是行业最为看中的 。但目前来看,很多需求还是推广传播层面的软需求。
G:不妨展开再讲讲硬需求?如果咱们把 DMS 和 OMS 放在一起来看的话,靠它能够去实现的功能,就像大家都知道的驾驶员身份识别、疲劳监测、活体检测这类,实际应用场景都有哪些?
Y:硬需求最坚实的一个功能就是 DMS(Driver Monitoring System,对驾驶员的监测)。但这里的 DMS 并不是传统概念上的疲劳,或是后装和商用车场景想到的那些东西。我认为疲劳和分神,都是对于注意力的判断。
为什么我们要强调注意力的判断?现在来看,不管是 L2,或者更高级别 L2 的各种说法,随着智能驾驶越来越普及,其实每个人对于相关技术的信任度是不一样的。大家都能看到,最近几年不断出现的,由于过分信任自动驾驶技术而导致的一些悲剧。不可否认的是,自动驾驶本身还有很多需要持续不断完善的场景。
对于驾驶员在接管车辆方面注意力的要求,其实是 DMS 技术未来几年最为核心的任务。
对系统来说,要判断驾驶员现在适不适合接管,以及相应的辅助驾驶状态要不要持续,这是非常重要的。这里面包含了很多非常细致的工作,包括对于驾驶者视线、当前人体状态,以及面部微表情的一些分析。这些是不能够简单地用「疲劳」或者「 分神 」的状态来概括的。
2021 年我们在发布 I-CS(In-Cabin Sensing)座舱感知量产方案时,提出了无缝入车、安全接管、疲劳监测、儿童看护以及多人娱乐这五大场景。就安全监管这部分的生理判别标准,我们的参照是针对临床性的人体反应数据,来进行诊断和总结的。
这也是我们在做欧盟出口项目里面最大的挑战,也是 MINIEYE 自认为最擅长的一部分。我们希望能够认真从人的临床表现出发,来判断他的真实生理状态,而不是用制式的固定动作作为目标。
DMS 驾驶员疲劳监测画面
G:其实功能的体现,在狭义层面上去理解的话,会不会就是大家可能会冲着车内摄像头做一些自己理解可能触发的挑逗性动作,然后看系统的反应是不是期待中的那种,来判断技术产品好不好用。实际上这类产品的机制,跟大家的想象有什么区别?
Y:是有很大区别的。你刚刚提到的这种动作叫做 Trigger Behavior,指的是能够刺激算法给出反应的那些动作。试想一下, 如果整个 DMS 的机制是围绕这样的一系列动作,来设计和建立整个预警机制的话,会产生什么效果?是系统互过分敏感,时常提醒、胡乱报警,或者更加过分。
我们在体验某一款量产车型的时候,就会不断接到研发人员的反馈,认为自己在正常开车,但是会不断地受到来自系统的分神报警。其实这就是过于敏感造成的,很影响体验。
在我们交付量产的时候,客户会要求我们给出三种不同的模式。比如其中的「演示模式」,就会放大这种「敏感」。比如说 4S 店想要展示这个功能的时候,它就要非常基于 Trigger Behavior 来做判断,探测到闭眼或者转头之类的动作,系统就会出来提醒你。
实际上这些都是可以基于算法实现的,但是在日常开车的时候就不行了。实际需求会要求算法把敏感度降到非常低的程度,只去做最极端的判断,就是为了让最终体验感更好。
但是我认为降敏只是治标的手段。 最核心的还是做机器学习算法的人,不能把疲劳或分神当成计算机视觉的一个 task。我们确实需要去理解人为什么会疲劳、人疲劳以后的生理表现到底有哪些。
所以在我们看来,座舱相关的很多功能其实是跨学科的产物。如果你只懂技术,只关心你自己的算法,只关心图像的结果,是做不好 DMS 功能的。
G:实际上还是有一些 corner case 的。以往在我们的智能座舱评测工作中,也遇到过一些比较奇怪的 Bug。比如说某辆车里是有 DMS 和 OMS 监测的,我在思考的时候可能下意识地会把手放在下巴上,或者嘴边。然后摄像头捕捉到了,就说监测到车内有人吸烟,然后马上就要开窗进行强制通风。实际上这不是这种明显的误判并不是个例。背后的大体原因可能会是哪些?
Y:从宏观层面来讲的话,误判大概可以分为两类原因。
一类可以总结为 CV(计算机视觉)的天然短板 。这一类原因无论再怎么优化,数据量再怎么加大,也无法完全避免,只能说通过不断优化来实现最优的结果。
举个例子。我们在做疲劳或吸烟监测的时候,有时候会拿回来一些系统误报的 corner case。仅仅通过采集的图像,可能肉眼都没有办法完整判断是不是有疲劳闭眼,或者是有没有在吸烟,还是手上拿了一支笔。对于驾驶场景下采集到的画面,有些时候哪怕是人眼都没有办法准确判断的。想想看,人类的大脑比现在设计的神经网络要复杂那么多。所以这一类问题,是可以解释为计算机视觉的天然短板。
另外一类就很精细和具体了,跟供应商在某一个功能落实的场景当中,有没有反复钻研是非常有关的 。
我们还是用吸烟的这个例子。有的方案供应商可能不会做全脸全图的检测,而是以抠图的形式,crop 一小块图像下来。可能就是嘴附近的 100×100、100×200 像素的一小块,放到神经网络里面去训练,crop 的大小、怎么标注,都会严重影响最后出来的误检率。这部分需要供应商反复尝试,甚至需要一些大胆的预先投入。比如在 crop 的大小上,要学习具体的物体,还是学习具体的手势,抑或是物体跟手势一起学习。在这种细枝末节的方案上面,会出现很多不同的版本。
像 MINIEYE 这种解决方案的供应商,肯定会把训练出来最好的版本交付给客户。这也是去年的发布会上我们提到的,MINIEYE 最大的优势之一,就是即便在单一功能的落地上面,也会有多个不同的解决方案的版本,或者说多个不同的算法版本。
DMS 驾驶员视线识别
G:理解,毕竟计算机算法仍然没办法依赖通识来理解人类世界。那么,监测和识别的灵敏度我们要如何去平衡?过度的灵敏提供的往往不是便利,而是困扰。
Y:这其中一定是从体验感反推的 。
我们今年在做出口车型过欧标的时候,发现欧盟对于 DMS 疲劳监测这部分的打分,是基于临床学的理论。我们可以这么理解,就好比说找一些不知道 DMS 技术的人,真实地把人家耗疲劳了。然后来将监测系统的判断结果,与本人对于疲倦感的主观判断,做一个验证核对。
这一套做法其实也是我们一直在推崇的。我们的流程中,有大量对算法版本的真实测试工作,包括跟许多驾校之间的合作。在确保安全的前提下,教练车上会产生大量的长时间驾驶数据,而且参与测试的一定不能是研发人员。因为研发人员太清楚,哪怕不自觉下意识地都会做一些触发动作。这样的测试结果,数据真实性是要打折扣的。
所以对我们来说, 一直获得来自这些非研发团队的真实疲劳数据,能够帮助我们的研发人员设计出非常精确的阈值 。当然,产品在判断的时候能做到在必要的时候才会报警,体验感才是最好的。
G:刚才咱们也提到过,在商用车领域的业务已经开展一段时间了。我们之前就了解到,DMS 在货运物流这类大型商用车上,普及的速度会比销售的乘用车要更快一些。实际上的行业现状是不是这样的?
Y:是的。因为商用车最大的需求,就是购买者有真实存在的监管疲劳的需求。因为监管对象是企业的雇员,而不是乘用车的车主。如果出现疲劳驾驶,不管是雇员的人身安全,还是财产,都会伴随着巨大的风险。所以企业往往会有更强硬的需求,运用车内摄像头和 DMS 技术来实现监管的工作。
而 对于乘用车辆来说,消费者自己目前还没有产生非常明确的主动要求,来进行疲劳驾驶的自我管理 。不管是车企客户也好,还是我们自己作为供应商也好,都要直面一个需要扭转的逻辑,就是乘用车上是没有严格的主观监管需求。
对于车主们的自信,我们也倾向于以更加柔和的服务,来把这门技术推荐给大家。比如播放音乐,或者呼叫重要联系人,通过通话交流带来一些相对柔和的「刺激」。以这样的方式来辅助 DMS 功能,才有更好的体验感。
技术再好,也需要包装得更加符合使用者的心理,才能进入「好用」的范畴。
人脸识别无缝入车
G:最近又出现了关于车内摄像头的功能设计,与用户担心个人隐私泄露之间矛盾的问题。近几年随着国家层面立法对数据安全的保护,社会大众在数据隐私方面诉求的觉醒,对车企和供应商也提出了要求。我们怎么看待这类问题?
Y:首先, 从根本上来讲,车内的监测功能在底层设计上一定要 off-line 。采集到的任何东西都是本地处理,处理完毕之后就删除。这是一种没有任何储存照片或视频的机制,实际上从系统层面来讲是可以设计的。而且,事实上现在很多咱们耳熟能详的乘用车企业就是这么设计和要求的。就以作为供应商的我们自身来讲,即便是做一些 OTA 升级,在车上采集到的图片跟数据,第一我们是没办法拿走的,第二是在本地也不会进行储存。
人们的焦虑很容易理解,有一个摄像头出现在视野里,会给消费者们造成一些担心。实际上从系统设计的层面,本身就不会存在这样的风险,不过整个系统本身的网络安全防攻击还是要做好的。
另外就是社会层面,我认为在数据安全和个人隐私这部分上,一直都是一个需要行业与 社会 大众一起来努力的事情,也请消费者对技术给与更多了解的欲望,和更多的信任。
在此之前,车厂要做好自己相关系统的网络安全设计,行业要一起去规范每一类技术的边界。
就像每个人的智能手机正面都有摄像头。技术、行业、社会的发洪流展,已经不是个够阻拦的层面了。就像我们 MINIEYE 本身就是参与其中的算法供应商,更希望通过我们的努力来推动技术产品更加安全地落地。我们有经验,知道整个链条中存在什么样的风险。但是 单凭一方的力量,是不足以推动整个大环境的。需要技术供应商们,车厂的代表,消费者的代表们坐到一起,大家一起给技术设立明显的边界。
OMS 实现多人娱乐交互
G:这的确是个需要各方一起投入努力来确定的事情。那么有没有一些可取的具体做法?我之前关注到 MINIIEYE 和 360 是有合作的。
Y:是的,MIINIEYE 和 360 在网络安全方面是有在进行合作的,我们在一起探索防止网络攻击方面的技术。
前面说过,在我们自己的技术框架下,不管是图像还是视频都不会保存,哪怕是在本地,数据跟功能之间的联动模式也是用完即弃。我们的做法是通过网络把人脸的图片转化成 512 维的矢量加密文件。不仅没有办法还原成照片,也不能从外部的技术体系里面认出这到底是谁。
其实现在车厂是比较考虑消费者感受的。实际上 比起真正的技术和网络安全,消费者还会需要心理层面的安全感。 很多人都不会希望有一个明晃晃的摄像头摆在视野里,因为那会形成一种无形的压迫感。反而在关心隐私到底有没有被采集和泄露之前,摄像头出现在肉眼可见的范围里,就已经先让人感觉不舒服了。
像是去年我们跟另一家供应商一起展出的一块车内屏,就采用了纯屏下摄像头的方案,由我们提供的算法。从肉眼整体看过去是完全看不到摄像头的,甚至连切割的涂层都做得非常隐蔽,观感就很好。
当然,厂商有义务向消费者说明摄像头的存在。但从心理层面来讲,只要不出现在视野之中,大家就不会产生强烈的抗拒感。
很多人都会用小贴纸或者其他东西贴在自己笔记本的摄像头上,做一个物理屏蔽。我自己以前也会贴,这其实是一种朴素的抗拒。每个人的手机也有前置摄像头,但我们都不会把它遮住,对吧?这是普罗大众在心中接受了它的存在。
手机没问题,但电脑和车内的摄像头会让人产生警惕,这其实是一种非常自然的生理防御动作。但这些又不完全是技术能够解决的范畴。所以 大家在产品形态设计上的努力,在理念和观念上的引导说明,都还有很长的路要走。
写在最后
也许是被迫居家办公太久,整个人都憋坏了。至少在这次专访前,我也一直没想明白,为什么明明车内摄像头制造的麻烦看上去要远多于带来的实惠,车企们还是这么趋之若鹜。甚至会和很多人一样,认为这不过又是顶着 KPI 压力的产品经理们,被迫发明出来的需求。
然而,事实并不是大家想的那样。
世界主要汽车大国和地区,无一不推动着法规先行,来从分神和疲劳的危险驾驶行为中,更多地保护车内驾乘人员的生命安全。
不管 2D 还是 3D、视觉派还是雷达派,车企和供应商们也在通过各不相同的技术路径中,持续不断地探索和布局,试图带给消费者更多。
经历了互联网野蛮生长的阶段,社会大众的数据安全意识已经完全觉醒,大厂口中「愿意用隐私换取便利」的说法已经完全站不住脚。从已经施行的《中华人民共和国数据安全法》,到欧盟的 GDPR(General Data Protection Regulation,通用数据保护条例),国家、社会、民众、厂商,仍然向着好的方向在前进。只不过,彼此之间还是有点儿像在各走各的。
不管是车内播放有声内容突然出现吓人台词的巧合,还是看上去并不合理的车内摄像头功能, 总会成为社会热点新闻。即便风波过后,也会不时被媒体们提起和鞭策。一桩桩一件件,无形中加深了民众对新生技术事物的不信任。
动机和初衷都是好的。现在来看,面对社会大众的朴素诉求, 行业上下最为欠缺的,是与消费者、与社会舆论之间的有效沟通,和建立标准的推动力 。
我相信,在 21 世纪的第三个十年结束之前,绝大多数人都会开上带有车内摄像头的汽车。在那之前,如何让人们不排斥、更加自然地接受它和背后技术的存在,从社会到行业,还有很多事情要做。
- 通往 1000 公里续航的「捷径」是什么?
- 对集度 ROBO-01 的一些观察和质疑
- 如何让一个传奇品牌焕发新生?
- 盲定 smart 精灵#1 ?不如先来看一眼实车
- 沃尔沃的新伙伴,是全球最火「吃鸡」游戏的开发商
- 看过阿维塔 11 的座舱之后,问题变多了
- 专访 | MINIEYE 杨一泓:车内摄像头的坑,不只关乎于技术
- 被摄像头包围的智能汽车,你的隐私在哪里?
- 长安 C385,乱拳打死老师傅?
- 岚图梦想家,想要「卷垮」合资品牌 MPV?
- 四月新能源汽车销量榜,几家欢喜几家愁
- 「干掉」那些物理按键:是曲线创新,还是矫枉过正?
- 每天上班玩电竞是什么体验? 福特中国创新数字工具助力整车开发
- 百度 Apollo 主驾无人,打响国内 Robotaxi 下半场第一枪
- Robotaxi,世界首富的新战场?
- 小 baby 要的,车企产品经理给不了
- 智能座舱情报局|当造车新实力开始狂点智能科技树——岚图 FREE
- 手势交互,到底靠不靠谱?
- 把一块平板电脑装进车里,靠谱吗?
- 国产宝马 X5 和 i3 上市,宝马的搏杀正式开始