在数据驱动的自动驾驶时代,只有获得新的Corner Case数据,把数据本身包含的知识压缩到智驾的模型里,才有可能推动智驾算法的进步。换言之,闭环Corner Case不是问题的关键,关键的问题是怎么找到并发现Corner Case这种高质量数据。
通用化的解决方案是特斯拉首创的影子模式。具体是,在人驾模式下,定义一些触发机制,当满足触发条件时,车端智驾系统向云端上传数据。触发条件可以是人驾动作和智驾决策不一致的地方、急踩刹车的时刻,也可以是感知系统出现矛盾的时刻,比如发现车辆前方有一个白色物体,感知系统一会儿把它识别成横在马路中间的货车车厢车顶,一会儿把它识别成蓝天上的白云。
但是,在需要智驾系统全速运行的智驾模式下,影子模式背后的算力资源就分身乏术了。在智驾模式下,满足当下场景的实时性要求比满足未来系统迭代的数据采集更加重要,全速运行的智驾芯片很难在触发条件满足的情况下分出多余的算力进行数据的筛选、清洗和上传。
为了解决这个问题,特斯拉选择升级智驾芯片,将HW4.0芯片的算力提升了5倍,从而留出了多余的算力继续运行影子模式。
本土车企这边,采用四颗Orin被大家伙喷了好几年的蔚来,给出了一个差异化答案:群体智能。其做法是单独拿出一颗算力高达254TOPS的英伟达Orin芯片完成这项工作,其它芯片着眼当前,保证行车安全、场景通过率和通行效率,这颗用于群体智能的芯片立足长远,为智能驾驶算法的升级迭代提供宝贵的数据。而且,这颗用于群体智能的芯片还可以对采集数据进行筛选,过滤掉绝大部分的无效数据,降低车机流量负担和云端的算力负担。
发现Corner Case的另一种方案就是生成Corner Case。比如华为,2019年成立车BU,到2021年进入了智驾第一梯队,2022年ADS系统搭载量没有多少就开始和小鹏叫板,到2023年问界M7还没起死回生之前就敢剑指特斯拉——它的底气来自强大的自动驾驶仿真能力。
华为依靠在大模型领域的长期布局、对传感器系统的深度自研(对仿真很重要),通过生成式AI强大的场景生成能力重建Corner Case场景,进行模型的训练,从而完成了从0到1的跳变。
值得一提的是,理解能力和生成能力都有了数量级提升的生成式AI不是2022年年底(ChatGPT问世时)才出现的,早在2020年,华为盘古大模型就已经达到千亿参数级别,而且实现了多模态。
图片来源:华为2021全连接大会
对头部智驾车企而言,随着智能驾驶系统能力的提高,实车测试可以捕捉到的长尾场景越来越少了,所以,借助仿真闭环Corner Case的当然不只有华为一家。
比如小鹏在AI DAY上,也透露通过仿真测试加快模型迭代的方法。据悉,基于折算10亿+里程的视频训练、超646万累计公里数的实车测试、超2.16亿累计公里数的仿真测试,小鹏汽车端到端大模型已经能够做到“2天迭代一次”,距特斯拉的“一天迭代一次”只有一步之遥;而在未来18个月内小鹏称其智驾能力还能提升30倍。
扩大里程覆盖
无论华为还是蔚小理,本土车企都非常强调对NOP+/NGP/NCA/NOA开通路线的验证和运营——验证指的主要是验证车端感知系统对这条路线的道路拓扑推理能力,运营指的主要是对这条路线进行云端建图。
如果把影子模式理解为“大家一起来找茬”的话,那么,里程验证便可以理解为“大家一起来建图”。
即使是在无图(无高精地图)时代,轻量级地图对于高阶智驾系统依然是不可或缺的,最近,特斯拉通过百度提供的高阶辅助驾驶地图在国内落地FSD的传闻,结结实实地说明了地图的重要性。地图解决的不只是对车端进行道路拓扑的实时感知提供感知冗余,更重要的是,它提供了一种对于行驶路线上道路拓扑的长期记忆。
长期记忆可以提高系统感知的速度和实时性。人类驾驶员跑熟了一条路线后,对路口、车道、交通标识了然于心,之后再跑的时候,脑回路中处理驾驶行为的系统2(需要花费更多的时间和精力)切换到了系统1(基于直觉和记忆快速响应),就不用花费那么大的精力了,智能驾驶系统显然也该拥有这样的记忆。
图片来源:蔚来汽车
百度的车道级导航地图是个明牌;暗牌方面,小鹏汽车的AI代驾大概也是针对特定路线建图。
图片来源:小鹏汽车
还有一个例子是蔚来汽车。在蔚来自动驾驶系统架构图中,自动驾驶算法的核心指标是“看得全、想得深、记得住、好身手”。按照自动驾驶系统的认知方法论——感知、决策、执行来理解的话,决策层面要做到“想得深”,执行层面要做到“好身手”,感知层面不仅要依靠车端做到“看得全”,还可以依靠云端地图实现“记得住”。值得一提的是,蔚来的云端地图不止记忆和智能驾驶相关的图层信息,还记忆包含路面颠簸情况的4D路况图层,在智能驾驶系统的舒适性衡量指标上,应该也大有帮助。