你的浏览器版本过低,可能导致网站不能正常访问!为了您能正常使用网站功能,请使用这些浏览器。
chrome
Firefox
当前位置:易车> 奔驰S级> 奔驰S级行驶> 摘要详情

一辆具备自动驾驶能力的奔驰S级轿车从德国慕尼黑几乎全程自动驾驶到

一辆具备自动驾驶能力的奔驰S级轿车从德国慕尼黑几乎全程自动驾驶到

摘要来自:《对不起,真正的智驾距离我们还很遥远》

【易车摘要频道】下列精选内容摘自于《对不起,真正的智驾距离我们还很遥远》的片段:

1995年,一辆具备自动驾驶能力的奔驰S级轿车从德国慕尼黑几乎全程自动驾驶到丹麦哥本哈根,全程共行驶1678公里,最高时速达到185公里。而在这个过程中最为重要的是,行驶全程几乎没有人为干预。

而这辆车使用的智驾系统的原理,和我们现在所见到的大部分智驾系统差不多。当时的奔驰用了纯视觉自动驾驶解决方案,用摄像头以及动态3D算法,分析和感知路况并进行车辆控制。

而业内更加公认的智驾技术的爆发起源,是2004年到2007年共举办了3届DARPA无人驾驶挑战赛。那些年散落在莫哈维沙漠的汽车零件,见证了一堆刚开始尝试自动驾驶的汽车笨拙的姿态。但是那些在戈壁滩上满头大汗调试无人驾驶原型车的工程师们,都已经成了这场汽车革命始祖级的中流砥柱。



即便当年还年轻的先贤们,如今已白头或者秃头,自动驾驶依然还没进化到突破我们想象力的程度,或者可以不客气地说,实现真正自动驾驶的时间表一直在延期。甚至于随着自动驾驶的逐步普及,我们对于这项技术在实用层面的定义被更加清晰地约束为“辅助驾驶”。交通的责任主体和真正的掌控者,仅从书面上的两字之差就能读出天壤之别。也就是在目力所及的时间里,驾驶的主体,依然无可辩驳的是:人。

春节前在地平线智驾的媒体沟通会上,创始人兼CEO余凯对于智驾的发言,带出了不少金句。比方说“2025年智驾迎来真拐点”、“智驾产业3年实现脱手开,10年实现随心开”。但相信有不少人看到这些的时候会有和我同款的疑惑:“什么?还要等10年才能实现真正的智能驾驶?”



就这个问题,我觉得地平线副总裁兼首席架构师苏箐所讲可能会更加清晰一点。他认为自动驾驶技术的比较对象,并非友商。而是人类本身。它的价值是一个拐点式的价值——他比不过人的时候,其实就是高科技的玩具;当有一天比人好的时候,价值立刻就会跳上去,也就是两段式的价值。

“很不幸的是,到目前为止还没有一个系统真正达到了这一拐点,我们只是看到了这个希望。”

这种对于自动驾驶能力的阶梯论,并非是苏箐个人的论调。就在前段时间李想的Ai Talk中,他也说到了L3级别的自动驾驶,是AI在人指挥下完成一些任务,但是需要人负责兜底。而下一个阶段,是不需要人负责,可以自主根据要求完成任务。

所以,如果更简单一些理解这个问题的话,就需要把自动驾驶的发展进程拆成两部分,初级阶段可以被称为“模仿人类”,而更高级的阶段,则是“超越人类”。

很可惜的是,即便有天量的资金、技术、算力和人的投入,我们目前的自动驾驶,依然处于无限接近模仿人类的阶段。而超越人类,则是另一个阶梯之上的需求。

无论当下如何营销辅助驾驶对于事故的处理能力,从数据层面上来说,现在的辅助驾驶跟人类相比还是有着巨大的能力差距。在上个月,高盛出了一份对于特斯拉FSD的最新研报,给出的结论是:即使是最新的V13版本FSD能够体现出技术的不断进步,但其表现还未能达到超越人类驾驶的安全水平。根据测试体验、众包数据以及第三方评价,FSD V13的关键干预距离达到了400到450英里之间,97%的驾驶过程中无需发生干预。而Waymo的历史数据显示,其车辆在加州的城市环境下每8.5万英里才会发生一次关键干预。



关于这个数据,类比到人是这样的结果:根据美国政府的交通安全数据,普通车辆每60到70万英里可能发生一次事故。也就是说,自动驾驶和人类驾驶的差距截止目前还是数量级的差距。

悲观一点说,即便付出如此多的努力,自动驾驶仍然还处在一个“高科技玩具”的阶段。


自动驾驶什么时候才能开始“下半场”


当然,往好的方向看,至少在过去的2024年,自动驾驶所取得的发展程度,是多年来未见的。

从技术角度来说,自动驾驶的三大要素:算法、算力和数据,三个方面在2024年都斩获了不少的闪光点。在算力上,几百TOPS的芯片已经量产上车,小鹏、理想和小米三家的辅助驾驶算力都超过了500TOPS,蔚来的4颗英伟达Orin-X芯片算力已经破千TOPS。在数据上,成百上千万辆智驾车辆整跑在路上,每时每刻都在为智驾能力的提升提供数据支撑。

最大的突破,可能来自于算法方面。端到端、VLM、VLA等等大模型在过去这一年成为了最炙手可热的流行词,而这方面的爆发趋势,追根溯源还是AI在过去两年内产生了革命性的突破。2023年3月,支持多模态输入的GPT-4横空出世,秀出了其在图形理解能力方面的肌肉。它所引发的反应,便是视觉-语言模型 (VLMs)相关研究工作大跨步的增长。

我们如何通俗的理解这场变革呢?如李想所说,自动驾驶的模型会与大语言模型相融合去理解真实世界,像真正的大脑一样,而非当前端到端模型所采用的压缩记忆方案。正因为此,李想给理想提出的要求是,确保基座模型进入AI行业前三,空间智能做到中国第一,而不只是与其他车企竞争。

看上去似乎前景很光明,对不?但实际上技术提升的过程更像苏箐所描述的那样:“一个新的方法起来以后,第一天你会觉得它很美好,能解决所有的问题;第二天又会对它引起怀疑;第三天你会发现边界就在那里。”

比方说端到端模型,它的弊端就是放大了神经网络黑盒不可解释的问题。不可解释、不可控的性质会导致系统虽然能够处理复杂场景,但是简单场景很可能会出现犯“弱智”错误的情景。另一方面,模型能力的提升是有瓶颈的。当模型能力已经达到每10万公里的行驶数据中只有1公里的数据能够训练模型进行改进时,想要让整个模型的能力进一步升级,那需要的基础数据量和算力都会是一个惊人的规模。这就像是前几年ETH挖矿,越挖,难度越是指数级的上升。

再换个更加通俗易懂的形容,这种感觉就跟拼多多砍一刀似的,最后的1%所付出的努力,可能需要比前面99%还要多。

这种问题,特斯拉的FSD也会遇到。就在今年特斯拉股东大会上,马斯克承认了当前FSD所面临的挑战,主要是测试AI模型的效率以及判断新模型是否更优秀的水平能力。当AI模型在数千英里的行驶过程中仅出现一次需要人工干预的情况时,如何迅速而准确地评估新模型的优劣就变得更加困难。

CopyRight © 2000-2025 BitAuto,All Rights Reserved. 版权所有 北京易车信息科技有限公司    购车咨询:4000-168-168 (周一至周日 9:00 – 21:00) 法定假日除外