小鹏自动驾驶钱蓓:第二代VLA对汽车来说只是一个开始,未来可适用所有的物理终端
2026年1月31日,2025“智驾天梯榜”年度盛典重磅启幕,智驾行业顶尖专家、企业高管、投资机构代表与车主代表齐聚一堂,共赴这场年度行业盛会。

小鹏汽车自动驾驶运营高级专家钱蓓发表演讲时表示:对小鹏汽车来说,所有的这些研发,汽车可能就是一个开始,汽车本质上是四个轮子的机器人,我们今天做的世界模型或者说我们的第二代VLA架构,本质上不只是服务于汽车,我们希望这个架构未来可以适应各种各样的物理终端。
以下为钱蓓演讲实录(略有删减):
大家下午好!我是小鹏汽车自动驾驶中心的钱蓓,今天很高兴有这个机会受第一电动的邀请,我们来做一个年终的总结和分享,我感觉今天这个场子非常像一个智驾圈的年会,我们感觉经历了非常艰难的一年,但是细想起来做智驾这个东西好像没有哪一年是不难的,2025一整年我们关注了一整年的智驾大赛,我觉得每次有比赛开始的这个礼拜六都很像开盲盒,大家知道小鹏的车主是特别喜欢科技的,参赛也特别积极,但是参赛这个东西就是有高有低、有起有落,每次比得好也就算了,比不好,我们跟王总的感受一样,整个评论区塌陷,回去仔细反思今天为什么会得这个分,我们还有很多车主是特别特别认真,我看有些车主是能够在比完比赛之后,如果比不好出一篇特别长的作文,仔仔细细地做赛事的复盘,车主一个人在线上复盘,我们内部可能有一群人在线下阅读那篇复盘的复盘,非常感谢我们有这样的机会,这个是给了我们车企很好的一个窗口,就是我们跳出自己的视角,看看在比赛的场景下,在车主的眼光,以及在那些围观群众的眼光里面,智驾到底是什么东西。
我今天结合我们经历的2025年以及我们从智驾大赛当中得到的一些感悟,也跟大家分享一下我们过去一年做的事情和我们正在做的思考。如果大家看今年一年整个关于车圈的媒体的词频的统计,我相信自动驾驶这个词应该比往年任何时候都出现得更频繁,过往2025年很有可能我们来到了一个在历史上距离自动驾驶最近的一个时刻,可能是因为小鹏自动驾驶的研发团队相当有科研精神,我们有的时候会往回回溯一下今天做的事情是怎么来的,最早的时候其实自动驾驶是,大概是上世纪60年代,这是斯坦福为了做登月项目做的一个,现在看来也就是一个小推车,其实是一个自动驾驶行驶的汽车,这个是好像我们今天做的所有事情的开始。我经常觉得19世纪五六十年代是整个世界技术史上特别了不起的年代,大概在那个时间段,关于半导体、关于AI、关于自动驾驶的火种就基本上开始了,但是这几个技术有一个特点,就是它的生长周期特别长,大概要过了整整六七十年的时间,我们觉得芯片、AI、自动驾驶这几个东西好像有点四水归一的味道,可能会在某一个节点融为一体,最终让这个行业走向自动驾驶。
我们看一下市场的趋势,我们觉得2020年是一个重要的分水岭,一款软件,在互联网时代,当它的渗透率突破10%的时候,接下来可能就会迎来比较快的发展和增长的阶段,整体上我们觉得中国的高阶智能驾驶软件也在经历这个过程。相对来说,我觉得小鹏汽车的智驾软件渗透率肯定远远高于行业平均的,这个还是跟我们的用户有关系,我们的用户大概在小鹏刚开始重投自动驾驶的时候我们就有了一批对科技非常有信仰,对于展示科技非常有热情的用户,大概是这样一群用户的激励,很大程度上促使着我们一直在行业里面探索一些比较前沿的,可能在早期也不算是共识性的自动驾驶技术也好,产品也好,功能也好,可能比较早,我已经没有办法把这个时间线再往前面拉了,PPT的长度不够用。我们2020年做高速泊车,后来做高速自动驾驶,后来做城市,在2025年我们做了特别多的事情,大家也知道我们在开发我们全新的下一代的自动驾驶基座模型,我们也在智能驾驶这个产品的功能和定义上做了很多新的探索,比如说我们在第4Q,把车位到车位这种过去认为很高阶的智能也下放到了两万美元级别的车型上,所以一直非常受到用户的喜欢。
正是因为这个行业年复一年在卷,智驾早期是特别极客的功能,其实用的人不多,但是就这两年好像大家就把整套东西卷成了全国都能开、全国都好开,我觉得小鹏在里面还是做了挺多的事情。
我们过去一年小鹏智驾整个的复盘,我们梳理了一下发现过去一年所有小鹏车主开NGP辅助驾驶的里程增长了118.5%,辅助驾驶使用的时长增长了大概133.5%,是一个很大的增幅,我们发现一个特别有趣的数字,过去一年小鹏车主大概一共开出了1601万次以上的零接管,也就是说他们整个的行程没有任何的接管动作,这样的行程在我们的车主中间发生了1601万次以上。我们去年推出了一个很新的功能,叫作人机共驾,我们发现大概有64%的车主是很喜欢用人机共驾,几乎每天都在使用。
我们也跟庞老师讨论了很多,每次比赛或者我们偶尔在一些场合遇到,我们都在说智驾这个东西这么复杂,而且它一直在发展,我们有一套什么样的标准去评价一个软件好还是不好,早期可能大家简单粗暴地看接管率,可是后来我们知道,接管率这个东西完全不能够定义一个软件,所以我们经常讨论,我们用什么样的评价标准、什么样的评价体系去展示一个软件的好用性,软件做出来最终是要给人用的,参赛也很重要,我们怎么样用一套这样的指标去找到用户最喜欢的点,我们甚至跟庞老师讨论过有没有机会把智驾赛事的标准做得再更复杂细腻一点。今天第一电动做的这些探索已经很大地扩展了整个智驾的评价体系,但是我们还在想用户开车还要什么?他是不是还要舒适?他是不是还要一些非常心理感受上的安心?这些很难用一个接管数字表达的东西,我们怎么去体现出来?我觉得这个题目是很难的。整个智驾大赛的探索对我们有非常非常重要的借鉴意义,说实话我们现在内部在做我们自己的软件测评的时候,我们已经有部分吸收了智驾大赛用到的标准体系和扣分、加分的方式,我们有一个很重要的内部的观点是软件这个东西就应该是用户和市场驱动的,如果第一电动认为这种测评方式是能够比较精准地考验一个软件的水准,我们应该在我们的研发过程当中把这部分的视角引入进来,所以我们非常在意这个比赛给我们提供的这些洞察。
不过我们回到用户需要什么样的辅助驾驶,我可能会以“按说法”讲一下过去一年小鹏做了几个产品定义上的事情,也跟大家分享,我们一起探讨,它是不是在让辅助驾驶变得更好用或者说让更多的人有机会爱上它。
我记得早期智驾大家还有开城这个说法,行业内通常会认为北、上、广这样的一线城市是各个厂家都会重点去测试、重点去维护的,通常比得好,所以在这里比得好好像也不说明什么,所以我们去年,我们在有新的软件、新的车型上市的时候,我们会主动找一些相对来说不是那么一线的城市,可能是我们从来没有到过的地方,我们看看这个软件的事实上的泛化性怎么样,这是P7 上市的时候,我们围绕浏阳河九道弯做了一次零监管的拍摄,我们当时还是比较惊喜的,觉得端到端时代的模型可以做到这个程度,是符合我们预期,甚至有一些超出我们预期的。
我想给大家看一个我们在这个功能推出的时候,我们跟庞老师做了一些讨论,大家可以看一下人机共驾。这是2025年推出的人机共驾功能,有的用户说人机共驾几乎是全年他们见到的最好的功能,也谢谢用户的谬赞,但是我想说这个功能我们在做开发和定义的时候确实经过了非常长的思考,我们在做智驾的,大概在2024年我们就洞察到一些现象,用户在做智驾接管的时候有很多横向的接管,有很多接管其实可能跟安全没有什么大的关系,但是用户就是觉得你这个智驾软件开出来的轨迹就跟我心里想要的轨迹不那么一致,以及有的时候我看到一些特定的交通,道路上的静态物或者动态的物件,我就是想离它远一点,但是这个软件控制的距离不如我想控的距离,所以用户就会做接管的动作,接管完了以后用户如果再回到智驾,这个功能会先退出,之后再过来,后来我们想我们是不是应该有一个始终让智驾控制,我们当时有一个内心戏,如果我们去做人机共驾是不是等于跟别人说我们智驾做得不好,好在我们很快就克服了这种产品经理的虚荣心,今天的智驾不能跟人的意图百分之百打合,它是非常理所当然的,我们是可以理解的,还是那句话,做软件本质上是要给人用的,所以我们跨越了这个虚荣的门槛,我们把这个东西定义出来。定义完了之后,我们想到的最早的几件事之一就是跟庞老师聊一聊,我们都有人机共驾了,接管都不退出,智驾大赛怎么比?我们会不会成为莫名其妙获益的一方,我们最后很快达成了共识,在比赛的场景下,只要有人机共驾就视为接管,在比赛场景下我们不去用这个功能,但是我们相信在日常生活的情况下,就像我刚才展示的一样,大概有64%的用户每天都要用到这个东西,所以这个就是我们比较能典型代表,就是我们对一个软件、一个功能的思考,以及我们对来自用户的、来自市场的这些反馈的综合理解。这是人机共驾的功能。
车位到车位我就不展开了,车位到车位曾经是2024年底智驾市场上竞争非常重要的点,几乎有很大的营销战役,但是在2025年之后,我们仍然在对车位到车位功能做进一步的优化和迭代,我们觉得从一个车位开到另一个车位,让用户只拨杆一下就能完成这个行程,这件事可以给用户带来的收益还有很大的想象空间,以及对产品定义的挑战也有非常大的想象空间,所以我们一直在做这个功能迭代的优化,也欢迎大家多去体验我们的车位到车位,多给我们一些吐槽和反馈。
这是小鹏的自动紧急避让,这个我们前不久在黑河请何小鹏本人上车做了一次验收,黑河真的非常冷。AES大家知道是在AEB基础上更加进阶的主动安全的功能,这个功能我们其实2025年花了特别大的心思去做,我们不仅做了大家在行业上可以见到的标准的AES,我们还做了对于这种大概附着系数在0.2-0.4之间,低附着的路面可以做到比较安全的边转边刹的AES,这是我们在行业里面,整个全世界的首创,我们已经在2025年把这个功能给到了所有的Max用户,以及Ultra用户。在小鹏自动驾驶中心,自动驾驶很多新的功能、新的能力,1号验收员通常是何小鹏,AES也不例外,何小鹏是很勇敢的人。
我想说的是在我们做一个智驾软件的时候,有很多的功能我们希望用户用得越多越好,有很多功能我们希望用户一生都不会用到,比如AEB和AES,但是这不代表我们没有在不停追逐这些功能的天花板,我们想更好地给用户做护航。我们当然是不希望在一些显性的赛事上重点地去讲这些功能,但是我们又希望能够在一个智驾软件的评价当中能够包含到这部分其实是藏在水面下默默守护用户的功能,所以我仍然觉得做好智驾软件的评价这件事情挑战是非常大的。
2025年已经过去了,我们最近在忙下一代智能驾驶的软件,我们把它叫作第二代VLA,我们在去年11月份的时候已经首度公布了我们现在这套软件的技术架构以及我们希望的推进发布的时间。第二代VLA是用VLA技术架构,我们希望在极简的架构下面,也就是说从视觉进入、动作输出,中间没有语言编码的环节,我们能够用这套极简的端到端的架构去把现在阶段的辅助驾驶的能力再有一个比较大的提升。我们用了一种可能在行业里面比较少有人探索的,我们称之为极致的端到端的架构,我们有一个研发上的信奉的信条,好的东西都是简单的,极致的端到端不需要在训练的时候做很繁复的数据标注,在整个模型的推理过程当中,因为是由输入到输出,中间没有中间环节,没有中间商赚差价,所以信息是无损的。在我们现在研发的过程当中,新一代的辅助驾驶软件开始有了一些,在我们预期之外的能力,我们把它称之为涌现能力,未来在软件全量推送的时候也欢迎大家一起来体验。
我特别给大家展示一下在我们做研发的时候我们的世界模型架构,在我们下一代的第二代VLA模型当中起到的作用,这是一个演示图。这是在自车需要向左变道的情境当中,这个情境我们输入给到世界模型,世界模型会根据当前他通过传感器看到的世界做三重推理,如果我现在马上向左变道,我大概率会失败,变不过去。第二个是我稍微等一等,但我还是想要变道,就是我可能是可以变过去,但是可能会有一定的碰撞风险。再有一个就是我再等一等,我找一个更合适的空隙,礼貌地变道,大概可以成功。我们的模型在做推理的时候,其实它同时在思考几种可能性,我们用世界模型把这个思考的过程具象化展示出来了,这是下一代模型可以具备的更加接近于人类的能力,可能是瞬间做非常多的可能性的推理。
这是另一种情形,左边是我们过去遇到的用户开车的真实场景,简单来说在很宽阔的路上开车,对面来了一辆车,跟我没有任何的关系,它就过去了,这是一个非常平平无奇的场景,我们把这个场景放到世界模型里面,我们对世界模型说这样,你让对面过来的那辆车直接违法操作,跨过双黄显朝我的车道侵入过来,看看我们这个车自己会怎么办。大家看到这个七宫格的图就是我们车子在对面的演员车,或者我们操控它做了变道的车,我们可以丝滑避让,通过生成相对复杂的,甚至有一些长尾的case,帮助我们的第二代VLA不停地做自我的对抗学习,这个也是我们现在在探索的一些比较新的,我们觉得对下一代辅助驾驶模型提升非常有帮助的技术性的操作。
这是第二代VLA大概的进度,我们其实已经开始做比较泛化的全场景的测试,我们希望通过密集的测试,再能够仔细地去摸一下我们软件的上限,以及我们对它的基础要求。
这是一道特别特别窄的门,一般人类开车都不会尝试的,我们让我们的模型试了一下,精确计算以后它觉得没啥问题就过去了,时间关系我就不把这个播完。大家等待第一季度我们模型量产,结果揭晓,也非常乐意看到我们已经有一些小鹏车主摩拳擦掌,准备拿新的模型再去参赛,看看到底水平怎么样,我们也是有点紧张,也有点期待想要看到后面的结果。
最后我们多说一句,对小鹏汽车来说,所有的这些研发,汽车可能就是一个开始,汽车本质上是四个轮子的机器人,我们今天做的世界模型或者说我们的第二代VLA架构,本质上不只是服务于汽车,我们希望这个架构未来可以适应各种各样的物理终端,特别是小鹏自己已经在做的机器人和飞行器。大家应该在过去看到过小鹏的机器人现在有一些非常神奇的进展,由于走路走得过于像人类,而被怀疑是人类在机器人当中伪装,何小鹏含着泪把机器人的衣服剪开了,我们希望这是机器人最后一次证明它是机器人,希望以后不会再有这样的事情发生。但是很高兴看到基于现在的AI、现在的芯片、现在的这一整套的技术栈,我们可以看到自动驾驶这个东西的想象力可能就真的完全不再限于四个轮子的这台车了,可能真的是会带着我们进入到物理世界,我们不知道那世界会是什么样的,我们很想要见见它。我就把2025年总结的尾收在这里,也欢迎大家来跟我们多做新的软件反馈,也欢迎大家对我们现在的功能和产品多提建议。
谢谢!
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。





