小鹏第二代VLA发布 “分水岭”真正的意思在于“信任感”。其实很久以前,我说过一个场景,在村口限宽的地方,我往往是按车速5km/h过去的,但是智驾识别到能过去,按50车速呼呼过去了,我知道所以我信它,但是换个人来,确实存在一个情况:它其实可以的,但只要你心里没底,你不信它,就等同于它不会,这也是今天摆在台面上最大的关键之处:“能通过 ≠ 能安心通过”。我们有时候特别注意冰冷的技术本身,去关注那些数字,却往往忘记了市场用户最想要的是这种“感性上的存在”。
从理性到感性应该是个相辅相成、互相关联的存在,而不仅仅是纸上谈兵而已。
那么,就分水岭背后的那个“理性”,也就是VLA2.0,是什么呢?我们也说过很多次了,传统辅助驾驶实际上是做“题库”,遇到一个场景加一个规则。但场景稍微变形,它事实上很难做到举一反三,就物理AI来说,车开始从“机械”变成了“可以理解世界、思考世界”的存在。而当理解了环境的结构---车、人、路、意图、风险、可行区域,在时间轴上形成了一个连续策略以后,它自然而然地,就形成了“人”的风格。
今天发布会说到了“原生多模态”,“看、听、读一体化”,“视觉思维链推理效率提升32倍”,实际上就是在说“带时间的推理“,它在做的就是将“现在看见什么”变成“接下来几秒会发生什么”。
至于“算力”,前一段时间事实上也有所争议,今天说“算力不是比大小的数字游戏”,是有意思的。我们都说“差生文具多”对不对?这句话真实的内涵在于,“你拿了那么好的装备并不能发挥装备能力的话,等于没拿”。而当我们基于外在去对比有多少颗orin、orin和图灵的差异在哪里的时候,他们都无法表达出真实的体验差距在哪里。
比如说,iphone和安卓的内存对比,在过去的十几年里,其实都不乏讨论,不是么?
车端真正决定体验的不是TOPS,而在于延迟、稳定性、大模型---自研图灵芯片,算力利用率82.5%,推理80ms,“有效算力”等同于10颗Orin-X的级别,这是极其恐怖的数据。在这个份上,我们也就自然而然地理解了,单图灵替代双orin,以及三图灵实际算力登顶的背后,意味着什么---青龙偃月刀,只有在关羽手里,才是青龙偃月刀。
不过今天我最在意的是“进化速度”。科技日前我已经体会到了神奇的存在,而科技日以来,却一共又迭代了468版模型---还记得前年开城的故事吗?先10城,后52城,再200城,当时说AI大大缩短了这个时间,这些故事,在今天依然在继续,且加速。而在这个速度的加持下,未来会是什么样?吓不吓人?
刘先明提到了“仿真”---去年提到物理AI的时候,很多人在解释这个和世界模型的差异是什么,实际上顾名思义你就能理解这个的:世界模型,就是把真实的世界浓缩到了一个虚拟的环境里,而“物理”在于,你作为上帝创建了这个“虚拟世界”之后,赋予了它等同于真实世界的规则,物理AI,一定是联动“世界模型”来构筑感知与决策的。
世界是世界,物理是规则,AI就是你---于是物理AI,就是一个能够发现世界、理解世界运行规则的“你”。
也是有了“虚拟”的手段,这个虚拟的“你”,才可以在这个世界里不断加速、不断重启,经历千千万万种人生---50万+仿真场景、每天等效3000万公里,甚至文字提示生成海外路况视频去做泛化,你永远遇不到足够多的“开门杀”“锥桶封路”、“夜间黑衣人横穿“、“异形车突然插入”,在这里都发生过无数次。
这种训练与评测体系,是我们所熟知的算法、大数据,算力,之外的又一个“隐形know how”。有了算法就是“你有了想法”,而大数据填充了你的“经验”,有了算力你才真正有了跑起来的“能量”,但是“体系”是你不断迭代自己进步的过程。
当这套技术逻辑落回到场景,也就呈现出了我们所看到的体验。“安心丝滑”,是今天最好的、可感知的目标。急刹、摆动、点头这些瞬间,今天都被当成“智驾”的硬指标了。有点意思吧?工程上这背后对应的是规划更前瞻、控制更连续,以及对于不确定性做更好的处理。
我能想到的事,就和大师兄今天说的一句话差不多。智驾走到这里,未来其实基本上,都会收敛到一个指标里去。
就是,你有多少天没碰方向盘了。于是,小鹏就有了L4。
小鹏智驾负责人称拉开差距的时刻到了








