雷锋网对任少卿的采访中,回顾了这5年蔚来AD的历程和变化:任少卿于2020年8月加入蔚来,当时面临的核心任务是搭建团队并赶在2022年3月(ET7交付)前完成量产。放弃供应商方案,团队、集群、标注、工具链等基础设施几乎全部从零搭建。选择英伟达Orin芯片,并在芯片本身尚未成熟的情况下并行开发。蔚来在同一时期并行推进了三件极具挑战的事:1、第一代平台(Mobileye方案)的量产维护。2、第二代平台(全球首发Orin芯片+高线束激光雷达)的最复杂架构量产。3、启动自研芯片项目。Orin全球首发量产,面临硬件底层:散热、功耗、稳定性、丢帧和软件上层:AI工具链需重写的双重不稳定,且离量产仅剩6-7个月,不能按部就班,必须软硬件并行调试。2021年,任少卿和团队就预判Transformer将取代CNN成为主流。所以基于对Transformer的预判,蔚来在定义自研芯片时强调了两点:1、高内存带宽,Transformer对带宽要求远高于CNN,这是芯片设计的关键指标。2、热冗余能力,为支持L3/L4,芯片需具备“温冗余”能力,即在百毫秒内完成双芯片无感切换,这是英伟达等通用芯片难以做到的。任少卿提出数据是有成本的,会消耗算力,因此数据的价值在于针对特定模型的“Corner Case”挖掘,而非简单的海量拷贝。为此蔚来建立了三套核心系统:1、算力调度系统: 实现云端与车端算力的灵活调用。2、真·AB Test系统,它区别于影子模式,影子模式通常是一套模型、两套后处理;蔚来则是车端同时运行两套完整的系统,一套用户用,一套测试下一代算法。这套系统,首先在主动安全上带来了收益,以往“200万公里一次误报(FP)”的标准需要极长的测试周期,现在通过全量车队的并行测试,主动安全算法可以做到三天迭代一个版本,达到互联网级的迭代速度。针对全量用户,超过80万辆车的接管数据,自动化过滤99%的无效信息,筛选出0.1%-0.5%的高价值数据,经大模型初筛后交由工程师处理,解决量产车智驾问题。关于端到端、语言模型、世界模型,任少卿表达了自己的观点:端到端只是阶段: 端到端打破了模块化架构,但未解决所有问题,比如语言模型是不是可以直接用在自动驾驶上。语言模型核心是“概念认知”,语言相对抽象,难以精确描述物理世界的细节。世界模型核心是“时空认知”,处理三维/四维空间和物理规律。人驾驶车主要依赖时空认知,而非语言。蔚来选择了世界模型路线,它在优势在于长时序决策。传统智驾依靠“高精地图”(静态长时序)和“规则代码(If-else)”来处理长时间跨度的任务。现有模型通常只能处理3-5秒内的变化。世界模型能够学习物理规律和时空演变,具备长时序推演能力,例如10秒、1分钟甚至更久。比如窄路会车,需要同时理解空间(路宽)和时间(对向来车速度、让行博弈),世界模型能替代外层的状态机规则,实现更拟人、连贯的决策。这篇是对任少卿获得2025 NeurIPS奖的采访,内容更多是历史的回顾和总结,以上仅为个人整理,可能存在错误。相关链接我已经放在评论区一楼,有兴趣的朋友可以阅读全文。
雷锋网对任少卿的采访中,回顾了这5年蔚来AD的历程和变化:任少卿于2020年8月
梦香评汽车啊
2025-12-06 00:45:51
0
阅读:0