今天来写一写特斯拉的芯片规划,真不太容易写得清晰易懂,就这样吧。-前些天彭博社

映梦说汽车啊 2025-08-11 13:35:26

今天来写一写特斯拉的芯片规划,真不太容易写得清晰易懂,就这样吧。

- 前些天彭博社的报道,大概是两点:1. 特斯拉已解散 Dojo 超算研发团队,负责人 Pete Bannon 离职——这是事实;2. 特斯拉更多转向依赖英伟达、AMD 和三星等外部 AI 芯片供应商或代工商——这是很不妥的误导。

- 这个业务调整的本质是,特斯拉 FSD 端侧模型的训练数据集正在越来越多的转向依赖合成数据而非直接采集自现实世界的真实道路数据。这决定了 Elon Musk 说的特斯拉「未来大部分的训练其实是为了训练而进行的推理,也就是合成数据的生成」。

- 先来厘清两个概念,什么是训练,什么是推理。训练发生在云端,本质是用大量的数据调整模型的参数,优化模型的预测或决策能力;推理发生在车端,本质是用训练的模型处理新数据,生成输出结果。

- 传统的 FSD 模型训练流程是:直接采集全球各地的真实道路数据训练一个模型,再将这个模型部署到车上——这个过程不涉及推理。

新的 FSD 模型训练流程是:用一个部署在云端的、强大的世界模型进行推理,生成大量的合成数据。这些合成数据再辅以一定比例的真实道路数据,训练一个可以部署在车端的 FSD 模型。

这个迭代的过程中,FSD 模型训练环节产生的推理占比越来越大,这需要特斯拉在云端除了有以英伟达芯片为主的训练系统,还需要一个拥有超高带宽的推理系统来大规模生成合成数据——多块 AI5 或 AI6 并联可以做这个系统。

- 未来 2 - 3 年后特斯拉 AI 的走势是:1. 用英伟达 GPU 集群训练一个超大参数规模的世界模型;2. 用 Dojo 3,本质上是特斯拉 AI5、AI6 芯片组成的推理集群运行世界模型,生成大规模的合成数据。;3. 用 Dojo 3 和英伟达混合集群训练小参数量的、可以在车端部署的、迭代频繁的 FSD 模型。4. 用 AI5、AI6 芯片在车端和机器人端进行推理。

- 为什么要转向依赖世界模型生成合成数据,主要是效率、成本、可控性和数据覆盖度的考量。现实世界的数据占比会走低,但依然重要,现实世界的数据集是 FSD 模型与现实对齐的基础,而合成数据是用来填补极端/高危场景,扩展长尾分布,加快迭代速度的,最终会是一个混合数据的策略。

越来越多的使用合成数据也是 AI 领域的重要趋势,比如最近发布的 Grok 4、GPT-5 的训练过程都用到了相当多的合成数据。

- 最后,Pete Bannon 是 Dojo 的负责人,但也是 AI5、AI6 的负责人,也是特斯拉汽车和 Optimus 低压电子的负责人。自 2018 年 Jim Keller 离职后,他就是特斯拉芯片和低压电子的总负责人,技术很硬核。用老于的话说,亲自用 C 语言编写 HW3 编译器的男人。

- 媒体的结论「特斯拉更多转向依赖英伟达、AMD 和三星等外部 AI 芯片供应商或代工商」肯定是很奇怪的,不明技术脉络演进的粗暴归纳,也没啥参考价值。

0 阅读:8

猜你喜欢

映梦说汽车啊

映梦说汽车啊

感谢大家的关注