【本地部署VLM必将成为其它车企效仿的AI座舱主流方向】
在大模型上,小鹏的座舱VLM选择的基模型极大概率是阿里巴巴24年12月份开源的业界首个开源多模态推理模型QVQ-72B-Preview。
小鹏汽车用于辅助驾驶领域的VLA大模型的云端基座模型参数规模为720亿。
在一次媒体交流会上,小鹏汽车高管透露,用于AI座舱的云端基座大模型的参数规模同样为720亿,与阿里巴巴开源的多模态推理模型QVQ-72B-Preview的参数规模高度一致。
和后起之秀DeepSeek相比,阿里巴巴入局大模型赛道更早,多模态能力更胜一筹。
至此,小鹏放弃DeepSeek的又一个原因找到了:有更加适合智能座舱应用且来自战略合作伙伴的通义千问QVQ,为何还要选择DeepSeek?
这个QVQ模型的核心能力与智能座舱的应用需求高度契合。
首先,它可以同时处理语音、视觉、文本等多种模态的数据,通过上下文融合进行跨模态对齐,实现对用户意图的精准解析。
其次,它引入了被DeepSeek R1带火的推理能力,能够结合物体识别和物理常识推断用户的行为意图,并具备长时序和长链条的逻辑推演能力,可基于动态视觉而非静态图片进行深度思考推理。
QVQ结合通用常识的动态意图解析能力正是智能座舱从功能响应迈向主动服务的核心突破点,不仅将带来自然交互体验的革新、个性化的场景理解,还可以用于疲劳检测、分心预警、儿童遗忘检测等安全监控领域。
当然了,怎么进行微调训练,如何安排数据训练的顺序,中间也有大量的科研工作要做的。
和即将迈入L3阶段的自动驾驶相比,智能座舱的智能化等级还停留在初级阶段,任重道远。
小鹏汽车最近推出的端侧部署VLM的AI座舱给友商们指明了一个值得追随的方向,大家别再端着了,赶快跟上!新能源大牛说