长城汽车 AI lab 负责人王光甫,在英伟达 GTC 大会中分享了一下长城和英伟达合作的 RAG 平台。
RAG 即 Retrieval Augmented Generation 检索增强生成,可用于用户问答、研发协同、支持销售、内部培训等方面。
根据王光甫分享,传统的问答方案是基于用车手册建立知识库,通过语音问询方式解决用户问题。这样的方案虽然准确率 100%,但是有需要人工维护生成上线周期长、泛化能力弱、多个模型串联起来误差大等问题,并且也无法支撑企业级的复杂决策场景。
不过 RAG 平台可以解决上述问题,能够从数据增强处理、多索引构建、意图理解、多路召回政策等角度出发进行优化。
此外,RAG 平台还能够优化文档解析模型,解析准确率达到 98%,能够最大程度地保留文档结构、内部插图和表格信息等。
总的来说,想必传统方案,长城的 RAG 平台更支持专业术语,更能解决长尾问题,同时误答率小于 5%,初始标注数据大约需要 1,000 条汽车 QA 对。
42how新能源汽车长城汽车英伟达GTC2025