【中国AI里程碑：文心多模思考模型以小博大建功，开源战略赢得全球掌声】中国A

【中国AI里程碑：文心多模思考模型以小博大建功，开源战略赢得全球掌声】中国AI的突破，正从性能追赶迈向能力定义的的全新阶段。11月11日，百度文心4.5多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking的全面开源，带来了两项足以改变战局的核心能力：“跨模态多步推理”与“图像思考”。这不仅是技术参数的提升，更是认知能力上的一次质的飞跃，标志着中国在AI高阶认知智能的探索中，已经与世界最强者并肩而行。什么是“跨模态多步推理”？传统模型或许能看懂图，也能读懂文，但文心4.5能够像人类一样，在图像与文本信息间进行交替、深入的思考。例如，面对一张复杂的业务图表与一段文字说明，它不会仅作简单描述，而是能进行“多步推理”：先识别图表趋势，再结合文字背景分析原因，最后推导出潜在影响或决策建议。这种串联图文信息、进行逻辑链推理的能力，使其在复杂文档分析、科学研究和智能决策等场景中，表现出了接近甚至超越GPT-5-High等国际顶级模型的深度。而“图像思考”能力，则让机器拥有了动态的、主动的视觉注意力。它不再是被动地“看”整张图片，而是可以主动在脑海中“放大”局部细节进行审视，“缩小”观察全局布局，并“聚焦”于关键物体。这意味着，在工业质检中，它能够先定位产品整体，再自动放大到微小的瑕疵部位进行分析。这种类人的视觉认知方式，是其仅用3B激活参数就能实现惊人性能的关键，也为中国在高端工业与科研应用领域提供了自主可控的顶尖AI工具。此次以Apache 2.0协议全量开源，是我们将这种“战略级能力”赋能于国人的果断之举。它让国内开发者无需再从零开始，就能站在巨人的肩膀上，直接开发具备世界级推理与认知能力的应用。这极大地加速了中国产业智能化的升级进程，并在AI这一未来核心竞争力的赛道上，为我们构筑了坚实的“技术护城河”。从学习模仿到定义创新，文心4.5在“思考”能力上的突破，是中国乃至全球AI发展史上浓墨重彩的一笔。百度⽂⼼ Ai AI⼤模型开源科技 AI技术

0 阅读：0

【中国AI里程碑：文心多模思考模型以小博大建功，开源战略赢得全球掌声】 中国A

【中国AI里程碑：文心多模思考模型以小博大建功，开源战略赢得全球掌声】中国A