熟悉的一幕再次上演,西方媒体拍手叫好的对象,又是中国! 近期,美国著名科技媒体《连线》发布了一篇头版文章,在当中毫不客气的指出,美国的GPT-5未能激发市场热情,而反观中国的阿里千问性能表现优异,部署应用能力极强,2026年将属于千问。 要搞明白《连线》为啥敢这么给阿里千问站台,先得看看美国AI圈的标杆GPT-5是怎么掉链子的。 之前OpenAI的CEO萨姆·奥特曼带着GPT-5亮相的时候,那可是把调子定得老高,说这款模型能让自己都觉得“没用”,号称是通向通用人工智能的关键一步,整个科技圈一开始也确实沸腾了一把。 可热闹劲儿没过多久,现实就给了市场一记耳光,所谓的“革命性突破”压根没出现,早期测试用户用下来,普遍觉得GPT-5比起前代模型没什么质的飞跃,有科技媒体记者直接吐槽更新“大多无聊”。 更尴尬的是,不少GPT-4o的老用户还觉得体验倒退了,闹着要换回旧模型,逼得OpenAI没办法,只能紧急重新启用付费用户的模型选择器。 这种“新不如旧”的反差,直接让期待颠覆性升级的市场凉了心,原本的热度瞬间变成了失望。 GPT-5的拉胯还不只是用户体验的问题,背后更是OpenAI的战略混乱和创新乏力。为了挽救口碑,他们很快又推出了GPT-5.2,宣称要做瞄准白领职场需求的“高效执行者”,说能从辅助聊天转向独立扛活,结果这定位更像是慌不择路的应激反应。 真正的职场核心需求,比如法律文书撰写、财务分析、科研辅助这些复杂任务,GPT-5.2根本扛不起来,所谓的“碾压前代”全是空洞的口号。 更要命的是,面对谷歌Gemini 3的竞争压力,OpenAI还启动了最高级别的“红色警报”,让全员都去修补ChatGPT的日常体验,把广告、AI代理这些创新项目全停了,典型的拆东墙补西墙。 这种混乱的状态,再加上OpenAI正筹备IPO却拿不出能撑得起万亿估值的过硬产品,不仅让用户失望,连投资者都开始怀疑他们的商业化能力,GPT-5没能成为救命稻草,反而成了美国AI巨头技术傲慢和市场脱节的注脚。 就在美国AI圈陷入这种慌乱的时候,中国的阿里千问却交出了完全不一样的答卷,这也是《连线》愿意为中国AI叫好的核心原因。 首先得说性能,阿里千问可不是靠吹出来的,在全球权威的基准测试里实打实拿了好成绩,比如编程任务的HumanEval得分达到89.7,超过了GPT-4o的87.5,数学任务的GSM8K准确率也接近95.3%,跟顶尖的Claude-3.5-Sonnet差不了多少。 更关键的是,千问还搞了个很实用的创新,就是“思考模式”和“非思考模式”能动态切换,复杂任务就慢慢推演保证精准,简单对话就快速响应节省算力,打破了传统大模型一刀切的算力浪费问题。 而且它的参数效率也高得离谱,小规模的模型性能就能超越前代的大参数模型,企业部署的成本直接降低了80%以上,这对需要实际落地的企业来说,吸引力可比只讲概念的GPT-5大多了。 比起性能优异,阿里千问的部署应用能力强才是真正打动市场的关键,这也是《连线》强调“2026年将属于千问”的核心依据。《连线》自己也说,衡量AI模型价值的关键,不只是看它多聪明,更要看被用来构建其他应用的广度,而千问在这方面简直是降维打击。 它走的是全面开源的路子,这就让全球的开发者都能灵活调整使用,全球最大的AI开源社区HuggingFace数据显示,2025年7月中国开源模型的下载量就超过了美国,阿里千问稳居第一,在海外的API调用量也冲到了全球第四。 更重要的是,千问已经不是停留在实验室里的模型,而是真真切切用到了各行各业,比如2025年春晚的“子弹时间”特效就是它驱动的,实现了360度环绕视角的实时渲染,还有和企业合作推出的矿山风险识别系统,在陕煤的煤矿里落地使用,第一次让大模型在采矿这种传统行业规模化应用。 从春晚的黑科技到矿山的安全生产,千问的部署场景覆盖了从端侧到云端的全需求,这种能落地、能创造实际价值的能力,正是当下AI行业最需要的,也难怪西方媒体会忍不住叫好。 其实西方媒体这次为中国AI拍手叫好,并不是什么突然的转变,更不是刻意捧杀,而是基于全球AI产业发展的现实判断。之前很长一段时间,西方舆论总觉得AI的话语权在硅谷手里,可这次GPT-5的失败和阿里千问的崛起,彻底打破了这种偏见。 阿里千问的成功,本质上是踩准了行业发展的节奏,把性能、效率和实用性做到了平衡,而GPT-5的失败,恰恰是因为沉迷于AGI的空想,脱离了市场的实际需求。 《连线》作为美国主流科技媒体,选择客观站出来肯定中国AI的成就,说到底也是遵循了产业发展的客观规律,毕竟在技术面前,好不好用、能不能落地,才是最硬的道理。


