“欧洲OpenAI”Mistral AI又有新动作,首次推出推理模型系列Magistral!【图1】 Mistral AI这次一共发布了两款模型:面向企业客户的高性能专有模型Magistral Medium,以及240亿参数开源版本Magistral Small。 Magistral Small服务开源社区,这似乎是为了回应今年五月因推出付费闭源模型而遭受的批评。瞄准企业市场的Magistral Medium,可以通过“Le Chat”界面和“La Plateforme”API来使用。 根据Mistral AI的介绍,Magistral经过专门微调,专注于多步逻辑推理,能以用户使用的语言提供可追溯的思维过程,显著提升了模型的可解释性。 Magistral还具有“多语言灵活性”,在法语、西班牙语、德语、意大利语、阿拉伯语、俄语和简体中文中都能保持高质量的表现。 在推理性能上,Le Chat的新“思考模式”和“快速应答”功能据说能让Magistral Medium的token吞吐量达到竞争对手的10倍。【视频2】 不过,模型好不好,还得看实力说话。先来看看基准测试的结果:【图3】 在AIME-24数学基准测试中,Magistral-Medium准确率达73.6%,与之前的版本持平,并且明显超过了Deepseek模型。如果采用多数投票法,AIME-24的表现甚至能飙升到90%。 不过说到这,眼尖的朋友可能就发现了,这怎么不对比最新版的Deepseek和Qwen? 这个剧情似乎有点眼熟,去年Mistral AI发布3B/8B模型时,也面临着同样的质疑…… 总之,有网友自己测试了一下,结果比较尴尬:接近Qwen 4B,被DeepSeek R1-0528远远甩在身后。【图4】【图5】 看到这测试结果,网友也忍不住感叹:我们是如何从莱布尼茨、牛顿、冯·诺依曼、图灵的时代沦落至此的?【图6】 回到Magistral本身,在定价方面,Magistral Medium输入价格是每百万token 2美元,输出价格是每百万token 5美元。相比之前的Mistral Medium 3(输入0.4美元/输出2美元),价格有了显著上涨。 但与外部竞争对手相比,这个定价还是很有竞争力的:输入成本与OpenAI最新模型持平,介于Gemini 2.5 Pro区间;而5美元的输出价格则大幅低于OpenAI和Gemini(分别为8美元和10美元以上)。 虽比DeepSeek-Reasoner等专用模型昂贵,但比Anthropic旗舰款Claude Opus 4低一个数量级。【图7】 不管怎么说,推理模型领域终于又迎来了新玩家,为开源社区释放出了积极信号。
“欧洲OpenAI”MistralAI又有新动作,首次推出推理模型系列Magi
量子位来谈科技
2025-06-11 15:25:11
0
阅读:0