“欧洲OpenAI”MistralAI又有新动作，首次推出推理模型系列Magi

“欧洲OpenAI”Mistral AI又有新动作，首次推出推理模型系列Magistral！【图1】 Mistral AI这次一共发布了两款模型：面向企业客户的高性能专有模型Magistral Medium，以及240亿参数开源版本Magistral Small。 Magistral Small服务开源社区，这似乎是为了回应今年五月因推出付费闭源模型而遭受的批评。瞄准企业市场的Magistral Medium，可以通过“Le Chat”界面和“La Plateforme”API来使用。根据Mistral AI的介绍，Magistral经过专门微调，专注于多步逻辑推理，能以用户使用的语言提供可追溯的思维过程，显著提升了模型的可解释性。 Magistral还具有“多语言灵活性”，在法语、西班牙语、德语、意大利语、阿拉伯语、俄语和简体中文中都能保持高质量的表现。在推理性能上，Le Chat的新“思考模式”和“快速应答”功能据说能让Magistral Medium的token吞吐量达到竞争对手的10倍。【视频2】不过，模型好不好，还得看实力说话。先来看看基准测试的结果：【图3】在AIME-24数学基准测试中，Magistral-Medium准确率达73.6%，与之前的版本持平，并且明显超过了Deepseek模型。如果采用多数投票法，AIME-24的表现甚至能飙升到90%。不过说到这，眼尖的朋友可能就发现了，这怎么不对比最新版的Deepseek和Qwen？这个剧情似乎有点眼熟，去年Mistral AI发布3B/8B模型时，也面临着同样的质疑…… 总之，有网友自己测试了一下，结果比较尴尬：接近Qwen 4B，被DeepSeek R1-0528远远甩在身后。【图4】【图5】看到这测试结果，网友也忍不住感叹：我们是如何从莱布尼茨、牛顿、冯·诺依曼、图灵的时代沦落至此的？【图6】回到Magistral本身，在定价方面，Magistral Medium输入价格是每百万token 2美元，输出价格是每百万token 5美元。相比之前的Mistral Medium 3（输入0.4美元/输出2美元），价格有了显著上涨。但与外部竞争对手相比，这个定价还是很有竞争力的：输入成本与OpenAI最新模型持平，介于Gemini 2.5 Pro区间；而5美元的输出价格则大幅低于OpenAI和Gemini（分别为8美元和10美元以上）。虽比DeepSeek-Reasoner等专用模型昂贵，但比Anthropic旗舰款Claude Opus 4低一个数量级。【图7】不管怎么说，推理模型领域终于又迎来了新玩家，为开源社区释放出了积极信号。

0 阅读：0