大家可能刷到了MiniMaxM2.5开源的消息。数据很漂亮:性能对齐Claud

智远行业评论 2026-02-14 17:52:50

大家可能刷到了MiniMax M2.5开源的消息。数据很漂亮:性能对齐Claude Opus 4.6,SWE-Bench 80.2%,推理速度是Opus的3倍…… 但我注意到一个比所有跑分都更值得琢磨的数字:1美金/小时。 什么意思?你花1美金,能让一个SOTA级别的AI Agent连续工作一小时,写代码、做Excel、查资料、写PPT,24小时不眠不休。 把这个数字放在真实世界:美国知识工作者中位时薪35-40美金。国内互联网行业白领平均时薪50-80人民币,折合7-11美金。哪怕外包到东南亚,时薪也很难低于3-5美金。 而M2.5给出的是:1美金/小时。在每秒输出50个token模式下,还能降到0.3美金/小时,北京一瓶矿泉水的价格。 再算另一笔账:人类一天工作8小时,一年250天是法定上限;AI可以7x24小时连轴转,365天不休。真实效率比接近200:1。 这意味着什么?过去因为人力成本太高而"不值得做"的事情,现在都值得做了。 比如:电商平台100万活跃用户,想做个性化回访?按人力成本得雇几十个客服,一年几百万支出。现在一个AI Agent,可能几千美金就搞定。 有人会问:价格打到这个份上,靠补贴吗? 看技术报告就知道了。核心是一套叫"Forge"的训练体系,做对三件事: 一,让快的不用等慢的。通过"Windowed FIFO"调度策略,查天气这种快任务立刻处理,写代码这种慢任务交给专门模块,互不耽误,异步协同。 二,让"反复算旧账"不再发生。Agent干活会反复调用模型,每次都要"回忆"历史。Forge做了"前缀树合并",所有共享历史的请求只算一次,40倍训练加速就这么来的。 三,引入过程奖励。不只盯着最终结果,还看中间步骤。比如:有没有乱用工具?是不是绕了远路?完成任务花了多久?让模型学会"又快又好"地干活。 所以,1美金/小时怎么来的?靠一套系统工程,把训练和推理中的每一分算力榨干,把每一处冗余去掉,一点一点抠出来的。 这个价格落在真实世界,会怎样?服务业以前永远是抽样服务,100个用户能覆盖20个就不错;现在AI Agent可以7x24小时在线,每个用户都能被照顾到。不是"抽样",是"全覆盖"。 中小企业请不起法务、财务、市场总监?现在可以1美金一小时,请AI法务审合同,AI财务对账,AI市场写方案。 再往大了想:印尼大学生打一天零工挣5美金,够AI干五小时,代码报错了贴进去问,算法看不懂用印尼语讲一遍。肯尼亚创业者想做跨境电商,把中文链接扔给AI,英文规格参数、物流条款几分钟出来。 1美金在硅谷意味着便宜到忽略不计,但在雅加达、内罗毕、圣保罗,它意味着第一次用得起和硅谷公司一样的AI能力。 历史反复证明: 每一次基础设施平民化,都会催生想象不到的新物种。印刷术变便宜时没人想到会催生报纸和小说;互联网变便宜时没人想到会催生电商和短视频;云计算变便宜时没人想到会催生SaaS创业的黄金十年。 现在轮到AI了。1美金/小时是起点。当SOTA级别的智能变成像水电一样按需取用的公共服务,你想用它来做什么? 春节有空时,想想看。

0 阅读:1
智远行业评论

智远行业评论

感谢大家的关注