大年初二,GLM5的技术报告发布了arxiv.org/abs/2602.1576

蚁工厂 2026-02-18 15:32:23

大年初二,GLM5的技术报告发布了arxiv.org/abs/2602.15763总参数 744B,激活参数 40B(相比 GLM-4.7 的 355B/32B 有所增加,所以价格才变贵了吧)。针对长耗时的 Agent 任务(如跑代码、浏览网页),设计了全异步训练框架。针对国产芯片做了定制优化,针对昇腾 NPU 架构开发了定制算子。不过之前有传闻完全在昇腾芯片上训练似乎不是真的。HOW I AI

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注