大年初二,GLM5的技术报告发布了arxiv.org/abs/2602.15763总参数 744B,激活参数 40B(相比 GLM-4.7 的 355B/32B 有所增加,所以价格才变贵了吧)。针对长耗时的 Agent 任务(如跑代码、浏览网页),设计了全异步训练框架。针对国产芯片做了定制优化,针对昇腾 NPU 架构开发了定制算子。不过之前有传闻完全在昇腾芯片上训练似乎不是真的。HOW I AI

大年初二,GLM5的技术报告发布了arxiv.org/abs/2602.15763总参数 744B,激活参数 40B(相比 GLM-4.7 的 355B/32B 有所增加,所以价格才变贵了吧)。针对长耗时的 Agent 任务(如跑代码、浏览网页),设计了全异步训练框架。针对国产芯片做了定制优化,针对昇腾 NPU 架构开发了定制算子。不过之前有传闻完全在昇腾芯片上训练似乎不是真的。HOW I AI

作者最新文章
热门分类
科技TOP
科技最新文章