[CL]《GLM-4.5:Agentic,Reasoning,andCo

爱生活爱珂珂 2025-08-12 06:32:50

[CL]《GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models》A Zeng, X Lv, Q Zheng, Z Hou... [Zhipu AI & Tsinghua University] (2025)

GLM-4.5，355亿激活参数的大规模混合专家（MoE）开源模型，展现了跨代理(agentic)、推理(reasoning)与编码(coding)的卓越能力。

• 双模式推理：支持深度思考与即时响应，适应复杂多步任务与快速交互需求。

• 多阶段训练：23万亿token大规模预训练，结合专家模型迭代和强化学习，显著提升任务表现。

• 领先成绩：TAU-Bench得分70.1%，AIME 24达91.0%，SWE-bench Verified为64.2%，在全局排名第3，代理能力排名第2。

• 高效架构：355B参数中仅激活32B，参数量远低于多数竞争对手，性能却接近顶尖专有模型。

• 细粒度数据策略：网页、代码、数学与科学文档质量分层采样，专门设计多语言与代码预训练语料。

• 强化学习创新：采用难度分层课程学习，动态采样温度，端到端多轮工具调用RL，确保多任务高效训练。

• 灵活推理与工具调用：采用XML风格函数调用模板，减少代码转义负担，提高工具调用准确性与鲁棒性。

• 实际应用评测：真实软件开发任务(CC-Bench)中优于多款开源与闭源模型，工具调用成功率达90.6%。

• 跨语言与安全性：具备语义深度理解与文化背景推断能力，安全性能高，涵盖伦理、心理健康等多维度。

• 资源开放：模型权重及评测工具开源，助力全球AI研究与应用发展。

详细信息👉

模型👉 huggingface.co/zai-org/GLM-4.5

人工智能大语言模型混合专家模型强化学习自然语言处理开源AI

0 阅读：0

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

深度解析为何不推荐 Ollama，推荐多 GPU 服务器使用 vLLM 或 Ex

2

Jupyter Agent Dataset：针对数据分析与代码智能的标杆训练集，

3

新书《Agentic Design Patterns》由谷歌专家 Antonio

4

[人人能懂] 从社交脑到自我精炼（扫码收听）

5

[LG]《Distilled Pretraining: A modern len

6

[LG]《When Agents go Astray: Course-Corre

7

[LG]《Learning to Refine: Self-Refinement

8

[CL]《Jointly Reinforcing Diversity and Q

9

[LG]《Social World Models》X Zhou, J Liu,

10

早！[太阳] 早安

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

【华为MateXTs非凡大师及全场景新品发布会官宣9月4日举办，将

2

四选一怎么选？旗舰新机一款比一款炸裂打算今年换机的朋友爽了，看了下今年的旗舰是

3

这是iPhone17只看正面时你立马能区分升级的地方：灵动岛变小了

4

华为又放大招啦！8月15号，华为Pura80手机处理器，kirin9020惊艳

5

美团退款看了一下最近两笔账单，都退回来了，这种退款还是要确认一遍，有时候还真会忘

6

小米澎湃OS3官宣8月28日发布了，而且值得一提的是这次是OS3单开一场，可

7

真我15000mAh新机曝光，从系统UI来看，这款手机似乎就叫“15000mAh

8

小米澎湃OS3眼看小米澎湃的发布会要开了，这次升级最核心的就是手机系统，改动确实

9

2025年，中国大陆制造的成熟芯片，占比全球产量28%，预计到2027年，占比将

10

台积电创始人张忠谋在接受纽约时报专访时说：美国、荷兰、日本、韩国与台湾牢牢控制着

科技最新文章

1

荣耀GT2配置提前看，应该就是今年最强中高端性价比手机大体的参数已经确定，

2

这是谁同意的？荣耀500Pro改设计了？这果里果气的确定好看？相对于外观设计

3

历代iPhone对比，17Pro真的很丑吗？我们是终于等到了iPhone改外观

4

荣耀GT2配置提前看，应该就是今年最强中高端性价比手机大体的参数已经确定，内

5

中国留给美国只有5-8年时间。深圳新凯来公司主动曝光成为爆炸性新闻，意味中国基本

6

朋友问我这几款手机怎么选，计划长期用下去，不想折腾来回换手机简单对比下来，荣

7

iPhone的A处理器永远比不上M处理器哪怕是A20pro也比不上M1

8

小米终于想通了下一代旗舰全系标配100W快充，还有7000mAh电池，再次领先

9

小米手机16系列全系参数曝光！米粉速瞅小米16系列发布时间确定9月25日左右，

10

一加这是不打算给友商留活路了啊。刚看到一加Ace6Pro的爆料，我下巴都快