智谱 GLM-5 重磅发布!744B 参数编程对齐 Claude Opus 4.5,七家国产芯片全适配!

智谱新一代大模型GLM-5正式亮相,此前在开发者社区爆火的神秘模型 Pony Alpha 也终于揭开面纱,正是这款全新升级的 GLM-5。作为 GLM-4.5 的迭代版本,GLM-5 拥有 744B 参数(40B 激活),预训练数据扩容至 28.5T,在 Artificial Analysis 榜单中位列全球第四、开源第一,编程能力更是实现对 Claude Opus 4.5 的精准对齐,主流基准测试斩获开源模型 SOTA,成为目前开源领域综合能力最强的大模型之一。

模型发布后,智谱股价应声大涨 26%,本周累计涨幅超 70%,市值突破 1756.62 亿港币(约合人民币 1551.62 亿元),市场对这款新一代大模型的认可可见一斑。与此同时,GLM-5 已完成与华为昇腾、摩尔线程等七家国产算力平台的深度适配,还推出专属 Z Code 智能体开发环境,实现从「写代码」到「做工程」的能力跨越,推动大模型向工程级、产业化落地迈进。

硬核性能拉满,多项指标登顶开源第一

GLM-5 的核心实力体现在规模化升级精准能力突破,智谱在技术博客中明确表示「规模化仍是提升 AGI 智能效率的最重要方式之一」,而这款模型也用实测数据印证了这一观点:

参数量与数据双升级,基础能力大幅提升

GLM-5 参数量达 744B(40B 激活),是 GLM-4.5 的两倍多,预训练数据从 23T 扩充至 28.5T,更大的模型规模和更丰富的训练数据,为其推理、创作、编程等全维度能力打下坚实基础。架构上还集成 DeepSeek 的 DSA 稀疏注意力架构,在降低部署成本的同时,保障了大上下文容量,兼顾性能与实用性。

编程能力对齐 Claude Opus 4.5,开源赛道一骑绝尘

在编程核心基准测试中,GLM-5 交出亮眼成绩单,SWE-bench-Verified获 77.8 分、Terminal Bench 2.0获 56.2 分,均拿下开源模型 SOTA,性能直接超越 Gemini 3 Pro,实现与 Claude Opus 4.5 的编程能力对齐。开发者实测中,GLM-5 在 SwiftUI 编程测试中完胜 Minimax M2.1,3D 网页开发能力接近 Opus 4.6,仅在设计细节上略有差异,整体表现可圈可点。

逻辑推理避坑能力超强,网红难题轻松破解

面对带有逻辑陷阱的网红测试题,GLM-5 展现出极强的推理和场景理解能力,多款主流大模型折戟的题目,它都能一眼看穿陷阱并给出合理答案甚至最优解:

  • 针对「洗车店离家 100 米,开车还是走着去」的问题,精准指出「洗的是车而非人,必须开车前往」,还提出「开车送车后步行回家,洗完再取车」的天才方案,完美利用距离优势;

  • 解答「父亲和母亲可以结婚吗」时,拆解出「已婚父母」「未婚父母」两种情况,明确法律与逻辑层面的合理性,避开题目中的思维误区;

  • 面对「亲生父母结婚没叫我难过」的情感问题,迅速切换心理咨询模式,共情用户情绪并给出疏导建议,同时精准识破「父母结婚时子女大概率未出生」的隐藏陷阱。

通用 Agent 能力开源 SOTA,兼顾多场景落地

GLM-5 不仅编程能力突出,通用智能体(Agent)能力也登顶开源第一,在BrowseComp(联网检索)MCP-Atlas(工具调用)τ²-Bench(复杂多工具规划) 等核心测试中均获开源 SOTA。在衡量长期规划与经营能力的 Vending Bench 2 测试中,GLM-5 模拟经营自动售货机一年,最终账户余额达 4432 美元,经营表现逼近 Claude Opus 4.5,展现出极强的长程任务执行和资源管理能力。

七大国产芯片全适配,底层技术筑牢落地基础

为推动大模型在国内算力平台的规模化落地,GLM-5 已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七大国产芯片平台的深度推理适配。通过底层算子优化与硬件加速,GLM-5 在国产芯片集群上实现高吞吐、低延迟的稳定运行,摆脱对海外算力的依赖,为大模型的国产化、产业化落地筑牢硬件基础。

在模型训练与优化层面,GLM-5 也有全新技术突破:采用全新的Slime 框架,支持更大模型规模及更复杂的强化学习任务,大幅提升强化学习后训练流程效率;提出异步智能体强化学习算法,让模型能从长程交互中持续学习,充分释放预训练模型的潜力,进一步缩小与闭源顶级大模型的差距。

从「写代码」到「做工程」,大模型能力迎来范式升级

GLM-5 的发布,标志着大模型从单纯的「代码编写」向「工程级开发」的重要跨越,智谱将这一变革定义为从「Vibe Coding」到「Agentic Engineering」的进化,而 GLM-5 也用实际能力印证了这一升级:

工程级开发能力凸显,自主完成复杂系统搭建

内部评估显示,GLM-5 在前端、后端、长程任务等编程开发上,性能较 GLM-4.7 平均增幅超 20%,能自主完成 Agentic 长程规划与执行、后端重构、深度调试等系统工程任务。实测中,模型能像「项目经理 + 架构师」一样复刻《星露谷物语》,先梳理核心需求、设计八大系统与配色方案,再规划整体架构并打造可玩的游戏界面,甚至能根据模糊需求自行丰富游戏内容,完成度极高。

专属 Z Code 开发环境上线,全流程智能化开发

针对编程场景,智谱同步推出Z Code 智能体开发环境,这一环境全程由 GLM 模型参与开发,实现开发全流程的智能化:用户只需描述需求,模型会自动拆解任务,通过多智能体并发完成代码编写、命令运行、调试、预览、提交等环节,甚至支持用户用手机远程指挥桌面端 Agent,大幅降低开发门槛,提升开发效率。

多场景适配能力超强,一键接入 OpenClaw + 直出多格式文档

GLM-5 不仅是优秀的编程模型,更是通用 Agent 助手的优质基座模型,落地能力拉满:

  • 一键接入 OpenClaw,智谱还推出 AutoGLM 版本的 OpenClaw,支持官网一键完成与飞书机器人的一体化配置,接入后可实现网站搜索、定时资讯整理、推文发布、编程等多元任务;

  • 拥有超强文档生成能力,可将文本或素材直接转换为 docx、pdf、xlsx 等格式文件,在 Z.ai 和智谱清言平台,能直接输出产品需求文档、教案、试卷、财务报告、流程表等专业文档,覆盖办公、教育、职场等多场景;

  • 开发者基于 GLM-5 已打造出横版解谜游戏、Agent 交互世界、论文版「抖音」等应用,部分已开放下载或提交应用商店审核,生态落地速度超预期。

开源 + 商用双布局,价格上调仍挡不住市场热度

在生态布局上,GLM-5 采用开源 + 商用双路线,全方位满足开发者和企业的需求:

  • 开源层面:模型已在 Hugging Face 和魔搭社区开源,权重以 MIT 许可证发布,开源链接面向所有开发者开放,支持二次开发与创新应用;

  • 商用层面:支持智谱开发者平台 api.z.ai 和BigModel.cn,兼容 Claude Code 和 OpenClaw,普通用户可在 Z.ai 免费试用,企业用户可通过 GLM Coding Plan 享受专属服务。

尽管因使用量快速提升,智谱为保障服务质量,将 GLM Coding Plan 套餐价格整体上调 30% 起,但市场热度丝毫不减,结合股价的大幅上涨,足以见得行业和市场对 GLM-5 能力的高度认可。

行业新趋势:工程级能力成大模型升级核心方向

GLM-5 的推出,不仅是智谱在大模型领域的又一重要突破,更揭示了行业的全新发展趋势:如今的大模型,早已不满足于输出简易 Demo、编写单一代码,而是向长序列任务处理、复杂系统规划、多步骤执行、多智能体协作的工程级能力迈进。

这种能力的进化,让大模型不再只是开发流程中的「辅助工具」,而是逐渐具备承担完整工程环节的潜力,未来有望成为产业化落地的核心生产力。而围绕工程级能力的提升,也将成为后续大模型升级的核心方向,推动大模型从「技术创新」向「产业价值落地」加速转化。

这个新模型确实挺厉害的

国产芯片适配挺全的

这模型数据看着挺牛啊

这模型确实挺厉害

这个新模型确实挺厉害的

看起来数据确实很厉害

这模型挺强的股价都跟着涨了

这模型能力可以呀

这模型性能提升真够猛的

国产生态越来越完善了