2026 年 AI 编程领域迎来里程碑式突破,智谱 GLM-5 以神秘代号「Pony Alpha」低调现身,随即凭借炸裂的系统级工程能力引爆全网,谜底揭晓后智谱股价直接暴涨 32%,登顶港股科技板块热度榜首。这款参数量达 744B(40B 激活)的开源大模型,在 Artificial Analysis 权威榜单中位列全球第四、开源第一,成为首个能与 Claude Opus 4.5、GPT-5.3-Codex 等闭源巨头在Agentic Engineering(智能体工程) 领域正面硬刚的国产开源模型,宣告 Vibe Coding(氛围编程)时代正式落幕,AI 编程迈入工程化、系统化的全新阶段。
GLM-5 不仅实现了从「写代码」到「做工程」的跨越,更能 25 分钟一镜到底搭建完整系统、11 分钟开发中台应用、看图复刻 MacOS App,让 AI 从简单的代码辅助工具,变成能自主规划、拆解任务、调试修复的「全职架构师」,彻底刷新了开源大模型的能力天花板。
实力封神!GLM-5 上演极致工程能力秀
与以往只能写简单脚本、做基础 Demo 的开源模型不同,GLM-5 展现出的全流程工程化能力堪称惊艳,从复杂前后端项目到桌面应用、系统监控工具,均能实现需求分析、架构设计、代码编写、调试优化的闭环,实测表现屡屡超出预期:
25 分钟一镜到底,打造 X 平台监控系统
在无 API 依赖、完全模拟真实用户的测试中,GLM-5 仅用 25 分钟就从零构建了一套 X 平台信息监控系统,涵盖逻辑清晰的前端界面、系统性后端服务、高扩充性数据库、反爬策略与 ETL 数据清洗管道,还支持关键词筛选、定时抓取等功能。开发过程中,模型能自主调用各类工具 Agent,遇到报错时自动查文档、定位问题、修正代码,长时间维持逻辑连贯性,这一能力在以往开源模型中从未出现。
11 分钟搭建心理分析中台,实现动态 SVG 渲染
针对「Soul Mirror」心理分析应用的开发需求,GLM-5 先扮演荣格心理学专家设计核心逻辑,输出包含分析文本和视觉参数的标准 JSON,再基于参数编写 Next.js 前端代码,动态渲染塔罗牌风格的 SVG 心灵卡片,还实现了「保存为图片」的实用功能,全程仅耗时 11 分钟,对复杂需求的理解和落地能力堪比资深工程师。
看图复刻 MacOS App,视觉与交互 1:1 还原
将 OpenClaw 之父的 AI 额度统计工具截图直接交给 GLM-5,要求复刻同款 MacOS App,模型短时间内就完成了开发,不仅 UI 布局、交互逻辑与原图几乎一致,还模拟了真实数据展示,完美实现从视觉到代码的转化,展现出极强的视觉理解和工程落地能力。
复杂项目精准调试,自主解决顽固 Bug
在「无限知识宇宙」这个对 JSON 格式要求极严的前后端分离项目中,GLM-5 不仅一次性搭建好 React Flow 动态渲染、Next.js API 路由的完整架构,面对「页面初始化黑屏」的 Bug,仅通过一句模糊描述就精准定位到加载时机问题,迅速重构初始化逻辑、给出修正方案,调试思路清晰且高效。
开发者狂欢!基于 GLM-5 的爆款应用扎堆诞生
GLM-5 的发布,让 AI 编程从「代码生成」真正迈向「产品交付」,发布当日就有 10 余款开发者基于其手搓的游戏和工具同步展出,涵盖沉浸式数字世界、经典复刻游戏、学术工具、商业模拟游戏等多个品类,后续还将陆续登陆各大应用商店,展现出极强的生态落地潜力:
-
Pookie World:由 GLM-5 全程驱动的数字平行世界,通过多层生物 - 心理框架为自主智能体赋予真实的叙事完整性与生命动机,打造出可无限探索的沉浸式体验;
-
复刻版我的世界:1:1 还原 Minecraft 的核心玩法,支持自由建造、深度合成、场景互动,画面精美且灵动,还加入了可爱的动物元素丰富体验;
-
Papertok:沉浸式论文探索工具,以竖屏无限滑动的卡片流形式,让用户轻松「刷」阅 HuggingFace 每日热门前沿 AI 论文,提升学术研究效率;
-
GLMLIFE:资深开发者基于 GLM-5 打造的简易版 Cursor,一款带桌面 UI 的 AI 编程助手,模型仅用 1 天就完成了从 Monorepo 架构设计、环境搭建到 Electron 打包的全流程,涵盖 Core 核心引擎、CLI 命令行交互、Desktop 桌面主程序三大模块,技术选型专业且成熟。
核心突破!GLM-5 成为开源界「Opus 平替」的底层逻辑
Claude Opus 4.6、GPT-5.3-Codex 等闭源巨头的核心优势,在于具备强大的系统级架构能力,但这类模型不仅闭源,使用成本也居高不下。GLM-5 之所以能成为首个与之抗衡的开源模型,核心在于实现了规模、效率、能力的三重突破,精准击中开源界「缺能做脏活、累活、大活的工程级模型」的痛点:
规模拉满,参数量与训练数据双升级
GLM-5 参数量从 GLM-4.7 的 355B 飙升至 744B(40B 激活),预训练数据从 23T 扩充至 28.5T,大规模的训练基础让模型拥有更强的知识储备和推理能力,为复杂工程任务提供了底层支撑。
效率优化,攻克 Agent 运行成本痛点
首次集成 DeepSeek DSA 稀疏注意力架构,让模型在处理超长上下文时,既能保持「无损」记忆力,又能大幅降低部署成本;全新的Slime 异步强化学习框架,让模型能从长程交互中持续学习,越用越聪明,不再是「一次性工具」,完美解决 Agent 运行中 Token 消耗过高的行业痛点。
能力强化,打造「后端架构师」级别的核心素养
训练中大幅强化了后端架构设计、复杂算法实现、顽固 Bug 修复的权重,还赋予模型极强的自我反思机制:编译失败时能自主分析日志、定位根因、修改代码、重新编译,直到系统跑通;面对需求时不会盲目写代码,而是先输出专业的架构设计文档,做好技术选型和任务拆解,像资深技术总监一样规划项目。
跑分屠榜,多项指标拿下开源 SOTA
在核心基准测试中,GLM-5 的表现堪称硬核,全方位领跑开源模型,部分指标直逼 Claude Opus 4.5:
-
代码能力:SWE-bench Verified 获 77.8 分、Terminal Bench 2.0 获 56.2 分,均为开源第一,性能超越 Gemini 3 Pro;
-
Agent 能力:在 BrowseComp(联网检索)、MCP-Atlas(工具调用)、τ²-Bench(复杂规划)三大测试中全线霸榜开源第一;
-
经营能力:Vending Bench 2 自动售货机经营测试中,一年累计盈利 4432 美元,经营表现逼近 Claude Opus 4.5;
-
综合开发:内部 Claude Code 评估中,前端、后端、长程任务表现较 GLM-4.7 平均增幅超 20%,真实使用体感无限接近 Opus 4.5。
生态升级!重构 AI 编程工具链,一键解锁智能体能力
GLM-5 的野心不仅在于成为顶级开源模型,更在于重构整个 AI 编程工具链,让智能体工程能力触手可及,智谱同步推出了多款配套工具,打造从模型到应用的完整生态:
AutoGLM 版 OpenClaw:一键部署数字员工
针对 OpenClaw 原版环境配置繁琐的痛点,推出 AutoGLM 版本,支持官网一键部署,无需复杂操作就能拥有 7×24 小时的智能数字员工,可实现推特监控、资讯整理、脚本编写等多种任务,让普通用户也能轻松玩转智能体。
Z Code 开发环境:AI 全流程接管开发
完全基于 GLM-5 能力打造的新一代开发工具,用户只需提出需求,模型会自动拆解任务,拉起多个 Agent 并发工作,完成代码编写、命令运行、调试、预览,甚至连 Git 提交都能一键搞定,还支持手机远程指挥桌面端 Agent,大幅提升开发效率。值得一提的是,Z Code 本身也是由 GLM 模型全程参与开发的。
国产算力加持!实现技术自主可控,不被卡脖子
GLM-5 的强势表现,背后离不开国产算力的坚实支撑,模型已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光七大主流国产算力平台的深度适配,通过底层算子级的精细化优化,让 GLM-5 在国产芯片集群上实现高吞吐、低延迟的稳定运行。这意味着,中国不仅拥有了顶级的开源大模型,更实现了算力底座的自主可控,彻底摆脱对海外算力的依赖。
行业变革!Agentic Engineering 成为 AI 编程新主流
GLM-5 的发布,正式宣告 AI 编程从 Vibe Coding 进入 Agentic Engineering 时代:以往的氛围编程,只要求模型能写漂亮的代码、做简单的 Demo,满足一次性探索需求;而智能体工程,要求模型懂架构、懂调试、懂系统规划,能处理复杂的工业级任务,自主完成从需求到产品的全流程,成为开发者的全职协作伙伴。
正如 Andrej Karpathy 所言,如今的 AI 编程,99% 的时间不再是直接写代码,而是调度执行代码的智能体并担任监督角色,这要求模型具备极强的长程规划、多工具调用、逻辑闭环能力 —— 而 GLM-5,正是目前开源界唯一能接住这波智能体浪潮的选手。
尽管 GLM-5 并非完美,但它的出现,打破了闭源巨头在系统级工程能力上的垄断,让开发者能用消费级成本获得比肩 Opus 的体验,还能在隔离内网部署、针对私有框架微调,成为最懂企业自身代码的专属工程师。
目前 GLM-5 已在 GitHub、Hugging Face、ModelScope 三大平台开源,同时开放 BigModel、Z.ai 官方 API 接入,新智元也宣布 GLM-5 已纳入 Max 用户套餐,Pro 版本将在 5 天内完成支持。值得注意的是,因市场需求激增,智谱已对 GLM Coding Plan 套餐价格进行结构性调整,整体涨幅 30% 起,已订阅用户价格保持不变,新一轮的 AI 工程化浪潮,已然开启。




