智谱下一代旗舰大模型 GLM-5 的神秘面纱被正式揭开,开源社区从代码中挖掘出的架构细节,让这款模型成为 AI 圈焦点;与此同时,OpenRouter 平台出现的匿名模型「Pony Alpha」被社区实锤为 GLM-5 测试版,强劲的性能表现更是推高市场预期,受多重利好消息影响,智谱 AI 港股迎来暴涨,两日涨幅超 60%,新一代大模型的竞争序幕也正式拉开。
核心架构曝光:复用 DeepSeek 技术,参数翻倍性能升级
GLM-5 的架构信息并非来自智谱官方发布,而是由开发者在 vLLM 推理框架的 PR 代码提交中发现,其实现逻辑直接映射到 DeepSeek-V3/V3.2 组件上,核心技术与架构参数全面公开,相比上一代 GLM-4.7 实现了质的飞跃。
两大核心技术复刻 DeepSeek
GLM-5 直接采用 DeepSeek-V3/V3.2 的核心架构,继承了两项关键技术,实现效率与性能的双重提升:
-
稀疏注意力机制(DSA):通过 Lightning Indexer 轻量级组件快速扫描历史 token 并打分,仅对与当前 query token 相关性最高的 Top-k 个 token 做完整注意力计算,其余直接跳过,大幅提升长文本处理效率,且输出质量几乎不受影响;
-
多 Token 预测(MTP):专为提升模型生成效率设计,是大模型推理提速的关键技术。
关键参数全面升级,745B 总参数量翻倍
从代码中推断的核心参数来看,GLM-5 采用 MoE(混合专家)架构,各项指标对比上一代 GLM-4.7 实现跨越式升级,与 DeepSeek V3.2、Kimi K2 等主流旗舰模型相比也具备显著竞争力:
-
总参数量745B,是 GLM-4.7 的 2 倍;
-
包含 78 层隐藏层,256 个专家,每次推理激活 8 个,激活参数约 44B,稀疏度 5.9%,与 DeepSeek-V3.2 基本持平;
-
上下文窗口支持最高202K token,长文本处理能力拉满;
-
可直接复用 vLLM、SGLang 等推理框架已有的优化,部署门槛大幅降低。
主流旗舰大模型参数对比
表格
| 模型 | 总参数量 | 单 token 激活参数 | 注意力类型 | 隐藏层数量 | 专家数 | 单次激活专家数 |
|---|---|---|---|---|---|---|
| GLM-5 | ~745B | ~44B | DSA | 78 | 256 | 8 |
| DeepSeek V3.2 | ~685B | ~37B | DSA | 61 | 256 | 8 |
| Kimi K2 | ~1T | ~32B | MLA | 61 | 384 | 8 |
| GLM-4.5 | ~355B | ~32B | GQA | 92 | 160 | 8 |
核心优势:GLM-5 的单 token 激活参数达 44B,为目前主流模型中最高,意味着其单次推理的算力投入更大,能支撑更复杂的任务处理,推理与生成性能更具优势。
市场疑问:是否缺失多模态能力?
有开发者提出,DeepSeek-V3 架构以纯文本处理为主,GLM-5 直接复用该架构,首发版本或暂不支持多模态能力,这也成为目前社区对 GLM-5 的最大疑问,具体答案仍需等待智谱官方正式公布。
匿名测试版实锤:Pony Alpha 就是 GLM-5,性能表现惊艳
2 月初,OpenRouter 平台上线了一款神秘的匿名免费模型「Pony Alpha」,支持 200K 大上下文窗口,其强劲的性能迅速引发开发者社区热议,而多重证据链均指向,这款模型就是 GLM-5 的内测版本。
性能亮点:编程与复杂推理能力拉满
Pony Alpha 的实测表现让社区惊艳,核心优势体现在两大方面:
-
编程能力突出,可根据单条提示直接生成2200 行完整的功能性应用程序,无需多轮调试;
-
复杂推理与 Agent 工作流处理能力优异,大上下文下的任务执行表现稳定。
四重证据链实锤 GLM-5 身份
-
时间吻合:Pony Alpha 上线节点,与智谱首席科学家唐杰多次暗示的 GLM-5 发布窗口高度一致,唐杰曾在社交平台直接发布「glm-5」字样,预告模型即将推出;
-
技术特征匹配:开发者测试发现,该模型对特定 token 的反应模式与 GLM 系列完全一致;
-
输出风格统一:排版、应答习惯等细节与 GLM 系列高度契合,具备鲜明的 “中国模型风格”;
-
分词器专属特征:中文短语 “锅内倒入植物油烧热” 是 GLM-4/5 分词器的专属 “故障字符串”,Pony Alpha 对该短语的反应与 GLM 系列完全相同,成为最直接的实锤证据。
市场反应热烈:智谱港股两日暴涨 60%,市值再创新高
GLM-5 架构曝光 + Pony Alpha 实测表现惊艳的双重利好,直接带动智谱 AI 港股的强势上涨,短短两个交易日涨幅超 60%,市场对新一代大模型的商业价值充满期待。
截至 2 月 10 日休市,智谱 AI 港股报价 335.000 港元,当日涨幅 2.03%,近期最高触及 344.000 港元,总市值达 1494 亿港元,成交量与成交额均出现明显放大,资金对 GLM-5 的发布高度看好。
春节档大混战:GLM-5 撞上模型更新潮,AI 赛道竞争升级
GLM-5 的发布窗口,恰好落在 2026 年春节前后(2 月中旬),而这一时间段也成为各大 AI 厂商的模型更新密集期,一场旗舰大模型的 “春节档混战” 正式开启。
目前已有多款主流大模型确认将在近期发布更新,包括 DeepSeek V4、阿里 Qwen 3.5、MiniMax M2.2 等,加上已开启内测的 GLM-5,以及传闻中的 GPT-5.3、Claude 4.6、Gemini 3 GA 等海外模型,2026 年 2 月将成为大模型技术迭代的关键窗口期,无论是模型参数、上下文窗口,还是推理效率、落地能力,都将迎来新一轮的升级比拼。
而 GLM-5 凭借 745B 大参数、202K 大上下文、复用 DeepSeek 成熟架构带来的低部署门槛,以及实测惊艳的性能表现,已成为此次春节档模型大战中最受关注的选手之一,其正式发布后的表现,也将直接影响智谱在大模型赛道的市场地位。
相关参考链接
-
vLLM 框架 GLM 适配代码:https://github.com/vllm-project/vllm/pull/34124
-
社区实锤 Pony Alpha 为 GLM-5:https://x.com/chetaslua/status/2020832197771714943



