GLM-5 架构全曝光!复用 DeepSeek 核心技术,智谱港股两日暴涨 60%!

智谱下一代旗舰大模型 GLM-5 的神秘面纱被正式揭开,开源社区从代码中挖掘出的架构细节,让这款模型成为 AI 圈焦点;与此同时,OpenRouter 平台出现的匿名模型「Pony Alpha」被社区实锤为 GLM-5 测试版,强劲的性能表现更是推高市场预期,受多重利好消息影响,智谱 AI 港股迎来暴涨,两日涨幅超 60%,新一代大模型的竞争序幕也正式拉开。

核心架构曝光:复用 DeepSeek 技术,参数翻倍性能升级

GLM-5 的架构信息并非来自智谱官方发布,而是由开发者在 vLLM 推理框架的 PR 代码提交中发现,其实现逻辑直接映射到 DeepSeek-V3/V3.2 组件上,核心技术与架构参数全面公开,相比上一代 GLM-4.7 实现了质的飞跃。

两大核心技术复刻 DeepSeek

GLM-5 直接采用 DeepSeek-V3/V3.2 的核心架构,继承了两项关键技术,实现效率与性能的双重提升:

  1. 稀疏注意力机制(DSA):通过 Lightning Indexer 轻量级组件快速扫描历史 token 并打分,仅对与当前 query token 相关性最高的 Top-k 个 token 做完整注意力计算,其余直接跳过,大幅提升长文本处理效率,且输出质量几乎不受影响;

  2. 多 Token 预测(MTP):专为提升模型生成效率设计,是大模型推理提速的关键技术。

关键参数全面升级,745B 总参数量翻倍

从代码中推断的核心参数来看,GLM-5 采用 MoE(混合专家)架构,各项指标对比上一代 GLM-4.7 实现跨越式升级,与 DeepSeek V3.2、Kimi K2 等主流旗舰模型相比也具备显著竞争力:

  • 总参数量745B,是 GLM-4.7 的 2 倍;

  • 包含 78 层隐藏层,256 个专家,每次推理激活 8 个,激活参数约 44B,稀疏度 5.9%,与 DeepSeek-V3.2 基本持平;

  • 上下文窗口支持最高202K token,长文本处理能力拉满;

  • 可直接复用 vLLM、SGLang 等推理框架已有的优化,部署门槛大幅降低。

主流旗舰大模型参数对比

表格

模型 总参数量 单 token 激活参数 注意力类型 隐藏层数量 专家数 单次激活专家数
GLM-5 ~745B ~44B DSA 78 256 8
DeepSeek V3.2 ~685B ~37B DSA 61 256 8
Kimi K2 ~1T ~32B MLA 61 384 8
GLM-4.5 ~355B ~32B GQA 92 160 8

核心优势:GLM-5 的单 token 激活参数达 44B,为目前主流模型中最高,意味着其单次推理的算力投入更大,能支撑更复杂的任务处理,推理与生成性能更具优势。

市场疑问:是否缺失多模态能力?

有开发者提出,DeepSeek-V3 架构以纯文本处理为主,GLM-5 直接复用该架构,首发版本或暂不支持多模态能力,这也成为目前社区对 GLM-5 的最大疑问,具体答案仍需等待智谱官方正式公布。

匿名测试版实锤:Pony Alpha 就是 GLM-5,性能表现惊艳

2 月初,OpenRouter 平台上线了一款神秘的匿名免费模型「Pony Alpha」,支持 200K 大上下文窗口,其强劲的性能迅速引发开发者社区热议,而多重证据链均指向,这款模型就是 GLM-5 的内测版本。

性能亮点:编程与复杂推理能力拉满

Pony Alpha 的实测表现让社区惊艳,核心优势体现在两大方面:

  1. 编程能力突出,可根据单条提示直接生成2200 行完整的功能性应用程序,无需多轮调试;

  2. 复杂推理与 Agent 工作流处理能力优异,大上下文下的任务执行表现稳定。

四重证据链实锤 GLM-5 身份

  1. 时间吻合:Pony Alpha 上线节点,与智谱首席科学家唐杰多次暗示的 GLM-5 发布窗口高度一致,唐杰曾在社交平台直接发布「glm-5」字样,预告模型即将推出;

  2. 技术特征匹配:开发者测试发现,该模型对特定 token 的反应模式与 GLM 系列完全一致;

  3. 输出风格统一:排版、应答习惯等细节与 GLM 系列高度契合,具备鲜明的 “中国模型风格”;

  4. 分词器专属特征:中文短语 “锅内倒入植物油烧热” 是 GLM-4/5 分词器的专属 “故障字符串”,Pony Alpha 对该短语的反应与 GLM 系列完全相同,成为最直接的实锤证据。

市场反应热烈:智谱港股两日暴涨 60%,市值再创新高

GLM-5 架构曝光 + Pony Alpha 实测表现惊艳的双重利好,直接带动智谱 AI 港股的强势上涨,短短两个交易日涨幅超 60%,市场对新一代大模型的商业价值充满期待。

截至 2 月 10 日休市,智谱 AI 港股报价 335.000 港元,当日涨幅 2.03%,近期最高触及 344.000 港元,总市值达 1494 亿港元,成交量与成交额均出现明显放大,资金对 GLM-5 的发布高度看好。

春节档大混战:GLM-5 撞上模型更新潮,AI 赛道竞争升级

GLM-5 的发布窗口,恰好落在 2026 年春节前后(2 月中旬),而这一时间段也成为各大 AI 厂商的模型更新密集期,一场旗舰大模型的 “春节档混战” 正式开启。

目前已有多款主流大模型确认将在近期发布更新,包括 DeepSeek V4、阿里 Qwen 3.5、MiniMax M2.2 等,加上已开启内测的 GLM-5,以及传闻中的 GPT-5.3、Claude 4.6、Gemini 3 GA 等海外模型,2026 年 2 月将成为大模型技术迭代的关键窗口期,无论是模型参数、上下文窗口,还是推理效率、落地能力,都将迎来新一轮的升级比拼。

而 GLM-5 凭借 745B 大参数、202K 大上下文、复用 DeepSeek 成熟架构带来的低部署门槛,以及实测惊艳的性能表现,已成为此次春节档模型大战中最受关注的选手之一,其正式发布后的表现,也将直接影响智谱在大模型赛道的市场地位。

相关参考链接

  1. vLLM 框架 GLM 适配代码:https://github.com/vllm-project/vllm/pull/34124

  2. 社区实锤 Pony Alpha 为 GLM-5:https://x.com/chetaslua/status/2020832197771714943

大模型也卷得这么凶啊

看来大家都挺看好这波行情啊

这个模型看起来挺能打啊

这参数升级确实猛啊

我比较关注那个编程能力实测。

智谱这次复用DeepSeek-V3架构挺聪明的,直接继承了DSA和MTP这些验证过的技术栈。745B总参数配合44B激活参数,单次推理的算力密度确实拉满了。

真没想到股市反应这么快

哎我去这波操作太秀了!直接用DeepSeek的架构还搞出745B参数,性能直接拉满。Pony Alpha测试版效果这么顶,难怪股价蹭蹭涨。春节档这波混战有看头了,坐等GLM-5正式上线跟各家掰掰手腕!

这波涨得确实凶啊