2026 年春节,AI 圈被 MiniMax 彻底点燃。港股马年首个交易日(2 月 20 日),MiniMax 股价暴涨 14.52%,市值一度冲破 3042 亿港元。这波暴涨绝非资本情绪宣泄 —— 春节前后发布的新一代模型 M2.5,以 3.07T tokens 的周调用量登顶 OpenRouter 榜首,超过 Kimi K2.5、GLM-5 与 DeepSeek V3.2 三家总和,用实力引爆了压抑已久的 Agent 需求。
从硅谷编程工具到全球开源社区,M2.5 凭借 “能力顶尖、速度飞快、成本亲民” 的三重优势,成为 Agent 时代的 “现象级模型”,更让沉寂的 AI 应用生态迎来真正的规模化落地拐点。
一、数据封神:3T 调用量背后的需求爆发
M2.5 的横空出世,直接改写了 AI 模型的竞争格局,多项核心数据创下行业纪录:
-
调用量断层领先:发布 12 小时登顶 OpenRouter 热度榜,一周内周调用量暴涨 524% 至 3.07T tokens,远超第二名 Kimi K2.5(1.16T),成为 OpenRouter 史上首个走出指数级增长曲线的模型;
-
激活长文本刚需:带动 100K-1M 长文本区间调用量激增,该区间是 Agent 工作流的核心消耗场景。此前因缺乏 “能力 + 成本” 双达标的模型,大量开发者的 Agent 工作流被迫搁置,M2.5 的出现恰好打通了这一堵 “需求墙”;
-
生态接入盛况空前:Kilo Code、OpenClaw、Fireworks、Ollama、vLLM、魔搭社区等海内外知名 Agent 应用与工具平台,第一时间宣布接入。其中,硅谷编程新贵 Kilo Code 更是将其作为默认模型 —— 要知道,这家可调用 500 + 模型的平台,对底层模型的选择向来极为挑剔。
二、三大核心优势:击穿 Agent 落地的 “不可能三角”
M2.5 的成功,本质是同时攻克了 Agent 落地的三大核心痛点 —— 能力、速度、成本,打破了长期存在的 “不可能三角”。
1. 能力顶尖:媲美闭源旗舰的开源王者
在编程领域最权威的 SWE-Bench Verified 评测中,M2.5 以 80.2% 的通过率比肩 Claude Opus 系列,在多语言任务 Multi-SWE-Bench 中排名第一;知名技术博主 Simon Willison 的独立测评显示,M2.5 在代码任务中排名第三,仅次于 Claude Opus 4.5 和 Gemini 3 Flash,是开源模型中的绝对第一。
更关键的是,M2.5 的能力覆盖 Agent 全场景需求:从复杂代码生成、多工具联动到长程任务规划,其表现完全满足生产级应用要求,让开源社区的 Agent Demo 第一次具备了商业落地的底气。
2. 速度炸裂:2500 tok/s/GPU 的吞吐量革命
研究机构 SemiAnalysis 的实测数据显示,在 8 张 H200 显卡上,M2.5 展现出极致的执行效率:
-
首 token 延迟(TTFT)控制在 10-25 秒的合理区间,同时持续达到每 GPU 每秒 2500 个 token 的吞吐量;
-
即便是严格要求每用户每秒 20 个 token 交互性的场景,处理 10K + 上下文时仍能维持稳定解码速度,彻底解决了 Agent 长任务执行中的卡顿问题。
3. 成本亲民:主流旗舰 1/10 的定价策略
M2.5 的定价直接击穿了 Agent 的商业逻辑临界点,提供两个高性价比版本:
-
100 TPS 快速版:输入每百万 tokens 仅 0.3 美元,输出每百万 tokens 仅 2.4 美元;
-
50 TPS 标准版:输出价格再降一半,性价比碾压同类模型。
对比同类产品,M2.5 的使用成本仅为主流旗舰模型的 1/10。对需要长时间运行、高频调用工具的 Agent 框架来说,这种定价让原本 “跑不起” 的商业逻辑彻底跑通。
三、技术护城河:Forge 系统重构 Agent 训练底层
M2.5 的强悍表现,源于 MiniMax 自研的原生 Agent 强化学习系统 ——Forge。这套从工程底层重新设计的架构,彻底解决了传统 RL 框架的核心痛点:
1. 解耦设计:兼容千种工具的 “万能接口”
Forge 通过 Gateway Server 中间件抽象层,将 Agent 执行逻辑与底层训练推理引擎彻底解耦。不同于传统框架要求 Agent 与 Tokenizer 深度绑定的 “白盒模式”,M2.5 可在不修改任何 Agent 内部代码的前提下,接入数百种框架和数千种工具调用格式,极大降低了生态接入成本。
2. 40 倍训练加速:Prefix Tree Merging 的黑科技
针对多轮 Agent 请求中大量重复的上下文前缀,Forge 引入 Prefix Tree Merging 方案,将线性训练样本重构为树形结构,直接消除冗余计算,实现约 40 倍的训练加速,同时显著降低显存开销,让大规模 Agent 训练效率飙升。
3. 复合奖励机制:解决长轨迹信用分配难题
针对 Agent 长任务中的奖励分配痛点,Forge 设计了三重复合奖励体系:
-
过程奖励:密集监督中间行为,不依赖单一最终结果;
-
时间奖励:激励模型选择最短执行路径,提升效率;
-
Reward-to-Go:标准化回报降低梯度方差,稳定训练过程。
此外,M2.5 还将上下文管理直接整合进 RL 交互循环,从根本上解决了长程任务中的注意力稀释问题,让 Agent 在多轮交互中始终保持 “思路清晰”。
四、市值 3042 亿的启示:Agent 生态的真正拐点已至
MiniMax 的市值暴涨与 M2.5 的爆发,背后是 AI 行业的深层变革:
-
需求端彻底觉醒:过去两年,AI 行业聚焦供给侧(模型、芯片、数据中心),但制约规模化落地的核心是需求释放不足。M2.5 的成功证明,只要模型同时满足 “能力够强、速度够快、成本够低”,压抑的 Agent 需求会瞬间爆发;
-
开源模型的逆袭:在 ChatGPT、Claude、Gemini “御三家” 垄断的市场中,M2.5 以开源姿态突围,证明开源模型完全有能力冲击第一梯队。其支持本地部署的特性,更满足了企业级用户的数据安全需求;
-
迭代速度定胜负:过去 108 天,MiniMax 连续推出 M2、M2.1、M2.5 三代模型,在 SWE-Bench Verified 榜单上的进步速度远超 Anthropic、OpenAI、Google 系列,成为行业迭代最快的模型团队。
结语:Agent 时代,终于跑起来了
M2.5 的横空出世,不仅让 MiniMax 跻身 AI 巨头行列,更标志着 Agent 生态从 “Demo 阶段” 迈入 “规模化落地阶段”。当能力、速度、成本的 “不可能三角” 被打破,当开源社区的 Agent 工作流纷纷激活,AI 行业的真正革命才刚刚开始。
3.07T tokens 的周调用量,是开发者用脚投出的信任票;3042 亿的市值,是资本市场对 Agent 时代的强烈看好。正如 OpenRouter 上激增的长文本调用需求所示,那些被压抑了许久的 AI 应用场景,正在 M2.5 的推动下,迎来真正的爆发时刻。



