50 亿融资 + 模型登顶!阶跃星辰跻身 AI “新六小虎” 第一梯队,押注 AI + 终端赛道!

2026 年春节后,国产大模型圈 “季后赛” 激战正酣。字节豆包、阿里千问等巨头砸下超 40 亿元红包争夺用户,而独立大模型公司也密集出牌。在这场较量中,向来低调的阶跃星辰凭借 “50 亿元 B + 轮融资 + Step 3.5 Flash 模型登顶 + AI + 终端落地” 的三重暴击,强势突围,跻身国产大模型 “新六小虎” 第一梯队,成为决赛圈的有力竞争者。

核心爆发力:Step 3.5 Flash 模型,速度与智商双巅峰

阶跃星辰的突围,核心引擎是 2 月 2 日发布的开源 Agent 基座模型 Step 3.5 Flash。这款总参数量 196B、激活参数 11B 的模型,以 “速度快、智商高” 两大特点横扫榜单,重新定义了 Agent 时代基模的核心标准。

1. 速度碾压:每秒 350token,适配 Agent 低延迟需求

在 Agent 场景中,用户更关注任务完成效率而非逐字输出,Step 3.5 Flash 精准击中这一痛点 —— 单请求代码类任务的最高推理速度可达每秒 350 个 token,远超行业平均水平。发布首日便登上 OpenRouter “最快模型” 榜单,2 天后更是登顶 Trending 趋势榜,成为开发者关注度最高的开源模型之一。

从推理效能来看,在总分接近的情况下,它的推理效率优于 LongCat-Flash-Thinking-2601(77.13 秒 / 题)和 gpt-oss-120b (high)(93.83 秒 / 题),在复杂任务中能有效降低等待成本,完美适配多轮交互、任务规划等 Agent 核心场景。

2. 智商顶尖:数学推理比肩 GPT 5.2,国产开源第一

Step 3.5 Flash 的 “智商” 在数学推理赛道表现尤为突出,多项权威评测中斩获佳绩:

  • AIME 2026(美国高中数学邀请赛):以 96.67% 的准确率与 GPT 5.2 并列第一,超越 Gemini 3 Flash(93.33%),拿下国产模型桂冠;

  • MathArena 综合榜:以 96.11% 的准确率紧随 GPT 5.2(96.29%),推理成本仅 0.42 美元,远低于 GPT 5.2 的 4.38 美元,性价比优势显著;

  • 专项竞赛:AIME 2025(97.3 分)、IMOAnswerBench(85.4 分)、HMMT 2025(96.2 分)均位列国内开源模型第一,开启并行协同推理的 PaCoRe 版本更是将三项得分提升至 99.9 分、88.8 分、98.9 分,逼近满分。

此外,在 SuperCLUE 2025 中文大模型基准测评中,Step 3.5 Flash 以 48.97 的总分位列国内第七,优于海外顶尖开源模型 gpt-oss-120b (high),其数学推理单项 75.65 分跻身全球第五,超越 Claude-Opus-4.5-Reasoning、Grok-4 等国际闭源模型。

资本与团队:50 亿融资 +“黄金四角” 班底,筑牢决赛圈底气

阶跃星辰的强势崛起,离不开资本与核心团队的双重加持,更刷新了行业对 “季后赛准入门槛” 的定义 —— 持续训练资金、真实商业化场景、规模化用户入口三者兼备。

1. 50 亿融资:刷新年内单笔最高纪录

春节前,阶跃星辰完成超 50 亿元人民币 B + 轮融资,不仅刷新过去 12 个月国内 AI 赛道单笔融资纪录,更超过智谱、MiniMax 同期 IPO 募资金额。这笔巨额资金将重点投入下一代基模研发、AI + 终端生态建设,为其冲击决赛圈储备充足 “弹药”。

2. “1+3” 核心班底:顶配战力组合

融资背后,是资本对团队价值的高度认可。印奇加入后担任董事长,与 CEO 姜大昕、首席科学家张祥雨、CTO 朱亦博组成 “黄金四角” 核心班底:

  • 姜大昕:曾主导微软 Bing、Microsoft 365 研发,深谙产品与商业化逻辑;

  • 张祥雨:ResNet 核心作者(21 世纪全球被引量最高论文),算法功底深厚;

  • 朱亦博:曾在字节跳动从零搭建 AI Infra,系统工程经验丰富。

这支覆盖产品、算法、工程、商业化的全能团队,加上平均年龄 28 岁的新锐算法核心团队,构成了阶跃星辰的核心竞争力,被投资人评价为 “单独一人创业都是热门标的”。

差异化赛道:押注 AI + 终端,原生多模态抢先卡位

在大模型赛道多数玩家聚焦 C 端订阅或 B 端 API 售卖时,阶跃星辰选择了一条差异化道路 ——“AI + 终端 + 原生多模态”,提前踩中行业风口。

1. 原生多模态:从底层融合,而非简单叠加

阶跃星辰从 2023 年创立之初就以多模态为主线,避免盲目卷参数,转而聚焦效率与成本优化。截至 2026 年初,公司发布的 22 款自研基座模型中 16 款为多模态模型,实现了 “看、听、说、做” 的深度协同,而非早期多模态模型的 “单向映射”。

其语音模型 Step Audio R1.1 登顶 Artificial Analysis 权威榜单,多模态技术多次在 LMSYS、OpenCompass 等榜单位列 “中国大模型第一”,成为 OPPO、荣耀等旗舰机型的核心供给方,装机量超 4200 万台,日均服务近 2000 万人次。

2. AI + 终端:从手机到汽车,落地规模爆发

阶跃星辰的终极目标是打造 “软硬结合、跨端 OS 驱动的超级助理”,让 AI 真正融入日常生活:

  • 手机终端:推出 4B 参数的端侧模型 Step-GUI,可部署在手机上实现 “一句话办事”,央视采访中已展示 “一句话购买火车票” 功能,能自动跳过广告、精准完成操作;

  • 智能座舱:与吉利、千里科技联合推出 AgentOS 智能座舱,量产车型吉利银河 M9 上市 3 个月销量近 4 万,已进军海外,2026 年 “上车” 规模预计超百万辆;

  • 生态数据:过去一年,开放平台 API 调用量增长近 20 倍,活跃用户增长 5 倍,终端 Agent API 调用量连续三季度增长近 170%,商业化落地成效显著。

行业格局:新六小虎分化,决赛圈比拼 “硬实力”

随着大模型竞赛进入下半场,早期 “六小虎” 已出现明显分化:智谱、MiniMax 登陆资本市场,零一、百川转向垂直业务,阶跃星辰与月之暗面凭借巨额融资补充弹药,跻身第一梯队。

阶跃星辰的突围证明,决赛圈的核心竞争力已从 “参数规模” 转向 “技术落地能力”——Step 3.5 Flash 的开源策略吸引了大量开发者,AI + 终端的路径构建了深厚壁垒,而 50 亿融资与顶配团队则保障了持续进化能力。

不过,模型仍有提升空间:在 SuperCLUE 测评中,其科学推理、代码生成、幻觉控制等任务表现处于中后部,与国内头部模型存在 10 分以内的差距。未来,能否补齐短板、推出更强基模,并在 AI + 终端赛道扩大领先优势,将决定其能否在决赛圈最终胜出。

随着 AI + 终端从 “非共识” 成为 “行业共识”,字节豆包手机、OpenAI 硬件企划等玩家纷纷入局,窗口期正快速缩短。而阶跃星辰凭借先发优势、技术积累与规模化落地,已在这条赛道上占据有利位置,有望成为 AI 时代终端生态的核心玩家。

融资这么多但模型短板还是明显

这个模型数学挺厉害的

速度确实挺关键的

速度确实快 但还得看看实际用起来稳不稳定

这波操作确实有料

这模型速度真够快的