2026 年国产大模型赛道再添硬核玩家,科大讯飞在小年之际正式推出星火大模型 X2,仅用 3 个月时间实现从 X1.5 到 X2 的跨越式升级,推理性能直接飙升 50%,成为国内主流大模型中唯一基于全国产算力训练的通用大模型。这款采用 293B MoE 稀疏架构的新模型,不仅在数学推理、多语言交互等通用能力上对标 GPT-5.2、Gemini-3-Pro 等国际顶尖模型,更以 “通用底座 + 行业专才” 双轮驱动,在医疗、教育、汽车、智能体等核心场景实现深度落地,百万 tokens 最高仅需 3 元,兼顾高性能与高性价比,推动国产大模型进入应用红利期。
依托 “1+N” 战略和软硬一体化布局,星火 X2 不仅实现了技术自主可控,更在 2025 年大模型中标项目中斩获数量与金额双第一,中标金额达 23.16 亿元,超过第二名至第六名总和,用实际落地成果印证了技术实力与行业认可度。
通用能力跨越式升级,对标国际顶尖水准
星火 X2 的通用能力全面爆发,在多项核心基准测试中稳居国产第一梯队,部分指标与国际顶尖模型持平甚至超越,展现出强大的综合实力:
核心能力全面领跑,多维度逼近国际一流
横向对比显示,星火 X2 在语言理解、文本生成、知识问答等八大核心维度均表现亮眼,其中多语言和翻译能力显著优于国内友商模型,数学与逻辑推理紧随 GPT-5.2 和 Gemini-3-Pro 之后。在高难度基准测试中,更是交出含金量十足的答卷:
-
AIME 2025(竞赛级数学):斩获 95.7 分,仅次于 GPT-5.2(xhigh),展现处理顶尖数学难题的能力;
-
MMLU Pro(综合知识):87.3 分位居国产模型第一,与 GPT-5.2 持平,知识广度与深度达国际一流;
-
Tau2-bench(智能体):以 82.4 分领跑国产模型,验证复杂指令理解与工具调用能力的进阶。
实测表现惊艳,跨语言推理无压力
实际测试中,星火 X2 展现出极强的场景适应性:面对 2025 年哈佛 - 麻省理工数学锦标赛(HMMT)的英文难题,不仅快速给出正确答案 1305,更提供详尽解题过程,彻底吃透底层逻辑而非依赖中文语境;挑战西班牙语数学题时,同样流畅完成分析推导,给出精准结果N(n)=n2−n+1,彰显 130 + 多语言综合能力的 “国家队” 水准,拉美、东盟等地区重点语种效果保持业界领先。
四大技术创新,攻克国产算力瓶颈
星火 X2 的性能突破,源于四大核心技术创新,在 MoE 架构基础上实现效率与性能的双重飞跃:
-
训推采样校准强化学习算法:解决 MoE 模型训推分布不一致问题,通过自适应校准确保训练规律精准落地,避免性能坍塌;
-
递归式高难数据合成方法:针对深度推理数据稀缺痛点,多轮迭代生成高质量语料,持续提升模型推理准确率;
-
多阶段 RL 高吞吐采样方法:分离 Prefill 与 Decoder 两阶段,解决国产化平台高吞吐采样效率干扰,训练效率提升 10%;
-
服务高性能部署优化算法:通过模型轻量化压缩,实现单台国产服务器的单机大 EP 并行部署,让模型在国产算力上 “跑得动、跑得块”。
场景深度落地,四大领域实现行业突破
星火 X2 升级的核心重心在于场景落地,依托算法突破、高质量垂域数据与行业专家参与的 “三位一体” 模式,在医疗、教育、汽车、智能体四大高价值领域实现突破性进展:
医疗领域:合规与性能双领先,化身顶尖数字医生
星火医疗大模型在智能健康分析、辅助诊疗、智能用药审核等核心场景显著优于 GPT-5.2 及其他国产模型,智能用药审核准确率达 94.1%,位居行业第一;率先通过上海市医疗大模型应用检测验证中心评测,成为国内首批合规落地的医疗大模型。C 端 “讯飞晓医” APP 同步升级,多轮主动问诊诊断合理率 93.9%、检查检验单解读解答率 85.0%,全方位超越友商产品,成为普通用户触手可及的顶尖数字医生。
教育领域:个性化教学升级,打造苏格拉底式 AI 老师
星火教育大模型实现从 “搜索工具” 到 “一对一特级老师” 的进化,推出错因贯穿的个性化学习能力:精准捕捉学生知识点漏洞,实现步骤级批改与批注,通过启发式提问引导学生自主思考,契合苏格拉底式教学理念。核心指标全面领先,数学解答题步骤批改 F1 值 88.3%、个性化答疑辅学可用率 92.4%,均大幅超越 DeepSeek V3.2 和 GPT-5.2,赋能讯飞 AI 学习机实现 1 对 1 精准学,持续领跑教育硬件赛道。
汽车领域:突破模糊意图理解,智能座舱交互更自然
针对汽车智能座舱的交互痛点,星火 X2 多尺寸中小模型同步升级,实现模糊意图理解的跨越式突破 —— 过去用户需说 “调低空调至 24 度” 等精准指令,如今说 “我有点冷”“风太大” 即可触发正确响应,模糊意图交互成功率达 84%,远超竞品的 50%-58%。模型在人机对话判断、高情商回复等方面全面提升,让智能座舱交互更贴近自然对话逻辑。
智能体领域:效率倍增,分钟级定制企业专属智能体
星火 X2 彻底解决智能体长时复杂任务规划、多工具组合调用等痛点,赋能星辰 Agent 平台集成超 130 万个智能体。面向企业采购的招采智能体核心效率提升超 3 倍,更支持 “搭积木式” 定制,将专用智能体开发时间从几天缩短至分钟级,可快速适配城市治理、供应链管理、智慧客服等复杂企业场景。
国产算力突围,开启自主可控新范式
星火 X2 的发布,不仅是一款模型的升级,更是国产大模型自主可控发展的重要里程碑。作为国内主流大模型中唯一基于全国产算力训练的通用大模型,它实现了 “算力自主” 与 “技术自主” 的双重自主可控 —— 训练推理全程依托国产算力平台,模型框架完全自研,彻底摆脱对海外算力的依赖。
讯飞 “底座自主、硬件协同、场景为王” 的差异化路径,反向证明了在算力受限的情况下,通过算法创新与场景优化,依然能实现与国际顶尖模型的同台竞技。2025 年科大讯飞预计净利润同比增长 40%-70%,营收、毛利正向增长,彰显技术落地带来的业绩红利,也标志着国产大模型已从技术研发阶段迈入规模化应用的红利期。
目前,星火 X2 的最新能力已在讯飞星火网页版和 APP 同步上线,全新 API 开放平台正式启动,新注册开发者可领取 100 万 Tokens 免费额度,全球超 1000 万开发者可共享这一深度推理能力,共同推动 AI 技术在各行业的规模化落地。




