2026 年 2 月,国内开源大模型赛道迎来 “神仙打架” 的疯狂内卷期!受 DeepSeek 即将发布 V4 模型的消息刺激,GLM、MiniMax、千问(Qwen)等头部厂商扎堆发布新品,甚至 Qwen3.5 选择除夕当天上线,内卷程度堪称 “纯纯不当人”。蚂蚁、面壁、美团龙猫持续加码,京东、BOSS 直聘等新面孔强势入局,而字节 Seedance2.0 虽未开源,却凭借硬实力成为 “隐形爆款”。本月开源模型覆盖文本生成、多模态、OCR、音频、端侧部署等全场景,参数规模从 0.5B 到 1T + 跨度极大,堪称 AI 开源领域的 “狂欢月”。
一、2 月开源模型核心盘点(按发布时间排序)
文本生成类模型:参数与效率双突破
1. 阶跃 Step 3.5 Flash(2 月 3 日)
-
核心参数:总参数 196B,激活参数 11B,45 层 Transformer blocks(前 3 层为 dense 层,后为 MoE 层);
-
架构亮点:浅层 Dense 层优化特征提取,稀疏 MoE 架构提升 “智能密度”,推理能力对标顶级闭源模型;
-
关键数据:月下载量 32.3 万次,支持多轮对话与 Agent 能力,许可证为 Apache 2.0;
-
适用场景:复杂推理、长文本生成、Agent 开发。
2. 千问 Qwen3-Coder-Next(2 月 4 日)
-
核心参数:基于 Qwen3-Next-80B-A3B-Base 增量训练,激活参数 3B;
-
核心优势:256k 超长上下文,适配 Claude Code、Qwen Code 等主流 IDE/CLI,支持复杂工具使用与故障恢复;
-
关键数据:月下载量 81.9 万次,Apache 2.0 许可证,代码生成效率媲美 10-20 倍参数规模模型;
-
适用场景:编码 Agent、本地开发、复杂代码工程。
3. 美团 LongCat-Flash-Lite(2 月 6 日)
-
核心参数:总参数 68.5B,激活参数 3B,MoE 架构;
-
架构亮点:采用 YaRN 技术支持 256k 上下文,主打 “非思考型” 高效生成;
-
特色功能:2 月 11 日新增 DeepResearch 功能,凸显数据壁垒价值;
-
关键数据:月下载量 2897 次,MIT 许可证;
-
适用场景:长文本摘要、批量内容生成、科研资料整理。
4. 腾讯混元 HY-1.8B-2Bit(2 月 11 日)
-
核心参数:基础参数 1.8B,2Bit 端侧量化;
-
核心优势:极致轻量化,可无压力部署于边缘设备,压缩效率行业领先;
-
关键数据:月下载量 297 次,支持与 HY-0.5B、HY-1.8B-Int4 等型号联动;
-
适用场景:物联网设备、边缘计算、低算力环境下的轻量化 NLP 任务。
5. 蚂蚁 LLaDA2.1(2 月 11 日)
-
核心参数:提供 100B 和 16B 两个版本,扩散大语言模型架构;
-
核心优势:创新可纠错编辑机制,推理速度高达 892 TPS,兼顾性能与效率;
-
关键数据:月下载量 2.1 万次,Apache 2.0 许可证;
-
适用场景:需要动态修改的文本生成、高并发文本处理任务。
6. 智谱 GLM-5(2 月 12 日)
-
核心参数:总参数 744B,激活参数 40B,训练数据 28.5T tokens;
-
架构亮点:采用 DeepSeek Sparse Attention 技术,主打后端复杂任务处理;
-
关键数据:月下载量 19.4 万次,MIT 许可证;
-
适用场景:复杂系统工程、长周期 Agent 任务、深度推理任务。
7. BOSS 直聘 Nanbeige4.1-3B(2 月 13 日)
-
核心参数:总参数 4B(实际标注 3B 级别),BF16 张量类型;
-
核心优势:经 SFT 与 RL 优化,同尺寸模型中推理能力、偏好对齐、Agent 行为表现登顶;
-
关键数据:月下载量 33.8 万次,Apache 2.0 许可证;
-
适用场景:中小企业智能客服、轻量化对话系统、招聘场景专属 Agent。
8. 蚂蚁 Ring-2.5-1T(2 月 13 日)
-
核心参数:总参数 1T,混合线性注意力架构;
-
核心优势:全球首个开源万亿参数 “思考型” 模型,1:7 MLA+Lightning Linear Attention 提升推理速度;
-
关键数据:月下载量 1.1 万次,MIT 许可证;
-
适用场景:超复杂推理、科学计算辅助、多步骤决策任务。
9. MiniMax M2.5(2 月 13 日)
-
核心参数:总参数 229B,支持 FP8 精度,混合张量类型(F32-BF16-F8_E43);
-
核心优势:代码生成与 Agent 能力显著提升,春节期间调用量爆发;
-
关键数据:月下载量 31.3 万次,Modified-MIT 许可证;
-
适用场景:企业级 Agent 开发、批量办公自动化、复杂任务编排。
10. 京东 JoyAI-LLM-Flash(2 月 15 日)
-
核心参数:总参数 48B,激活参数 3B,训练数据 20 万亿文本 tokens;
-
核心优势:采用 Muon 优化器,经 SFT、DPO、RL 三轮优化,知识覆盖、推理、编码能力均衡;
-
关键数据:月下载量 1407 次,Modified-MIT 许可证;
-
适用场景:电商场景 Agent、企业知识库问答、轻量化业务系统。
11. 蚂蚁 Ling-2.5-1T(2 月 16 日)
-
核心参数:总参数 1T,激活参数 63B,训练数据 29T tokens;
-
核心优势:复杂推理与指令遵循能力超越主流模型,架构与偏好对齐双升级;
-
关键数据:月下载量 1784 次,MIT 许可证;
-
适用场景:通用 AI Agent、深度科研辅助、企业级决策支持。
12. 千问 Qwen3.5 系列(2 月 16 日 - 24 日)
-
核心型号:
-
Qwen3.5-397B-A17B:原生多模态,视觉理解大幅提升,总参数 403B;
-
Qwen3.5-35B-A3B/122B-A10B/27B:中尺寸系列,覆盖不同算力需求;
-
-
关键数据:Qwen3.5-397B-A17B 月下载量 103 万次,Apache 2.0 许可证;
-
适用场景:多模态生成、跨模态 Agent、大规模 AI 系统部署。
多模态类模型:全场景覆盖,体验逼近闭源
1. 面壁 MiniCPM-o 4.5(2 月 4 日)
-
核心参数:总参数 9B,基于 SigLip2、Whisper-medium、CosyVoice2、Qwen3-8B 构建;
-
核心优势:全双工多模态直播能力,打破轮次限制,模型可主动交流,支持视觉、语音全场景;
-
关键数据:月下载量 9.5 万次,Apache 2.0 许可证,支持手机端实时部署;
-
适用场景:多模态直播、智能交互终端、跨模态客服。
2. 上海 AI 实验室 Intern-S1-Pro(2 月 5 日)
-
核心参数:总参数 1T,多模态科学推理架构;
-
核心优势:AI4Science 领域效果优异,支持图像 - 文本 - 科学计算跨模态任务;
-
关键数据:月下载量 6.7 万次,Apache 2.0 许可证;
-
适用场景:科学研究辅助、学术论文生成、科研数据可视化。
3. 蚂蚁 Ming-flash-omni-2.0(2 月 11 日)
-
核心参数:总参数 100B,激活参数 6B,MoE 架构(Ling-2.0 底座);
-
核心优势:开源全模态 SOTA,视觉百科知识、沉浸式语音合成、高动态图像生成能力突出;
-
关键数据:月下载量 9154 次,MIT 许可证;
-
适用场景:多模态内容创作、虚拟人开发、跨模态交互系统。
4. 小红书 FireRed-Image-Edit-1.0(2 月 14 日)
-
核心参数:基于 QwenImageEditPlusPipeline,支持中英文指令;
-
核心优势:图像编辑效果直逼闭源模型,支持精细化修改与风格迁移;
-
关键数据:月下载量 5701 次,Apache 2.0 许可证;
-
适用场景:社交媒体图像优化、设计稿修改、创意图像生成。
5. 高德地图 FantasyWorld-Wan2.1-I2V-14B-480P(2 月 14 日)
-
核心参数:总参数 14B,图像到视频生成架构;
-
核心优势:几何一致性世界建模,支持视频与 3D 预测联动,曾登顶 WorldScore 排行榜;
-
关键数据:ICLR 2026 收录,Apache 2.0 许可证;
-
适用场景:虚拟场景生成、导航可视化、短视频内容创作。
专项功能类模型:垂直场景精准突破
1. 智谱 GLM-OCR(2 月 3 日)
-
核心参数:总参数 0.9B,支持 8 种语言;
-
核心优势:基于 GLM-V 编码器 - 解码器架构,引入 MTP 损失与全任务稳定训练,复杂文档理解能力强;
-
关键数据:月下载量 208.4 万次(本月下载量冠军),MIT 许可证;
-
适用场景:复杂文档识别、多语言 OCR、票据 / 报告数字化。
2. 蚂蚁 Ming-omni-tts(2 月 14 日)
-
核心参数:提供 0.5B 和 16.8B-A3B 两个版本,支持多通道音频生成;
-
核心优势:精准控制语速、音调、情绪、方言(粤语控制准确率 93%),支持数学 / 化学表达式自然朗读;
-
关键数据:月下载量 2995 次,Apache 2.0 许可证;
-
适用场景:语音合成、智能配音、多模态内容音频化。
架构创新类模型:技术路线再升级
面壁 MiniCPM-SALA(2 月 12 日)
-
核心参数:未公开具体参数,支持中英双语;
-
核心优势:创新线性 - 稀疏注意力混合架构,需系统级协同与跨层编译优化释放潜力;
-
关键数据:月下载量 5250 次,Apache 2.0 许可证;
-
适用场景:高效注意力任务、低延迟推理、大规模并行计算。
二、2 月开源模型核心趋势
1. 内卷焦点:MoE 架构成主流
本月超 70% 的大参数模型采用 MoE(混合专家)架构,通过 “总参数大 + 激活参数小” 的模式,平衡推理能力与效率。千问、蚂蚁、阶跃等厂商均以 “激活参数 / 总参数” 比例作为核心卖点,凸显 “智能密度” 的重要性。
2. 场景分化:从 “通用” 到 “垂直专精”
-
文本生成模型细分出 “编码专用”(Qwen3-Coder-Next)、“科学推理专用”(Intern-S1-Pro)、“端侧专用”(HY-1.8B-2Bit);
-
多模态模型不再追求 “全而杂”,转而聚焦 “直播交互”(MiniCPM-o 4.5)、“科学计算”(Intern-S1-Pro)、“图像编辑”(FireRed-Image-Edit-1.0)等垂直场景。
3. 新玩家入局:跨界选手带来新视角
京东、BOSS 直聘等非传统 AI 厂商强势入局,模型设计更贴近业务场景:BOSS 直聘 Nanbeige4.1-3B 适配招聘场景,京东 JoyAI-LLM-Flash 侧重电商业务,为开源模型带来更多实用化创新。
4. 数据壁垒凸显:模型性能差距本质是数据差距
美团 LongCat-Flash-Lite 新增的 DeepResearch 功能,蚂蚁 Ling-2.5-1T 的 29T tokens 训练数据,均证明 “数据质量 + 规模” 成为模型性能的核心护城河,单纯堆参数的内卷已逐渐失效。
三、热门模型对比与选型建议
1. 高下载量模型 TOP5(月下载量)
表格
| 模型名称 | 月下载量 | 核心优势 | 适用人群 |
|---|---|---|---|
| GLM-OCR | 208.4 万次 | 轻量、多语言、复杂文档识别 | 开发者、企业数字化部门 |
| Qwen3.5-397B-A17B | 103 万次 | 原生多模态、视觉理解强 | 多模态开发者、企业 AI 团队 |
| Qwen3-Coder-Next | 81.9 万次 | 编码专用、IDE 适配好 | 程序员、技术团队 |
| Nanbeige4.1-3B | 33.8 万次 | 轻量化、推理强 | 中小企业、独立开发者 |
| MiniMax M2.5 | 31.3 万次 | Agent 能力突出、调用稳定 | 企业 Agent 开发、办公自动化 |
2. 选型决策树
-
若需OCR 功能:优先选 GLM-OCR(轻量、高下载量);
-
若需编码开发:Qwen3-Coder-Next(专业级)或 MiniMax M2.5(综合能力强);
-
若需多模态交互:MiniCPM-o 4.5(直播场景)或 Qwen3.5-397B-A17B(通用场景);
-
若需端侧部署:腾讯混元 HY-1.8B-2Bit(极致轻量化);
-
若需科学推理:Intern-S1-Pro(AI4Science 专用);
-
若需轻量化对话:Nanbeige4.1-3B(同尺寸性能登顶)。
四、下月展望:DeepSeek V4 能否终结内卷?
本月国内厂商的疯狂内卷,很大程度上源于 DeepSeek V4 即将发布的消息,但截至 2 月底,该模型仍未落地,被网友调侃 “虚晃一枪”。随着 3 月临近,DeepSeek V4 是否会如期而至?能否凭借硬实力打破当前的内卷格局?此外,字节 Seedance2.0 的开源传闻也引发热议,预计 3 月开源模型赛道将迎来更激烈的竞争。
对于开发者和企业而言,当前无需盲目追逐 “参数最大”,应根据实际场景选择适配的模型 —— 轻量化模型在成本与效率上的优势已逐渐凸显,而垂直场景专用模型的性价比远超通用大模型。