2026 年 2 月开源模型全景汇总:国内厂商狂卷,DeepSeek 虚晃一枪!

2026 年 2 月,国内开源大模型赛道迎来 “神仙打架” 的疯狂内卷期!受 DeepSeek 即将发布 V4 模型的消息刺激,GLM、MiniMax、千问(Qwen)等头部厂商扎堆发布新品,甚至 Qwen3.5 选择除夕当天上线,内卷程度堪称 “纯纯不当人”。蚂蚁、面壁、美团龙猫持续加码,京东、BOSS 直聘等新面孔强势入局,而字节 Seedance2.0 虽未开源,却凭借硬实力成为 “隐形爆款”。本月开源模型覆盖文本生成、多模态、OCR、音频、端侧部署等全场景,参数规模从 0.5B 到 1T + 跨度极大,堪称 AI 开源领域的 “狂欢月”。

一、2 月开源模型核心盘点(按发布时间排序)

文本生成类模型:参数与效率双突破

1. 阶跃 Step 3.5 Flash(2 月 3 日)

  • 核心参数:总参数 196B,激活参数 11B,45 层 Transformer blocks(前 3 层为 dense 层,后为 MoE 层);

  • 架构亮点:浅层 Dense 层优化特征提取,稀疏 MoE 架构提升 “智能密度”,推理能力对标顶级闭源模型;

  • 关键数据:月下载量 32.3 万次,支持多轮对话与 Agent 能力,许可证为 Apache 2.0;

  • 适用场景:复杂推理、长文本生成、Agent 开发。

2. 千问 Qwen3-Coder-Next(2 月 4 日)

  • 核心参数:基于 Qwen3-Next-80B-A3B-Base 增量训练,激活参数 3B;

  • 核心优势:256k 超长上下文,适配 Claude Code、Qwen Code 等主流 IDE/CLI,支持复杂工具使用与故障恢复;

  • 关键数据:月下载量 81.9 万次,Apache 2.0 许可证,代码生成效率媲美 10-20 倍参数规模模型;

  • 适用场景:编码 Agent、本地开发、复杂代码工程。

3. 美团 LongCat-Flash-Lite(2 月 6 日)

  • 核心参数:总参数 68.5B,激活参数 3B,MoE 架构;

  • 架构亮点:采用 YaRN 技术支持 256k 上下文,主打 “非思考型” 高效生成;

  • 特色功能:2 月 11 日新增 DeepResearch 功能,凸显数据壁垒价值;

  • 关键数据:月下载量 2897 次,MIT 许可证;

  • 适用场景:长文本摘要、批量内容生成、科研资料整理。

4. 腾讯混元 HY-1.8B-2Bit(2 月 11 日)

  • 核心参数:基础参数 1.8B,2Bit 端侧量化;

  • 核心优势:极致轻量化,可无压力部署于边缘设备,压缩效率行业领先;

  • 关键数据:月下载量 297 次,支持与 HY-0.5B、HY-1.8B-Int4 等型号联动;

  • 适用场景:物联网设备、边缘计算、低算力环境下的轻量化 NLP 任务。

5. 蚂蚁 LLaDA2.1(2 月 11 日)

  • 核心参数:提供 100B 和 16B 两个版本,扩散大语言模型架构;

  • 核心优势:创新可纠错编辑机制,推理速度高达 892 TPS,兼顾性能与效率;

  • 关键数据:月下载量 2.1 万次,Apache 2.0 许可证;

  • 适用场景:需要动态修改的文本生成、高并发文本处理任务。

6. 智谱 GLM-5(2 月 12 日)

  • 核心参数:总参数 744B,激活参数 40B,训练数据 28.5T tokens;

  • 架构亮点:采用 DeepSeek Sparse Attention 技术,主打后端复杂任务处理;

  • 关键数据:月下载量 19.4 万次,MIT 许可证;

  • 适用场景:复杂系统工程、长周期 Agent 任务、深度推理任务。

7. BOSS 直聘 Nanbeige4.1-3B(2 月 13 日)

  • 核心参数:总参数 4B(实际标注 3B 级别),BF16 张量类型;

  • 核心优势:经 SFT 与 RL 优化,同尺寸模型中推理能力、偏好对齐、Agent 行为表现登顶;

  • 关键数据:月下载量 33.8 万次,Apache 2.0 许可证;

  • 适用场景:中小企业智能客服、轻量化对话系统、招聘场景专属 Agent。

8. 蚂蚁 Ring-2.5-1T(2 月 13 日)

  • 核心参数:总参数 1T,混合线性注意力架构;

  • 核心优势:全球首个开源万亿参数 “思考型” 模型,1:7 MLA+Lightning Linear Attention 提升推理速度;

  • 关键数据:月下载量 1.1 万次,MIT 许可证;

  • 适用场景:超复杂推理、科学计算辅助、多步骤决策任务。

9. MiniMax M2.5(2 月 13 日)

  • 核心参数:总参数 229B,支持 FP8 精度,混合张量类型(F32-BF16-F8_E43);

  • 核心优势:代码生成与 Agent 能力显著提升,春节期间调用量爆发;

  • 关键数据:月下载量 31.3 万次,Modified-MIT 许可证;

  • 适用场景:企业级 Agent 开发、批量办公自动化、复杂任务编排。

10. 京东 JoyAI-LLM-Flash(2 月 15 日)

  • 核心参数:总参数 48B,激活参数 3B,训练数据 20 万亿文本 tokens;

  • 核心优势:采用 Muon 优化器,经 SFT、DPO、RL 三轮优化,知识覆盖、推理、编码能力均衡;

  • 关键数据:月下载量 1407 次,Modified-MIT 许可证;

  • 适用场景:电商场景 Agent、企业知识库问答、轻量化业务系统。

11. 蚂蚁 Ling-2.5-1T(2 月 16 日)

  • 核心参数:总参数 1T,激活参数 63B,训练数据 29T tokens;

  • 核心优势:复杂推理与指令遵循能力超越主流模型,架构与偏好对齐双升级;

  • 关键数据:月下载量 1784 次,MIT 许可证;

  • 适用场景:通用 AI Agent、深度科研辅助、企业级决策支持。

12. 千问 Qwen3.5 系列(2 月 16 日 - 24 日)

  • 核心型号

    • Qwen3.5-397B-A17B:原生多模态,视觉理解大幅提升,总参数 403B;

    • Qwen3.5-35B-A3B/122B-A10B/27B:中尺寸系列,覆盖不同算力需求;

  • 关键数据:Qwen3.5-397B-A17B 月下载量 103 万次,Apache 2.0 许可证;

  • 适用场景:多模态生成、跨模态 Agent、大规模 AI 系统部署。

多模态类模型:全场景覆盖,体验逼近闭源

1. 面壁 MiniCPM-o 4.5(2 月 4 日)

  • 核心参数:总参数 9B,基于 SigLip2、Whisper-medium、CosyVoice2、Qwen3-8B 构建;

  • 核心优势:全双工多模态直播能力,打破轮次限制,模型可主动交流,支持视觉、语音全场景;

  • 关键数据:月下载量 9.5 万次,Apache 2.0 许可证,支持手机端实时部署;

  • 适用场景:多模态直播、智能交互终端、跨模态客服。

2. 上海 AI 实验室 Intern-S1-Pro(2 月 5 日)

  • 核心参数:总参数 1T,多模态科学推理架构;

  • 核心优势:AI4Science 领域效果优异,支持图像 - 文本 - 科学计算跨模态任务;

  • 关键数据:月下载量 6.7 万次,Apache 2.0 许可证;

  • 适用场景:科学研究辅助、学术论文生成、科研数据可视化。

3. 蚂蚁 Ming-flash-omni-2.0(2 月 11 日)

  • 核心参数:总参数 100B,激活参数 6B,MoE 架构(Ling-2.0 底座);

  • 核心优势:开源全模态 SOTA,视觉百科知识、沉浸式语音合成、高动态图像生成能力突出;

  • 关键数据:月下载量 9154 次,MIT 许可证;

  • 适用场景:多模态内容创作、虚拟人开发、跨模态交互系统。

4. 小红书 FireRed-Image-Edit-1.0(2 月 14 日)

  • 核心参数:基于 QwenImageEditPlusPipeline,支持中英文指令;

  • 核心优势:图像编辑效果直逼闭源模型,支持精细化修改与风格迁移;

  • 关键数据:月下载量 5701 次,Apache 2.0 许可证;

  • 适用场景:社交媒体图像优化、设计稿修改、创意图像生成。

5. 高德地图 FantasyWorld-Wan2.1-I2V-14B-480P(2 月 14 日)

  • 核心参数:总参数 14B,图像到视频生成架构;

  • 核心优势:几何一致性世界建模,支持视频与 3D 预测联动,曾登顶 WorldScore 排行榜;

  • 关键数据:ICLR 2026 收录,Apache 2.0 许可证;

  • 适用场景:虚拟场景生成、导航可视化、短视频内容创作。

专项功能类模型:垂直场景精准突破

1. 智谱 GLM-OCR(2 月 3 日)

  • 核心参数:总参数 0.9B,支持 8 种语言;

  • 核心优势:基于 GLM-V 编码器 - 解码器架构,引入 MTP 损失与全任务稳定训练,复杂文档理解能力强;

  • 关键数据:月下载量 208.4 万次(本月下载量冠军),MIT 许可证;

  • 适用场景:复杂文档识别、多语言 OCR、票据 / 报告数字化。

2. 蚂蚁 Ming-omni-tts(2 月 14 日)

  • 核心参数:提供 0.5B 和 16.8B-A3B 两个版本,支持多通道音频生成;

  • 核心优势:精准控制语速、音调、情绪、方言(粤语控制准确率 93%),支持数学 / 化学表达式自然朗读;

  • 关键数据:月下载量 2995 次,Apache 2.0 许可证;

  • 适用场景:语音合成、智能配音、多模态内容音频化。

架构创新类模型:技术路线再升级

面壁 MiniCPM-SALA(2 月 12 日)

  • 核心参数:未公开具体参数,支持中英双语;

  • 核心优势:创新线性 - 稀疏注意力混合架构,需系统级协同与跨层编译优化释放潜力;

  • 关键数据:月下载量 5250 次,Apache 2.0 许可证;

  • 适用场景:高效注意力任务、低延迟推理、大规模并行计算。

二、2 月开源模型核心趋势

1. 内卷焦点:MoE 架构成主流

本月超 70% 的大参数模型采用 MoE(混合专家)架构,通过 “总参数大 + 激活参数小” 的模式,平衡推理能力与效率。千问、蚂蚁、阶跃等厂商均以 “激活参数 / 总参数” 比例作为核心卖点,凸显 “智能密度” 的重要性。

2. 场景分化:从 “通用” 到 “垂直专精”

  • 文本生成模型细分出 “编码专用”(Qwen3-Coder-Next)、“科学推理专用”(Intern-S1-Pro)、“端侧专用”(HY-1.8B-2Bit);

  • 多模态模型不再追求 “全而杂”,转而聚焦 “直播交互”(MiniCPM-o 4.5)、“科学计算”(Intern-S1-Pro)、“图像编辑”(FireRed-Image-Edit-1.0)等垂直场景。

3. 新玩家入局:跨界选手带来新视角

京东、BOSS 直聘等非传统 AI 厂商强势入局,模型设计更贴近业务场景:BOSS 直聘 Nanbeige4.1-3B 适配招聘场景,京东 JoyAI-LLM-Flash 侧重电商业务,为开源模型带来更多实用化创新。

4. 数据壁垒凸显:模型性能差距本质是数据差距

美团 LongCat-Flash-Lite 新增的 DeepResearch 功能,蚂蚁 Ling-2.5-1T 的 29T tokens 训练数据,均证明 “数据质量 + 规模” 成为模型性能的核心护城河,单纯堆参数的内卷已逐渐失效。

三、热门模型对比与选型建议

1. 高下载量模型 TOP5(月下载量)

表格

模型名称 月下载量 核心优势 适用人群
GLM-OCR 208.4 万次 轻量、多语言、复杂文档识别 开发者、企业数字化部门
Qwen3.5-397B-A17B 103 万次 原生多模态、视觉理解强 多模态开发者、企业 AI 团队
Qwen3-Coder-Next 81.9 万次 编码专用、IDE 适配好 程序员、技术团队
Nanbeige4.1-3B 33.8 万次 轻量化、推理强 中小企业、独立开发者
MiniMax M2.5 31.3 万次 Agent 能力突出、调用稳定 企业 Agent 开发、办公自动化

2. 选型决策树

  • 若需OCR 功能:优先选 GLM-OCR(轻量、高下载量);

  • 若需编码开发:Qwen3-Coder-Next(专业级)或 MiniMax M2.5(综合能力强);

  • 若需多模态交互:MiniCPM-o 4.5(直播场景)或 Qwen3.5-397B-A17B(通用场景);

  • 若需端侧部署:腾讯混元 HY-1.8B-2Bit(极致轻量化);

  • 若需科学推理:Intern-S1-Pro(AI4Science 专用);

  • 若需轻量化对话:Nanbeige4.1-3B(同尺寸性能登顶)。

四、下月展望:DeepSeek V4 能否终结内卷?

本月国内厂商的疯狂内卷,很大程度上源于 DeepSeek V4 即将发布的消息,但截至 2 月底,该模型仍未落地,被网友调侃 “虚晃一枪”。随着 3 月临近,DeepSeek V4 是否会如期而至?能否凭借硬实力打破当前的内卷格局?此外,字节 Seedance2.0 的开源传闻也引发热议,预计 3 月开源模型赛道将迎来更激烈的竞争。

对于开发者和企业而言,当前无需盲目追逐 “参数最大”,应根据实际场景选择适配的模型 —— 轻量化模型在成本与效率上的优势已逐渐凸显,而垂直场景专用模型的性价比远超通用大模型。

蚂蚁那个万亿参数模型有点东西

GLM-OCR这下载量真吓人

哇这市场也太卷了吧

这个月真是神仙打架啊 文本生成、多模态、OCR全赛道都卷疯了 参数从0.5B到1T跨度太夸张了 不过数据壁垒效应越来越明显 单纯堆参数确实有点乏力了

这么卷下去我们萌新都不知道该学哪个了

这个内卷程度确实有点吓人

蚂蚁这个可纠错编辑机制有点东西

这模型更新速度也太快了吧

哇这内卷也太狠了吧

这么多模型简直让人看花眼