哇,重磅炸弹!1月26日,阿里通义千问正式发布旗舰推理模型Qwen3-Max-Thinking,直接刷新多项全球权威评测纪录,性能直逼GPT-5.2和Gemini 3 Pro,成为国产AI大模型中最接近国际顶尖水平的王者!
一句话核心:Qwen3-Max-Thinking以超万亿(1T)参数+36T Tokens预训练数据为基础,通过极致规模扩展+创新测试时扩展机制,实现推理能力飞跃,碾压多项基准,成为迄今最强千问模型。
亮点炸裂:
- 推理革命:独创“测试时扩展”(Test-time Scaling)机制,不再简单重复冗余路径,而是从先前推理中“提取经验”、多轮自我迭代,在相同算力下获得更高效、更智能的结果。在启用工具的终极测试HLE中,得分58.3,远超GPT-5.2的45.5和Gemini 3 Pro的45.8,斩获全球最高分!
- Agent时代王牌:原生增强自主工具调用能力,经过规则+模型奖励的联合强化学习,智能结合搜索、个性化记忆、代码解释器等工具,像专业人士一样思考解答,响应更精准、更流畅,幻觉大幅降低,完美应对复杂真实任务。
科学、数学、编程全线霸榜:在事实知识、复杂推理、指令遵循等多维度大幅领先,刷新全球纪录。
立即体验:
- 普通用户:免费上QwenChat、千问PC端/网页端试用,App即将接入!
- 开发者/企业:阿里云百炼平台获取API服务。
阿里这一波,直接把国产大模型推向新高度,Agent时代加速到来——你准备好迎接这位“思考王者”了吗?

