Anthropic 又放大招!新一代大模型Claude Opus 4.6横空出世,直接引发金融圈大地震 —— 金融数据服务商 FactSet 盘中暴跌 10%,S&P Global、穆迪、纳斯达克等巨头股价集体跳水,各大指数一片绿。
这已经是 Anthropic 本周第二次搅动市场。几天前,其自动化法律插件上线,就引发万亿美元软件股暴跌。如今 Opus 4.6 的到来,更是让投资者陷入恐慌:还有什么职业不会被 AI 颠覆?
过去,Claude 的标签是 **“编程王者”**;现在,Opus 4.6 彻底撕掉这个单一标签,在财务分析、办公协作、安全审计等领域全面开挂,堪称 “全能型卷王”。
核心升级:1M 上下文 + 自适应思考,性能碾压竞品
Opus 4.6 的两大颠覆性升级,直接将大模型能力推向新高度:
-
100 万 Token 超大上下文窗口(测试版)
这是 Claude 首次在 Opus 级别模型中引入百万级上下文,彻底解决了长文本处理的 “上下文衰减” 难题。在 “大海捞针” 式的 MRCR v2 8-needle 1M 基准测试中,Opus 4.6 得分高达 76%,而前代 Sonnet 4.5 仅有 18.5%。
配合上下文压缩功能,当对话接近上下文上限时,模型会自动摘要并替换旧内容,长对话和 Agent 任务再也不用频繁断档。不过要注意,超过 200k token 的提示词会触发溢价计费(输入 / 输出每百万 token 10 美元 / 37.5 美元)。
-
自适应思考 + 多档努力程度调节
告别以往 “思考模式要么开要么关” 的僵硬设定,Opus 4.6 能自主判断任务难度,决定是否需要深度推理。开发者还能通过
effort参数选择 low/medium/high/max 四档模式,默认 high 档,兼顾性能与成本。这一功能让模型在处理简单任务时 “速战速决”,遇到复杂问题时 “深思熟虑”,真正实现了 “该省省,该花花”。
性能跑分:全面碾压 GPT-5.2,多项评测登顶
在官方公布的成绩单上,Opus 4.6 堪称 “屠榜级” 存在:
-
在评估金融、法律等高价值知识工作的GDPval-AA 测试中,以 1606 的 Elo 分数领先 GPT-5.2(1462 分)144 分,意味着在 70% 的场景下表现更优。
-
在 Agent 编程权威评测Terminal-Bench 2.0中,以 65.4% 的得分拿下第一,力压 GPT-5.2 的 64.7%。
-
在深度搜索评测BrowseComp中,以 84% 的成绩排名行业第一,精准定位长文档中分散的关键信息。
更惊喜的是,加量不加价!Opus 4.6 维持原有定价:每百万 token 输入 5 美元、输出 25 美元,堪称业界良心。
能力开挂:从编程到办公,全方位颠覆传统职业
1. 编程能力再进化,百万行代码库迁移效率翻倍
作为 Claude 的传统强项,Opus 4.6 的编程能力再次突破天花板:
-
支持多语言编码,能像资深工程师一样处理跨语言软件工程问题;
-
代码审查与调试精度大幅提升,可自主发现并修正错误;
-
面对百万行级别的大型代码库迁移任务,耗时直接减半。
最震撼的是Agent Teams 协作能力——Anthropic 研究员让 16 个 Opus 4.6 实例并行协作,仅用两周时间、不到 2 万美元成本,就从零写出了一个 10 万行的 C 编译器。这个编译器不仅能在 x86、ARM、RISC-V 三大架构上编译 Linux 6.9 内核,甚至能流畅运行《毁灭战士》游戏。
2. 办公三件套杀手:Excel 一键整理 + PPT 完美复刻模板
Opus 4.6 直接杀入打工人的核心战场,把 Office 玩出了新花样:
-
Excel 智能处理:导入凌乱的非结构化数据,自动推断表格结构,完成多步骤复杂分析,公式、格式、关键指标计算一步到位,完全符合金融建模标准。
-
PPT 精准复刻:记住公司 PPT 的字体、布局、风格,生成的演示文稿毫无 AI 痕迹,堪比资深设计师熬夜之作。
在 Cowork 协作环境中,它还能一边跑财务分析,一边自动整理研究文档,真正实现 “一站式办公”。
3. 安全白帽 “失业预警”:挖出 500 + 零日漏洞
Opus 4.6 在网络安全领域的表现,连 Anthropic 自己都直呼意外。在沙箱测试中,研究人员仅给它配备 Python 和常规漏洞分析工具,没有任何额外指令,它就自主挖出了500 多个此前未知的高危零日漏洞,且个个都经过人工验证。
-
在 GhostScript 中发现传统模糊测试和人工分析都没找到的崩溃漏洞;
-
在 OpenSC 和 CGIF 中定位到缓冲区溢出漏洞,还主动编写 PoC 代码验证漏洞真实性。
不过 Anthropic 也提醒,这种能力存在被滥用风险,已新增六套网络安全探测机制,未来可能上线实时拦截系统。
行业震动:谁的饭碗最危险?
Opus 4.6 的横空出世,让多个高薪职业面临严峻挑战:
-
华尔街金融分析师:财报分析、市场预测、数据建模全被 AI 包揽,效率远超人工;
-
程序员 / 编译器工程师:多语言开发、代码审查、大型项目迁移,AI 又快又准;
-
安全白帽黑客:漏洞挖掘能力媲美专业团队,成本却低得多;
-
办公族 / PPT 设计师:Excel 数据整理、PPT 制作这些基础工作,AI 分分钟搞定。
写在最后:AI 内卷时代,人类如何破局?
目前,Claude Opus 4.6 已在官网、API 和主流云平台全面上线,调用时需指定模型标识Claude-opus-4-6。
值得一提的是,Anthropic 正在践行 **“用 Claude 构建 Claude”** 的理念 —— 自家工程师每天用 Claude Code 写代码,每个新模型都先在内部工作流中测试优化。这种 “AI 造 AI” 的模式,正在加速大模型的迭代进化。
Opus 4.6 的出现,再次证明 AI 的能力边界正在不断拓宽。但这并不意味着人类会被取代,而是倒逼我们向更具创造性、更需要深度思考的工作转型。毕竟,AI 能处理 “任务”,但人类才能定义 “方向”。
在这场 AI 革命中,与其恐慌失业,不如学会与 AI 并肩作战 —— 把重复劳动交给 AI,把精力放在更有价值的创新上。



