炸场!Claude Opus 4.6 强势登场,华尔街、程序员、安全专家饭碗岌岌可危!

Anthropic 又放大招!新一代大模型Claude Opus 4.6横空出世,直接引发金融圈大地震 —— 金融数据服务商 FactSet 盘中暴跌 10%,S&P Global、穆迪、纳斯达克等巨头股价集体跳水,各大指数一片绿。

这已经是 Anthropic 本周第二次搅动市场。几天前,其自动化法律插件上线,就引发万亿美元软件股暴跌。如今 Opus 4.6 的到来,更是让投资者陷入恐慌:还有什么职业不会被 AI 颠覆?

过去,Claude 的标签是 **“编程王者”**;现在,Opus 4.6 彻底撕掉这个单一标签,在财务分析、办公协作、安全审计等领域全面开挂,堪称 “全能型卷王”。

核心升级:1M 上下文 + 自适应思考,性能碾压竞品

Opus 4.6 的两大颠覆性升级,直接将大模型能力推向新高度:

  1. 100 万 Token 超大上下文窗口(测试版)

    这是 Claude 首次在 Opus 级别模型中引入百万级上下文,彻底解决了长文本处理的 “上下文衰减” 难题。在 “大海捞针” 式的 MRCR v2 8-needle 1M 基准测试中,Opus 4.6 得分高达 76%,而前代 Sonnet 4.5 仅有 18.5%。

    配合上下文压缩功能,当对话接近上下文上限时,模型会自动摘要并替换旧内容,长对话和 Agent 任务再也不用频繁断档。不过要注意,超过 200k token 的提示词会触发溢价计费(输入 / 输出每百万 token 10 美元 / 37.5 美元)。

  2. 自适应思考 + 多档努力程度调节

    告别以往 “思考模式要么开要么关” 的僵硬设定,Opus 4.6 能自主判断任务难度,决定是否需要深度推理。开发者还能通过effort参数选择 low/medium/high/max 四档模式,默认 high 档,兼顾性能与成本。

    这一功能让模型在处理简单任务时 “速战速决”,遇到复杂问题时 “深思熟虑”,真正实现了 “该省省,该花花”。

性能跑分:全面碾压 GPT-5.2,多项评测登顶

在官方公布的成绩单上,Opus 4.6 堪称 “屠榜级” 存在:

  • 在评估金融、法律等高价值知识工作的GDPval-AA 测试中,以 1606 的 Elo 分数领先 GPT-5.2(1462 分)144 分,意味着在 70% 的场景下表现更优。

  • 在 Agent 编程权威评测Terminal-Bench 2.0中,以 65.4% 的得分拿下第一,力压 GPT-5.2 的 64.7%。

  • 在深度搜索评测BrowseComp中,以 84% 的成绩排名行业第一,精准定位长文档中分散的关键信息。

更惊喜的是,加量不加价!Opus 4.6 维持原有定价:每百万 token 输入 5 美元、输出 25 美元,堪称业界良心。

能力开挂:从编程到办公,全方位颠覆传统职业

1. 编程能力再进化,百万行代码库迁移效率翻倍

作为 Claude 的传统强项,Opus 4.6 的编程能力再次突破天花板:

  • 支持多语言编码,能像资深工程师一样处理跨语言软件工程问题;

  • 代码审查与调试精度大幅提升,可自主发现并修正错误;

  • 面对百万行级别的大型代码库迁移任务,耗时直接减半。

最震撼的是Agent Teams 协作能力——Anthropic 研究员让 16 个 Opus 4.6 实例并行协作,仅用两周时间、不到 2 万美元成本,就从零写出了一个 10 万行的 C 编译器。这个编译器不仅能在 x86、ARM、RISC-V 三大架构上编译 Linux 6.9 内核,甚至能流畅运行《毁灭战士》游戏。

2. 办公三件套杀手:Excel 一键整理 + PPT 完美复刻模板

Opus 4.6 直接杀入打工人的核心战场,把 Office 玩出了新花样:

  • Excel 智能处理:导入凌乱的非结构化数据,自动推断表格结构,完成多步骤复杂分析,公式、格式、关键指标计算一步到位,完全符合金融建模标准。

  • PPT 精准复刻:记住公司 PPT 的字体、布局、风格,生成的演示文稿毫无 AI 痕迹,堪比资深设计师熬夜之作。

在 Cowork 协作环境中,它还能一边跑财务分析,一边自动整理研究文档,真正实现 “一站式办公”。

3. 安全白帽 “失业预警”:挖出 500 + 零日漏洞

Opus 4.6 在网络安全领域的表现,连 Anthropic 自己都直呼意外。在沙箱测试中,研究人员仅给它配备 Python 和常规漏洞分析工具,没有任何额外指令,它就自主挖出了500 多个此前未知的高危零日漏洞,且个个都经过人工验证。

  • 在 GhostScript 中发现传统模糊测试和人工分析都没找到的崩溃漏洞;

  • 在 OpenSC 和 CGIF 中定位到缓冲区溢出漏洞,还主动编写 PoC 代码验证漏洞真实性。

不过 Anthropic 也提醒,这种能力存在被滥用风险,已新增六套网络安全探测机制,未来可能上线实时拦截系统。

行业震动:谁的饭碗最危险?

Opus 4.6 的横空出世,让多个高薪职业面临严峻挑战:

  • 华尔街金融分析师:财报分析、市场预测、数据建模全被 AI 包揽,效率远超人工;

  • 程序员 / 编译器工程师:多语言开发、代码审查、大型项目迁移,AI 又快又准;

  • 安全白帽黑客:漏洞挖掘能力媲美专业团队,成本却低得多;

  • 办公族 / PPT 设计师:Excel 数据整理、PPT 制作这些基础工作,AI 分分钟搞定。

写在最后:AI 内卷时代,人类如何破局?

目前,Claude Opus 4.6 已在官网、API 和主流云平台全面上线,调用时需指定模型标识Claude-opus-4-6

值得一提的是,Anthropic 正在践行 **“用 Claude 构建 Claude”** 的理念 —— 自家工程师每天用 Claude Code 写代码,每个新模型都先在内部工作流中测试优化。这种 “AI 造 AI” 的模式,正在加速大模型的迭代进化。

Opus 4.6 的出现,再次证明 AI 的能力边界正在不断拓宽。但这并不意味着人类会被取代,而是倒逼我们向更具创造性、更需要深度思考的工作转型。毕竟,AI 能处理 “任务”,但人类才能定义 “方向”。

在这场 AI 革命中,与其恐慌失业,不如学会与 AI 并肩作战 —— 把重复劳动交给 AI,把精力放在更有价值的创新上。

AI这么厉害以后工作可怎么办呀

Claude这波升级真狠

Claude又发大招了

这AI也太能折腾了

AI发展太快了 有点跟不上节奏

感觉AI越来越厉害了

这更新速度也太吓人了

百万级上下文确实解决了长文本衰减痛点,自适应思考机制的成本控制也很实用。金融数据服务商股价波动反映了市场对AI替代效应的过度敏感,但实际落地仍需时间验证。

AI又来抢饭碗了

Claude又进化了感觉各行各业都要被影响