一行代码，Claude成本直降85%！最强Opus做大脑，Sonnet疯狂搬砖

2026-04-10 发布浏览345次点赞0次收藏0次

【导读】Anthropic深夜发布Claude「顾问策略」，让Opus 4.6退居幕后当军师，Sonnet/Haiku当苦力。实测性能翻倍，成本暴降85%，全网直呼：这就是我们要的「龙虾」完全体！

深夜，Anthropic官宣重磅更新：Claude「顾问策略」（Advisor Strategy）上线。

这一架构的核心逻辑是——

让智商最高的Opus 4.6退居幕后当「顾问」；

让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。

简单来说，Opus做「大脑」，Sonnet/Haiku做「手脚」。

在全新的工作流中，核心是由Sonnet/Haiku，全权负责跑通整个流程。

当遇到真正棘手的难题、无法做出合理决策时，才会通过API调用Opus「顾问」来指点迷津。

随后，Opus会迅速审阅上下文，给出一个锦囊妙计、修正方案，然后由执行者继续完成剩下的「苦差事」。

这一策略的提出，真正反转了传统的「大模型拆解任务、小模型搬砖」模式。

结果，实测数据极其震撼。

在SWE-bench编程测试中，「Sonnet 4.6+Opus 4.6」得分提升2.7个百分点，而成本暴降11.9%！

更离谱的是，「Haiku4.5+Opus 4.6」性能直接翻倍，成本（$1.07）只有Sonnet（$7）的一小部分。

用网友的话来说，「享受Opus的性能，却无需支付Opus的钱」。

还有人全网奔走相告，Claude「龙虾」超进化了，一个更好的OpenClaw版本诞生。

可以说，这不只是一次API更新，更是一场彻底的效率革命。

Claude有了「顾问」

最强Opus 4.6幕后指路

一直以来，开发者在构建AI Agent的过程中，往往面临一个两难选择：

用顶级模型虽聪明，但价格昂贵；
用轻量模型虽便宜，但处理复杂任务时容易「掉链子」。

传统模式的做法是，让性能最强的LLM坐镇中央当「编排者」，把大任务拆解成若干子任务，再分发给更小、更快的模型去执行。

这就好比一个项目经理（大模型）在开会，给底下的组员（小模型）分发不同的工单。

它的局限在于，无论任务简单还是复杂，顶级模型都必须首先介入拆解。每一条请求的开头，都要烧掉最贵的Token。

Anthropic这次玩了个「反直觉」的战术，彻底反转了「大管小」的逻辑。

「顾问策略」采用了一种更加灵活的向上追溯机制：

执行者：由Sonnet 4.6或Haiku 4.5担任，负责端到端的任务执行、调用工具、读取结果并持续迭代；
顾问：由顶级模型Opus 4.6担任，潜伏在幕后，并不直接与人对话，也不调用工具。

只有当「执行者」遇到无法独立决策的难题时，它才会主动向「顾问」请教。

Opus会读取共享的上下文，给出计划、纠正方案或停止信号，随后「执行者」再带着这些「应急妙策」继续工作。

这种策略，将前沿级的推理能力精准地用在了「刀刃」上。

在SWE-bench测试中，「Sonnet+Opus顾问」提升了2.7个百分点，还将单次Agent任务的成本压缩了11.9%。

在智能体基准测试中：

智能体搜索任务（BrowseComp），性能涨2.3%，成本6.13美元。
终端编码任务（Terminal-Bench 2.0），性能涨3.8%，成本0.88美元。

对于预算更敏感的场景，「Haiku 4.5+Opus 4.6顾问」的组合表现更是令人惊艳。

在BrowseComp测试中，其得分从19.7%飙升至41.2%，性能翻倍。

虽然这比Sonnet单独运行的得分低29%，但其成本却降低了85%，是处理高并发任务的极佳方案。

在Terminal-Bench 2.0中，性能暴涨13.3%，成本也降低了0.2美元。

对于那些既需要一定智能水平、又需要控制成本的大规模批量任务来说，Haiku绝对是个绝佳的选择。

官博中，Anthropic说的非常直白——

这能让AI Agent拥有接Opus级别的智能，同时让token开销保持在接近Sonnet的水平。

不得不说，简直太香了！

一行代码，即可调用

那么，究竟如何上手？

目前，Claude平台上已上线了「测试版」。

只需在API调用中改写「一行代码」，便能用上「顾问策略」，具体来说：

在Messages API请求中声明advisor_20260301，模型的交接就会在单次/v1/messages请求的内部静默完成——不需要额外去回传数据或管理上下文。

「执行者」模型会自己决定什么时候摇人。

当它发起调用时，会把整理好的上下文路由给「顾问」模型，拿到计划后返回，「执行者」接着干活，所有操作都在同一个请求里一气呵成。

# 顾问消耗的Token会在用量（usage）中单独列出。

那么，token消耗的这笔账如何算？

「顾问」消耗的Token按Opus定价，执行者消耗的Token按Sonnet或Haiku定价。

关键在于，顾问每次出手只生成一份简短的计划，通常在400到700个Token左右。

而真正的大头输出，全部由执行者以更低的费率包揽。

整体算下来，成本远低于从头到尾只用Opus。

担心顾问被「薅」太多次？Anthropic也想到了。

开发者可以通过设置max_uses，限制单次请求中顾问的最大调用次数。

同时，顾问的Token消耗会在用量信息中单独列出，方便追踪每一层模型的开销。

而且，advisor工具跟你现有的工具栈完全兼容。

它就是Messages API请求里的一个普通条目，没有任何特殊架构要求。

你的Agent可以在同一个循环里，一边搜索网页、执行代码，一边向Opus请教。

该搬砖搬砖，该问策问策，互不干扰。

一些用上「顾问策略」的大客户全都被瞬间惊艳了，EVE机器学习工程师直言——

用上Haiku 4.5+Opus 4.6，成本降低了1/5，还用上了接近Opus级别的智能。

Agent不用一直转了

后台脚本守着就行

同在今天，Anthropic为Claude带来了名为——Monitor的重量级工具更新。

这一功能，直接让Claude创建并运行「后台脚本」。

过去，让Agent监控某个任务（比如等CI跑完、等PR审批），它必须不停循环询问，每问一次就烧一轮Token。

Monitor让Claude自己写一段后台监控代码。程序报错了，唤醒。代码合规检查通过了，唤醒。

从「主动轮询」变成「事件驱动」。

有了Monitor，Claude可以做到两件事。

持续盯着系统日志中的错误，有问题了才叫Agent过来处理。
自动追踪GitHub上的PR状态，脚本在后台轮询，Agent本身不消耗Token。

具体用的时候，需在提示词中明确要求，如Anthropic研究员给出的例子所示。

和Advisor Strategy的逻辑一脉相承，都是在Agent运行中找到「不需要烧钱的环节」，然后把它剥离出去。

一个省模型调用的钱，一个省空转循环的钱。

但顾问策略和Monitor不是孤立的两招。

再加上此前刚发布的Managed Agents，Agent的运维和基建全由Anthropic包办，0.08美元一小时。

这几步棋放在一起看，方向就明了了。

Anthropic不再只是一家卖模型API的公司。它在搭一整套Agent运行时平台，从模型调度到任务执行到云端托管，全栈通吃。

你不需要自己养Agent了

Advisor Strategy和Monitor优化的是Agent的「跑法」，Managed Agents解决的是更根本的问题，谁来管基建。

0.08美元一个session小时，沙箱隔离、断线自动恢复、会话可自主跑数小时，Anthropic全包了。

Managed Agents管运行，MCP Connectors管工具接入。

Anthropic的Connectors Directory覆盖Asana、Notion、Sentry等工具，标准OAuth一键接入。

另一边，4月4日封杀了OpenClaw通过Claude订阅额度调API的通道，用户要么换后端，要么按量付费，成本翻倍。

推自家生态，切竞品供给，一套组合拳。

HN上有人总结，「核心不是封杀谁，是让开发者习惯在Anthropic的平台上跑Agent。」

从卖模型到卖运行时

Advisor Strategy管调度，Monitor管效率，Managed Agents管基建，MCP Connectors管生态。四层叠起来，一个完整的Agent平台。

Anthropic不是在卖聊天机器人，是在卖「你只管说要做什么，剩下的我来」。

而且野心可能不止于软件。据Reuters本周报道，Anthropic正在探索自研AI芯片，目前仍处于早期阶段。

支撑这个野心的数字，年化营收突破300亿美元，去年底还是90亿。企业级AI收入对OpenAI的份额已经追到50:50。

这盘棋能不能赢，取决于开发者愿不愿意把Agent逻辑交给Anthropic的平台。

Sentry、Notion、Rakuten已经投了票。

彩蛋

Claude到底有多大？这是AI圈最想拆解的黑盒。

马斯克在对比自家Grok 4.2与Claude时，漫不经心地透露了一个数字——

Claude Sonnet参数量约为1T，Opus高达5T。

对此，有大佬猜测，Claude Mythos体量至少是10T，甚至更大级别。

参考资料：

https://x.com/claudeai/status/2042308622181339453?s=20

https://x.com/noahzweben/status/2042332268450963774?s=20

OpenAI 测试大模型 AI 马斯克改写 OpenClaw 芯片性能 Claude

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

一行代码，Claude成本直降85%！最强Opus做大脑，Sonnet疯狂搬砖

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。