一行代码,Claude成本直降85%!最强Opus做大脑,Sonnet疯狂搬砖

浏览21次 点赞0次 收藏0次

【导读】Anthropic深夜发布Claude「顾问策略」,让Opus 4.6退居幕后当军师,Sonnet/Haiku当苦力。实测性能翻倍,成本暴降85%,全网直呼:这就是我们要的「龙虾」完全体!

深夜,Anthropic官宣重磅更新:Claude「顾问策略」(Advisor Strategy)上线

这一架构的核心逻辑是——

让智商最高的Opus 4.6退居幕后当「顾问」;

让性价比极高的Sonnet 4.6或Haiku 4.5冲在前面当「执行者」。


简单来说,Opus做「大脑」,Sonnet/Haiku做「手脚」

在全新的工作流中,核心是由Sonnet/Haiku,全权负责跑通整个流程。


当遇到真正棘手的难题、无法做出合理决策时,才会通过API调用Opus「顾问」来指点迷津。

随后,Opus会迅速审阅上下文,给出一个锦囊妙计、修正方案,然后由执行者继续完成剩下的「苦差事」。

这一策略的提出,真正反转了传统的「大模型拆解任务、小模型搬砖」模式。


结果,实测数据极其震撼。

在SWE-bench编程测试中,「Sonnet 4.6+Opus 4.6」得分提升2.7个百分点,而成本暴降11.9%

更离谱的是,「Haiku4.5+Opus 4.6」性能直接翻倍,成本($1.07)只有Sonnet($7)的一小部分。

用网友的话来说,「享受Opus的性能,却无需支付Opus的钱」




还有人全网奔走相告,Claude「龙虾」超进化了,一个更好的OpenClaw版本诞生。



可以说,这不只是一次API更新,更是一场彻底的效率革命。

Claude有了「顾问」

最强Opus 4.6幕后指路

一直以来,开发者在构建AI Agent的过程中,往往面临一个两难选择:

  • 用顶级模型虽聪明,但价格昂贵;

  • 用轻量模型虽便宜,但处理复杂任务时容易「掉链子」。

传统模式的做法是,让性能最强的LLM坐镇中央当「编排者」,把大任务拆解成若干子任务,再分发给更小、更快的模型去执行。


这就好比一个项目经理(大模型)在开会,给底下的组员(小模型)分发不同的工单。

它的局限在于,无论任务简单还是复杂,顶级模型都必须首先介入拆解。每一条请求的开头,都要烧掉最贵的Token。

Anthropic这次玩了个「反直觉」的战术,彻底反转了「大管小」的逻辑。


「顾问策略」采用了一种更加灵活的向上追溯机制:

  • 执行者: 由Sonnet 4.6或Haiku 4.5担任,负责端到端的任务执行、调用工具、读取结果并持续迭代;

  • 顾问: 由顶级模型Opus 4.6担任,潜伏在幕后,并不直接与人对话,也不调用工具。

只有当「执行者」遇到无法独立决策的难题时,它才会主动向「顾问」请教。

Opus会读取共享的上下文,给出计划、纠正方案或停止信号,随后「执行者」再带着这些「应急妙策」继续工作。


这种策略,将前沿级的推理能力精准地用在了「刀刃」上。

在SWE-bench测试中,「Sonnet+Opus顾问」提升了2.7个百分点,还将单次Agent任务的成本压缩了11.9%。


在智能体基准测试中:

  • 智能体搜索任务(BrowseComp),性能涨2.3%,成本6.13美元。

  • 终端编码任务(Terminal-Bench 2.0),性能涨3.8%,成本0.88美元。


对于预算更敏感的场景,「Haiku 4.5+Opus 4.6顾问」的组合表现更是令人惊艳。

在BrowseComp测试中,其得分从19.7%飙升至41.2%,性能翻倍。

虽然这比Sonnet单独运行的得分低29%,但其成本却降低了85%,是处理高并发任务的极佳方案。

在Terminal-Bench 2.0中,性能暴涨13.3%,成本也降低了0.2美元。


对于那些既需要一定智能水平、又需要控制成本的大规模批量任务来说,Haiku绝对是个绝佳的选择。

官博中,Anthropic说的非常直白——

这能让AI Agent拥有接Opus级别的智能,同时让token开销保持在接近Sonnet的水平。

不得不说,简直太香了!


一行代码,即可调用

那么,究竟如何上手?


目前,Claude平台上已上线了「测试版」。

只需在API调用中改写「一行代码」,便能用上「顾问策略」,具体来说:

在Messages API请求中声明advisor_20260301,模型的交接就会在单次/v1/messages请求的内部静默完成——不需要额外去回传数据或管理上下文。

「执行者」模型会自己决定什么时候摇人。

当它发起调用时,会把整理好的上下文路由给「顾问」模型,拿到计划后返回,「执行者」接着干活,所有操作都在同一个请求里一气呵成。

# 顾问消耗的Token会在用量(usage)中单独列出。

那么,token消耗的这笔账如何算?

「顾问」消耗的Token按Opus定价,执行者消耗的Token按Sonnet或Haiku定价。

关键在于,顾问每次出手只生成一份简短的计划,通常在400到700个Token左右。

而真正的大头输出,全部由执行者以更低的费率包揽。

整体算下来,成本远低于从头到尾只用Opus。


担心顾问被「薅」太多次?Anthropic也想到了。

开发者可以通过设置max_uses,限制单次请求中顾问的最大调用次数。

同时,顾问的Token消耗会在用量信息中单独列出,方便追踪每一层模型的开销。

而且,advisor工具跟你现有的工具栈完全兼容。

它就是Messages API请求里的一个普通条目,没有任何特殊架构要求。


你的Agent可以在同一个循环里,一边搜索网页、执行代码,一边向Opus请教。

该搬砖搬砖,该问策问策,互不干扰。

一些用上「顾问策略」的大客户全都被瞬间惊艳了,EVE机器学习工程师直言——

用上Haiku 4.5+Opus 4.6,成本降低了1/5,还用上了接近Opus级别的智能。


Agent不用一直转了

后台脚本守着就行

同在今天,Anthropic为Claude带来了名为——Monitor的重量级工具更新。

这一功能,直接让Claude创建并运行「后台脚本」。


过去,让Agent监控某个任务(比如等CI跑完、等PR审批),它必须不停循环询问,每问一次就烧一轮Token。

Monitor让Claude自己写一段后台监控代码。程序报错了,唤醒。代码合规检查通过了,唤醒。

从「主动轮询」变成「事件驱动」。


有了Monitor,Claude可以做到两件事。

  • 持续盯着系统日志中的错误,有问题了才叫Agent过来处理。

  • 自动追踪GitHub上的PR状态,脚本在后台轮询,Agent本身不消耗Token。

具体用的时候,需在提示词中明确要求,如Anthropic研究员给出的例子所示。


和Advisor Strategy的逻辑一脉相承,都是在Agent运行中找到「不需要烧钱的环节」,然后把它剥离出去。

一个省模型调用的钱,一个省空转循环的钱。

但顾问策略和Monitor不是孤立的两招。

再加上此前刚发布的Managed Agents,Agent的运维和基建全由Anthropic包办,0.08美元一小时。

这几步棋放在一起看,方向就明了了。

Anthropic不再只是一家卖模型API的公司。它在搭一整套Agent运行时平台,从模型调度到任务执行到云端托管,全栈通吃。

你不需要自己养Agent了

Advisor Strategy和Monitor优化的是Agent的「跑法」,Managed Agents解决的是更根本的问题,谁来管基建。

0.08美元一个session小时,沙箱隔离、断线自动恢复、会话可自主跑数小时,Anthropic全包了。

Managed Agents管运行,MCP Connectors管工具接入。

Anthropic的Connectors Directory覆盖Asana、Notion、Sentry等工具,标准OAuth一键接入。

另一边,4月4日封杀了OpenClaw通过Claude订阅额度调API的通道,用户要么换后端,要么按量付费,成本翻倍。

推自家生态,切竞品供给,一套组合拳。

HN上有人总结,「核心不是封杀谁,是让开发者习惯在Anthropic的平台上跑Agent。」

从卖模型到卖运行时

Advisor Strategy管调度,Monitor管效率,Managed Agents管基建,MCP Connectors管生态。四层叠起来,一个完整的Agent平台。

Anthropic不是在卖聊天机器人,是在卖「你只管说要做什么,剩下的我来」。

而且野心可能不止于软件。据Reuters本周报道,Anthropic正在探索自研AI芯片,目前仍处于早期阶段。

支撑这个野心的数字,年化营收突破300亿美元,去年底还是90亿。企业级AI收入对OpenAI的份额已经追到50:50。

这盘棋能不能赢,取决于开发者愿不愿意把Agent逻辑交给Anthropic的平台。

Sentry、Notion、Rakuten已经投了票。



彩蛋

Claude到底有多大?这是AI圈最想拆解的黑盒。

马斯克在对比自家Grok 4.2与Claude时,漫不经心地透露了一个数字——

Claude Sonnet参数量约为1T,Opus高达5T。

对此,有大佬猜测,Claude Mythos体量至少是10T,甚至更大级别。



参考资料:

https://x.com/claudeai/status/2042308622181339453?s=20

https://x.com/noahzweben/status/2042332268450963774?s=20

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。