Claude 5史诗级泄露，史上最强编程模型评测炸裂！核心秘密曝光

2026-02-03 发布浏览468次点赞0次收藏0次

【导读】Anthropic的新模型要来了！代号Fennec的Claude Sonnet 5马上要发布，性能吊打市面上所有编程大模型，价格还砍掉50%，还能比肩一整个人类开发团队，可以说达到编程领域的巅峰。

Claude Sonnet 5，马上就要发布了！

多条信息显示，Claude Sonnet 5（代号Fennec）已经存在于谷歌基础设施中，在性能上领先谷歌的「Snow Bunny」整整一代。

它有100万token上下文窗口，定价比Opus 4.5便宜50%，将直接解决开发者对Opus「太慢、太贵」的核心不满。

而且，这次不是简单的模型升级，而是Anthropic直接把一个开发团队塞进了模型里。

在SWE-Bench上，它的成绩超过80.9%，远超当前目前市面上所有的编程大模型！

可以说，这个更便宜、更快、更强代码能力和多智能体开发模式的智能体，是Claude Code的关键解锁时刻。

开端：一条「404错误日志」

事情的开端是这样的。

2月2日，有开发者在Google Vertex AI调用API时，发现了一个神秘模型ID。

claude-sonnet-5@20260203

它的访问结果，是404 Not Found。

懂的都懂，这就说明，模型现在已经在谷歌的基础设施中部署，只是还没给你用。

随后，知名AI博主Pankaj Kumar直接下场确认—— Claude Sonnet 5的代号是Fennec，已经在Google基础设施中了。

而发布时间，很可能就是2026年2月3日，最快明后天就会发布。

AI编程大战，已经是箭在弦上，一触即发！

并且，现在已经有早期评测泄露出来。

测试者发现，在处理结构化视觉生成任务时，Sonnet 5展现出了极强的性能，仅仅凭借「ASCII世界地图」的提示词，它就生成了测试者见过的最完整、最详细的结果！

Sonnet 5生成网站

此外，在UI渲染和复杂代码构建方面，Sonnet 5也表现得游刃有余。

Sonnet 5玩游戏

Sonnet 5，性能越级吊打Opus 4.5

泄露信息显示，在多个内部基准测试中，Claude Sonnet 5的整体性能已经超越了Claude Opus 4.5。

然而，它的定位却是Sonnet，而非Opus。也就是说，Anthropic在用中端的模型，干着旗舰的活。

而Sonnet 5的编程能力也是一如既往的强。

内部测试数据显示，Claude Sonnet 5在SWE-Bench上的得分已经超过了80.9%。

此前的SWE-Bench，最高分为74.4%

因此，它能独立完成大部分软件工程师日常会遇到的问题，比如修bug、重构、补测试、跑CI、找回归问题等等。

一句话，Claude Sonnet 5不只是在写代码，还是在交付代码！

同时，最让友商失眠的部分来了——它的推理成本显著下降，价格仅为Claude Opus 4.5的50%！

原因很简单：Sonnet 5，是直接在谷歌TPU上训练和优化的。别人还为H100抢破头的时候，Anthropic早已另辟蹊径。

除了价格上的优势上，Sonnet 5的上下文还长达100万tokens，而且运行速度还有提升，还有更低的延迟。

从此，我们可以把整个项目代码库塞进去，它不是简单的「看文件」，而是理解全局再动手。

对于大项目、遗留系统、屎山代码来说，这简直是一项救命功能。

自动开发团队模型，上线！

真正恐怖的部分来了，Claude还进化出一种「自动开发团队」模型。

这种全新形态，被称为Dev Team。

在Dev Team模式下，Sonnet 5能自动生成多个子智能体，然后并行协作完成开发。

只要给一句需求，多个子智能体会同时并行工作、互相校验。

最终输出的不是一段代码，而是一个完整可用、可测试、可迭代的功能模块。

可以说，这已经不是Copilot，而是一整个不请假的开发团队！

爆料：Claude Code「蜂群」模式来了

其实在前几天，就有关于Claude Code蜂群模式（Agent Swarm）的爆料。

可以猜测，这个蜂群模型跟传说中要上线的Dev Team有着极其密切的关系。

爆料的关键人叫Mike Kelly，他在X上爆了个猛料：Claude Code里，藏着一个尚未公开的 Swarm功能。

视频如下。

而且，他还放出了一个Fork项目——Claude Sneak Peek，供大家试用。

所谓Swarms，就是一个「总指挥」AI，加上一群随叫随到、即用即走的专业子智能体，构成一整套协作系统。这套模式如下——

Hierarchical（层级式）：总指挥 → 组长 → 执行者

Dependency（依赖式）：任务 A完成，才能启动任务B

Broadcast（广播式）：一个信息，所有子agent同步接收

Messaging System（消息系统）：agent之间可以互相通信

这样，所有AI就像公司一样运作了。

其实，早在去年7月，Anthropic就推出了Custom Sub Agents。然而它们有很多致命缺陷，比如记忆是碎片化的，要靠人手动补丁，而且创建子Agent也是全靠人。

然而这次的「蜂群」就不一样了！

一位开发者的实测任务开始：让AI为工具创建一个Web前端，允许你在终端中从X上下载视频。

让Claude 读取一个plan.md，要求它拆分任务，用Swarm的方式执行。

惊人的一幕来了：一开始，没有任何自定义子agent。

执行任务后，奇迹发生了！Claude自动创建了Team Leader、Front-end Builder、Backend Builder、Component Builder和QA Tester。

这些Agent全部在并行工作，状态实时可见。甚至，你可以进入任意Agent，查看它的system prompt，来看看它们脑子里正在想什么。

最夸张的地方是，Agent还会「自己生孩子」。任务进行到一半，Claude发现还不够，于是又生成了PI Server Agent、前端构建Agent、CSS专项Agent、API集成Agent等等。

Agent数量直接膨胀到8个，而且全程无人干预！可以说，这已经不是多智能体，而是AI在自我组织。

任务结束后，Claude还输出了项目总结和执行报告的两份文件，这已经是工程管理级别的产出了。

不过，为什么如此强大的蜂群功能还没开放呢？原因在于，这个能读取你全部上下文的超级调度器，功能太危险，不能轻易放出来。

可以想象的是，如果Swarm真正开放，Claude Code将不再仅仅是写代码的AI，而是能自己组建研发团队的系统。

这，将是一个彻底的范式升级。

时间点的杀意：正面硬刚OpenAI

就在这几天，OpenAI的同期动作一直很猛。奥特曼已经预告了接下来是Codex全家桶的发布月。

Anthropic选择这个时间点发布Sonnet 5，用意很明显：来，正面硬刚！

而之所以能有这个底气，答案就是一个字——钱。

在2026年1月底，Anthropic已经完成了超过100亿美元的融资，估值达3500亿美元，而最终的融资规模可能达到200亿。

根据Menlo Ventures在2025 Q4的报道，Anthropic的企业市场占有率已经占到了40%，远远领先于OpenAI的27%和谷歌的21%。

而且仅仅半年，Claude Code的年化收入就破了10亿美元。

最近，Anthropic已经凭Cowork直接引爆了一连串编程奇点，甚至孵化了Clawdbot和Molbook这样新物种的诞生。

如果这次泄露属实，那么Claude Sonnet 5（Fennec）将成为第一个真正意义上「能像团队一样工作的模型」。

2026年2月3日，很可能会被记为软件工程的分水岭之一。

参考资料：

https://x.com/RichOBray/status/2018351965323850149

https://x.com/pankajkumar_dev/status/1753448405523136512

性能谷歌 OpenAI 测试 4 Claude AI 试用 Go 大模型 Google

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

Claude 5史诗级泄露，史上最强编程模型评测炸裂！核心秘密曝光

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。