网易首页 > 网易号 > 正文 申请入驻

Claude 5史诗级泄露,史上最强编程模型评测炸裂!核心秘密曝光

0
分享至


新智元报道

编辑:Aeneas

【新智元导读】Anthropic的新模型要来了!代号Fennec的Claude Sonnet 5马上要发布,性能吊打市面上所有编程大模型,价格还砍掉50%,还能比肩一整个人类开发团队,可以说达到编程领域的巅峰。

Claude Sonnet 5,马上就要发布了!

多条信息显示,Claude Sonnet 5(代号Fennec)已经存在于谷歌基础设施中,在性能上领先谷歌的「Snow Bunny」整整一代。


它有100万token上下文窗口,定价比Opus 4.5便宜50%,将直接解决开发者对Opus「太慢、太贵」的核心不满。

而且,这次不是简单的模型升级,而是Anthropic直接把一个开发团队塞进了模型里。

在SWE-Bench上,它的成绩超过80.9%,远超当前目前市面上所有的编程大模型!

可以说,这个更便宜、更快、更强代码能力和多智能体开发模式的智能体,是Claude Code的关键解锁时刻。


开端:一条「404错误日志」

事情的开端是这样的。

2月2日,有开发者在Google Vertex AI调用API时,发现了一个神秘模型ID。

claude-sonnet-5@20260203

它的访问结果,是404 Not Found。

懂的都懂,这就说明,模型现在已经在谷歌的基础设施中部署,只是还没给你用。

随后,知名AI博主Pankaj Kumar直接下场确认—— Claude Sonnet 5的代号是Fennec,已经在Google基础设施中了。

而发布时间,很可能就是2026年2月3日,最快明后天就会发布。

AI编程大战,已经是箭在弦上,一触即发!


并且,现在已经有早期评测泄露出来。

测试者发现,在处理结构化视觉生成任务时,Sonnet 5展现出了极强的性能,仅仅凭借「ASCII世界地图」的提示词,它就生成了测试者见过的最完整、最详细的结果!


Sonnet 5生成网站

此外,在UI渲染和复杂代码构建方面,Sonnet 5也表现得游刃有余。


Sonnet 5玩游戏

Sonnet 5,性能越级吊打Opus 4.5

泄露信息显示,在多个内部基准测试中,Claude Sonnet 5的整体性能已经超越了Claude Opus 4.5。

然而,它的定位却是Sonnet,而非Opus。也就是说,Anthropic在用中端的模型,干着旗舰的活。

而Sonnet 5的编程能力也是一如既往的强。

内部测试数据显示,Claude Sonnet 5在SWE-Bench上的得分已经超过了80.9%。


此前的SWE-Bench,最高分为74.4%

因此,它能独立完成大部分软件工程师日常会遇到的问题,比如修bug、重构、补测试、跑CI、找回归问题等等。

一句话,Claude Sonnet 5不只是在写代码,还是在交付代码!

同时,最让友商失眠的部分来了——它的推理成本显著下降,价格仅为Claude Opus 4.5的50%!

原因很简单:Sonnet 5,是直接在谷歌TPU上训练和优化的。别人还为H100抢破头的时候,Anthropic早已另辟蹊径。

除了价格上的优势上,Sonnet 5的上下文还长达100万tokens,而且运行速度还有提升,还有更低的延迟。

从此,我们可以把整个项目代码库塞进去,它不是简单的「看文件」,而是理解全局再动手。

对于大项目、遗留系统、屎山代码来说,这简直是一项救命功能。

自动开发团队模型,上线!

真正恐怖的部分来了,Claude还进化出一种「自动开发团队」模型。

这种全新形态,被称为Dev Team。

在Dev Team模式下,Sonnet 5能自动生成多个子智能体,然后并行协作完成开发。

只要给一句需求,多个子智能体会同时并行工作、互相校验。

最终输出的不是一段代码,而是一个完整可用、可测试、可迭代的功能模块。

可以说,这已经不是Copilot,而是一整个不请假的开发团队!

爆料:Claude Code「蜂群」模式来了

其实在前几天,就有关于Claude Code蜂群模式(Agent Swarm)的爆料。

可以猜测,这个蜂群模型跟传说中要上线的Dev Team有着极其密切的关系。


爆料的关键人叫Mike Kelly,他在X上爆了个猛料:Claude Code里,藏着一个尚未公开的 Swarm功能。


视频如下。

而且,他还放出了一个Fork项目——Claude Sneak Peek,供大家试用。


所谓Swarms,就是一个「总指挥」AI,加上一群随叫随到、即用即走的专业子智能体,构成一整套协作系统。这套模式如下——

Hierarchical(层级式) :总指挥 → 组长 → 执行者

Dependency(依赖式) :任务 A完成,才能启动任务B

Broadcast(广播式) :一个信息,所有子agent同步接收

Messaging System(消息系统) :agent之间可以互相通信

这样,所有AI就像公司一样运作了。


其实,早在去年7月,Anthropic就推出了Custom Sub Agents。然而它们有很多致命缺陷,比如记忆是碎片化的,要靠人手动补丁,而且创建子Agent也是全靠人。

然而这次的「蜂群」就不一样了!

一位开发者的实测任务开始:让AI为工具创建一个Web前端,允许你在终端中从X上下载视频。

让Claude 读取一个plan.md,要求它拆分任务,用Swarm的方式执行。

惊人的一幕来了:一开始,没有任何自定义子agent。

执行任务后,奇迹发生了!Claude自动创建了Team Leader、Front-end Builder、Backend Builder、Component Builder和QA Tester。


这些Agent全部在并行工作,状态实时可见。甚至,你可以进入任意Agent,查看它的system prompt,来看看它们脑子里正在想什么。


最夸张的地方是,Agent还会「自己生孩子」。任务进行到一半,Claude发现还不够,于是又生成了PI Server Agent、前端构建Agent、CSS专项Agent、API集成Agent等等。

Agent数量直接膨胀到8个,而且全程无人干预!可以说,这已经不是多智能体,而是AI在自我组织。


任务结束后,Claude还输出了项目总结和执行报告的两份文件,这已经是工程管理级别的产出了。


不过,为什么如此强大的蜂群功能还没开放呢?原因在于,这个能读取你全部上下文的超级调度器,功能太危险,不能轻易放出来。

可以想象的是,如果Swarm真正开放,Claude Code将不再仅仅是写代码的AI,而是能自己组建研发团队的系统。

这,将是一个彻底的范式升级。

时间点的杀意:正面硬刚OpenAI

就在这几天,OpenAI的同期动作一直很猛。奥特曼已经预告了接下来是Codex全家桶的发布月。

Anthropic选择这个时间点发布Sonnet 5,用意很明显:来,正面硬刚!

而之所以能有这个底气,答案就是一个字——钱。

在2026年1月底,Anthropic已经完成了超过100亿美元的融资,估值达3500亿美元,而最终的融资规模可能达到200亿。

根据Menlo Ventures在2025 Q4的报道,Anthropic的企业市场占有率已经占到了40%,远远领先于OpenAI的27%和谷歌的21%。

而且仅仅半年,Claude Code的年化收入就破了10亿美元。

最近,Anthropic已经凭Cowork直接引爆了一连串编程奇点,甚至孵化了Clawdbot和Molbook这样新物种的诞生。

如果这次泄露属实,那么Claude Sonnet 5(Fennec)将成为第一个真正意义上「能像团队一样工作的模型」。

2026年2月3日,很可能会被记为软件工程的分水岭之一。

参考资料:

https://x.com/RichOBray/status/2018351965323850149

https://x.com/pankajkumar_dev/status/1753448405523136512




特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2028台湾大选民调出炉:赖郑支持率差距显著,萧旭岑发力

2028台湾大选民调出炉:赖郑支持率差距显著,萧旭岑发力

长星寄明月
2026-02-04 00:06:58
不打伊朗了?特朗普调转枪口,又一场战争恐爆发,绍伊古登机离京

不打伊朗了?特朗普调转枪口,又一场战争恐爆发,绍伊古登机离京

流史岁月
2026-02-04 13:15:03
中国历史上最好的40年,没有任何丰功伟绩

中国历史上最好的40年,没有任何丰功伟绩

霹雳炮
2026-02-01 22:43:27
夫妻网购娃娃菜中毒涉嫌敲诈勒索双双被刑拘!网友震惊!律师:最高判10年

夫妻网购娃娃菜中毒涉嫌敲诈勒索双双被刑拘!网友震惊!律师:最高判10年

上观新闻
2026-02-04 08:59:17
哈登顺利抵达克利夫兰,灰熊拆队送走3J,史蒂文斯神操作得武器

哈登顺利抵达克利夫兰,灰熊拆队送走3J,史蒂文斯神操作得武器

春日筆記
2026-02-04 13:00:48
去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

天下霸奇
2026-01-29 09:07:49
安赛龙的时代,真的要在洛杉矶前落幕吗?

安赛龙的时代,真的要在洛杉矶前落幕吗?

杨晨大神
2026-02-03 12:10:09
内存涨到怀疑人生:512GB DDR5逼近100000元!价签贴了一层又一层

内存涨到怀疑人生:512GB DDR5逼近100000元!价签贴了一层又一层

快科技
2026-02-01 20:57:39
哈登加兰互换引爆联盟!双发动机还是战术灾难?

哈登加兰互换引爆联盟!双发动机还是战术灾难?

带你逛体坛
2026-02-04 12:46:12
老人用筷子蘸酒喂5月龄宝宝,导致其肝损伤,接近肝衰竭

老人用筷子蘸酒喂5月龄宝宝,导致其肝损伤,接近肝衰竭

观威海
2026-02-04 09:06:09
浙江女子200万巨款被“吃干抹净”事件:白手起家的孩子,一定要多长几个心眼子……

浙江女子200万巨款被“吃干抹净”事件:白手起家的孩子,一定要多长几个心眼子……

桌子的生活观
2026-02-03 12:26:18
马德兴:有关部门曾命令少和强队热身,现在多踢强队是正确的

马德兴:有关部门曾命令少和强队热身,现在多踢强队是正确的

懂球帝
2026-02-04 10:48:39
湖人大胜获4大利好!詹姆斯预计本季留队+计划猛追字母升级三巨头

湖人大胜获4大利好!詹姆斯预计本季留队+计划猛追字母升级三巨头

锅子篮球
2026-02-04 12:30:47
王欣瑜爆大冷拒握手震动舆论,网友:这件事力挺“赛右”姐妹

王欣瑜爆大冷拒握手震动舆论,网友:这件事力挺“赛右”姐妹

网球之家
2026-02-03 23:43:55
别再传比尔盖茨染病了,他前妻梅琳达亲口说的离婚真相比那脏多了

别再传比尔盖茨染病了,他前妻梅琳达亲口说的离婚真相比那脏多了

达文西看世界
2026-02-02 11:19:45
一记耳光,谢苗《东北警察故事3》票房破1000万,笑不出来!

一记耳光,谢苗《东北警察故事3》票房破1000万,笑不出来!

君笙的拂兮
2026-02-03 16:30:33
为了擒获中田英寿,亚洲名媛究竟付出了多大的代价?

为了擒获中田英寿,亚洲名媛究竟付出了多大的代价?

罗氏八卦
2026-02-01 21:10:03
美国忙了一年,巴拿马运河港口最终排除中国利益?中方还有一招

美国忙了一年,巴拿马运河港口最终排除中国利益?中方还有一招

阿萞你好
2026-02-04 12:50:09
1959年,彭德怀去江西看望贺子珍,看见一位陌生农妇,身份很特殊

1959年,彭德怀去江西看望贺子珍,看见一位陌生农妇,身份很特殊

古书记史
2025-12-29 00:08:52
2016年肯尼亚单方面撕毁与中企的合作合同,拒不赔付176亿违约金,还逼迫中方退还43亿

2016年肯尼亚单方面撕毁与中企的合作合同,拒不赔付176亿违约金,还逼迫中方退还43亿

史海孤雁
2026-02-01 17:32:24
2026-02-04 14:07:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14475文章数 66566关注度
往期回顾 全部

科技要闻

太烦人遭投诉!元宝红包链接被微信屏蔽

头条要闻

月销暴跌至不到50辆 小米SU7 Ultra专属销售团队解散

头条要闻

月销暴跌至不到50辆 小米SU7 Ultra专属销售团队解散

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

姜元来在大S墓碑前哭泣,与具俊晔拥抱

财经要闻

35岁入行,先被考证“割韭菜”

汽车要闻

全伪装雪地现身 一汽-大众纯电车型线索曝光

态度原创

旅游
时尚
亲子
教育
家居

旅游要闻

白天鹅宾馆“故乡水”新春换“新装”

状态比10年前更好,她到底做对了什么?

亲子要闻

45岁高龄备孕攻略:内膜薄会影响怀孕几率吗?

教育要闻

教育部调研重庆高校就业工作

家居要闻

灰白意境 光影奏鸣曲

无障碍浏览 进入关怀版