网易首页 > 网易号 > 正文 申请入驻

Claude Sonnet 4.5 来了!Anthropic说自己工程师已不写代码了,这次我信了

0
分享至


就在刚刚,Anthropic 宣布推出 Claude Sonnet 4.5。官方将其定位为“全球最强的代码模型”“构建复杂智能体的最强模型”以及“最会用电脑的模型”,并称其在推理与数学上也有显著提升。新模型同步带来一组面向开发者与企业使用的能力升级:包括 Claude Code 的 VS Code 原生扩展、终端 2.0 与一键回滚的 Checkpoints,面向 API 的上下文编辑(Context Editing)与记忆工具(Memory Tool),以及用于自建智能体的 Claude Agent SDK


1

从 7 小时到 30 小时:Claude 的长跑能力

最受瞩目的变化是持久执行能力。Anthropic 在客户测试中观察到,Sonnet 4.5 在复杂多步骤任务中可以连续专注运行 超过 30 小时,远超前代约 7 小时的表现。这并不意味着所有任务都能达到相同时长,但足以说明模型在“耐力”上的跨越。


在权威基准测试中:


  • SWE-bench Verified:在“标准算力”下准确率为 77.2%,更高测试条件下最高可达 82.0%

  • OSWorld(电脑使用能力):取得 61.4% 的成绩,领先所有已知模型;而四个月前 Sonnet 4 的分数为 42.2%。

  • 数学与推理:在 AIME、MMMLU 等多类评测上均有明显提升,系统卡披露了具体运行设置与多语言评测细节。

这些数据共同指向一个结论:Sonnet 4.5 在解决现实任务、操作复杂系统方面比以往更稳健。

1

不止能写代码,Claude 正在学会托管整个工程

这次更新不仅是模型能力的提升,更是开发工具链的一次升级。

  • Claude Code:新增 VS Code 扩展(Beta),提供可视化改动与内联 diff;终端 2.0 支持历史检索,新增 Checkpoints 功能,允许在大改动前保存进度、随时回滚。Sonnet 4.5 也成为 Claude Code 的默认模型。

  • Claude Agent SDK:开放内部的“智能体底座”,包括上下文管理、权限/交互设计、子智能体协作等机制,方便企业定制自己的专用智能体。

  • 上下文管理与记忆

1. Context Editing 能在接近 token 上限时自动清理陈旧信息,保留关键上下文。

2. Memory Tool 允许在对话外存储和复用知识。
官方数据显示,两者结合可让复杂检索任务成功率提升 最高 39%,并在长时 Web 搜索中将 token 消耗减少 84%

  • 应用层体验:Claude 网页和桌面端新增代码执行与文件生成功能,Chrome 扩展也面向 Max 用户开放。

换句话说,Claude 4.5 不只是“更聪明的助手”,更像一个能全天候值守的开发伙伴

1

安全边界更严,价格却没涨

Sonnet 4.5 以 ASL-3 安全级别发布。Anthropic 强调,它在防止逢迎、欺骗、提示注入等方面表现更稳健,并配有针对 CBRN(化生放核)风险的内容分类器,以降低滥用可能。

定价维持不变:

  • API:输入 $3 / 百万 token,输出 $15 / 百万 token。

  • 模型名:claude-sonnet-4-5-20250929(别名 claude-sonnet-4-5)。

  • 渠道:已上线 AWS BedrockGoogle Cloud Vertex AI

此外,Anthropic 还推出了为期五天的实验项目 “Imagine with Claude”,面向 Max 用户展示 Sonnet 4.5 如何从零生成应用。

1

夜班战士与干将智囊:开发者怎么用 Claude 4.5

在早期客户的实验中,Sonnet 4.5 被用于从零构建一个聊天应用:模型不仅能拉起前端与后端,还能自行调试数据库接口,连续工作超过一天一夜。这种“长跑式执行”让开发者直呼“就像有了一个夜班战士”。

在实际使用中,开发者们发现 Sonnet 4.5 与更强大的 Opus 形成了互补:前者更适合日常落地和持续推进,后者则用于解决最复杂的问题。有人戏称,“Claude 已经变成双保险:Opus 担当‘智囊’,Sonnet 则是‘干将’。”

当然,现实也提醒我们保持冷静。一些研究指出,即便是最强的生成模型,自动生成的代码仍可能隐藏缺陷或带来安全隐患。因此,Claude 再强,也依然需要人类开发者的监督和测试。

1

从助手到工友:耐久执行的 Claude 时代

Claude Sonnet 4.5 的关键词是 “耐久执行”。它不仅能做事,还能把事坚持做下去,并配套一整套工具链,把开发流程托管得更稳。这意味着 AI 正在从“对话助手”逐渐走向“可靠工友”,从短平快的输出迈向长期、系统化的执行。

而这一切,也让人联想到不久前 Anthropic 联合创始人曾透露的那句话:“在公司内部,工程师们已经不再写代码了。” 当时不少人半信半疑,觉得这更像是一种宣传话术。可如今,当我们看到一个能连续工作 30 小时、能自己拉起网站、写前后端、调试接口的 Claude 4.5 真正发布出来时,那句“工程师已不写代码”的未来图景,似乎真的有了几分可信。

信息来源:

Anthropic 官方新闻稿:Introducing Claude Sonnet 4.5

Reuters(路透社): https://www.reuters.com/business/retail-consumer/anthropic-launches-claude-45-touts-better-abilities-targets-business-customers-2025-09-29/

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普,突发威胁!

特朗普,突发威胁!

数据宝
2025-11-03 12:19:33
高中时期你经历过哪些炸裂事迹?网友:大家的青春都这么污的吗

高中时期你经历过哪些炸裂事迹?网友:大家的青春都这么污的吗

带你感受人间冷暖
2025-10-03 00:20:08
让你三观尽毁的事有哪些?网友:第一个最炸裂,太污了

让你三观尽毁的事有哪些?网友:第一个最炸裂,太污了

解读热点事件
2025-10-23 00:15:02
落地的凤凰不如鸡,44岁“消失”的玲花,终是为搭档的行为买了单

落地的凤凰不如鸡,44岁“消失”的玲花,终是为搭档的行为买了单

萌姐
2025-11-02 17:47:41
1982年戴安娜艰难生下威廉,女王第一眼就赞了孙子的耳朵,很幽默

1982年戴安娜艰难生下威廉,女王第一眼就赞了孙子的耳朵,很幽默

讯崽侃天下
2025-11-02 20:16:57
许家印为保命爆出三大靠山!百亿房东浮出水面,抱得美人归引热议

许家印为保命爆出三大靠山!百亿房东浮出水面,抱得美人归引热议

诗意世界
2025-09-26 10:31:06
巴基斯坦“罕见公开”!

巴基斯坦“罕见公开”!

环球时报新闻
2025-11-01 09:12:16
2025年11月3日凌晨俄乌冲突最新战报:红军城未下,核风险攀升

2025年11月3日凌晨俄乌冲突最新战报:红军城未下,核风险攀升

荷兰豆爱健康
2025-11-03 11:23:30
歼-35、空警600打包买了?俄专家:找中国买新航母,还要电弹​​

歼-35、空警600打包买了?俄专家:找中国买新航母,还要电弹​​

近史谈
2025-11-01 19:31:35
63岁豪门千金何超琼澳门火炬传递,运动风造型惊艳众人?

63岁豪门千金何超琼澳门火炬传递,运动风造型惊艳众人?

娱乐领航家
2025-11-03 12:00:08
马刺终结5连胜!文班6失误,榜眼伤退,这一战,我彻底认清这3人

马刺终结5连胜!文班6失误,榜眼伤退,这一战,我彻底认清这3人

老侃侃球
2025-11-03 11:25:19
筱梅带俩娃宽窄巷子逛夜市,买小吃!玥儿洋气又漂亮!更像大S了

筱梅带俩娃宽窄巷子逛夜市,买小吃!玥儿洋气又漂亮!更像大S了

深析古今
2025-11-03 09:50:44
“蛇蝎美女”翟欣欣聊天内容曝光!内容不堪入目,真是毁人三观

“蛇蝎美女”翟欣欣聊天内容曝光!内容不堪入目,真是毁人三观

谈史论天地
2025-11-02 16:30:48
牡丹花下死!结婚刚一个月,娶“白月光”的李国庆彻底成为笑话

牡丹花下死!结婚刚一个月,娶“白月光”的李国庆彻底成为笑话

春秋论娱
2025-09-23 07:20:44
40岁后才懂:这些年瞎花的钱,全是交了智商税!

40岁后才懂:这些年瞎花的钱,全是交了智商税!

一桶浆糊要一统江湖
2025-10-27 17:35:07
刘亦菲于适恋情?孟子义靠赵樱子入行?陈瑶又被耽误了?翁青雅对朱珠耍大牌?老牌女星乱发脾气?

刘亦菲于适恋情?孟子义靠赵樱子入行?陈瑶又被耽误了?翁青雅对朱珠耍大牌?老牌女星乱发脾气?

十锤星人
2025-11-02 22:45:02
1937年八路军夜袭阳明堡机场,卫立煌得知后感叹道:这是奇功!

1937年八路军夜袭阳明堡机场,卫立煌得知后感叹道:这是奇功!

历史龙元阁
2025-11-02 19:40:02
章泽天参加APEC峰会,换了造型胜似贵妇,跟大人物握手笑容灿烂!

章泽天参加APEC峰会,换了造型胜似贵妇,跟大人物握手笑容灿烂!

心静物娱
2025-11-02 15:42:14
荷兰又变天了!荷兰大选的初步结果揭晓:极右翼惨败,极左翼大胜

荷兰又变天了!荷兰大选的初步结果揭晓:极右翼惨败,极左翼大胜

男女那点事儿儿
2025-11-02 07:55:28
A股:今日,让人捧腹大笑,出现两个信号,股市即将进入尾声了?

A股:今日,让人捧腹大笑,出现两个信号,股市即将进入尾声了?

史行途
2025-11-03 12:00:34
2025-11-03 12:44:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2603文章数 10391关注度
往期回顾 全部

科技要闻

余承东内部信:鸿蒙下一步要实现上亿覆盖

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

头条要闻

媒体:高市早苗发表涉台错误言行 中方直接"亮剑"

体育要闻

开拓者官宣召回杨瀚森 队记解析核心原因

娱乐要闻

录音彻底揭露知名导演王家卫的体面

财经要闻

马斯克:未来5-6年传统手机与App将消失

汽车要闻

超跑同款磁流变减振 深蓝L06包你开得爽

态度原创

亲子
健康
旅游
家居
公开课

亲子要闻

双喜临门!她官宣结婚怀孕

核磁VS肌骨超声,谁更胜一筹?

旅游要闻

上海迪士尼又扩建,将建第四座主题酒店,上周刚迎来第一亿名游客

家居要闻

岁月柔情 现代品质轻奢

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版