网易首页 > 网易号 > 正文 申请入驻

Claude Sonnet 4.5 来了!Anthropic说自己工程师已不写代码了,这次我信了

0
分享至

就在刚刚,Anthropic 宣布推出 Claude Sonnet 4.5。官方将其定位为“全球最强的代码模型”“构建复杂智能体的最强模型”以及“最会用电脑的模型”,并称其在推理与数学上也有显著提升。新模型同步带来一组面向开发者与企业使用的能力升级:包括 Claude Code 的 VS Code 原生扩展、终端 2.0 与一键回滚的 Checkpoints,面向 API 的上下文编辑(Context Editing)与记忆工具(Memory Tool),以及用于自建智能体的 Claude Agent SDK

1

从 7 小时到 30 小时:Claude 的长跑能力

最受瞩目的变化是持久执行能力。Anthropic 在客户测试中观察到,Sonnet 4.5 在复杂多步骤任务中可以连续专注运行 超过 30 小时,远超前代约 7 小时的表现。这并不意味着所有任务都能达到相同时长,但足以说明模型在“耐力”上的跨越。

SWE-bench Verified:在“标准算力”下准确率为 77.2%,更高测试条件下最高可达 82.0%

  • OSWorld(电脑使用能力):取得 61.4% 的成绩,领先所有已知模型;而四个月前 Sonnet 4 的分数为 42.2%。

  • 数学与推理:在 AIME、MMMLU 等多类评测上均有明显提升,系统卡披露了具体运行设置与多语言评测细节。

  • 这些数据共同指向一个结论:Sonnet 4.5 在解决现实任务、操作复杂系统方面比以往更稳健。

    1

    不止能写代码,Claude 正在学会托管整个工程

    这次更新不仅是模型能力的提升,更是开发工具链的一次升级。

    • Claude Code:新增 VS Code 扩展(Beta),提供可视化改动与内联 diff;终端 2.0 支持历史检索,新增 Checkpoints 功能,允许在大改动前保存进度、随时回滚。Sonnet 4.5 也成为 Claude Code 的默认模型。

    • Claude Agent SDK:开放内部的“智能体底座”,包括上下文管理、权限/交互设计、子智能体协作等机制,方便企业定制自己的专用智能体。

    • 上下文管理与记忆

    1. Context Editing 能在接近 token 上限时自动清理陈旧信息,保留关键上下文。

    2. Memory Tool 允许在对话外存储和复用知识。
    官方数据显示,两者结合可让复杂检索任务成功率提升 最高 39%,并在长时 Web 搜索中将 token 消耗减少 84%

    • 应用层体验:Claude 网页和桌面端新增代码执行与文件生成功能,Chrome 扩展也面向 Max 用户开放。

    换句话说,Claude 4.5 不只是“更聪明的助手”,更像一个能全天候值守的开发伙伴

    1

    安全边界更严,价格却没涨

    Sonnet 4.5 以 ASL-3 安全级别发布。Anthropic 强调,它在防止逢迎、欺骗、提示注入等方面表现更稳健,并配有针对 CBRN(化生放核)风险的内容分类器,以降低滥用可能。

    定价维持不变:

    • API:输入 $3 / 百万 token,输出 $15 / 百万 token。

    • 模型名:claude-sonnet-4-5-20250929(别名 claude-sonnet-4-5)。

    • 渠道:已上线 AWS BedrockGoogle Cloud Vertex AI

    此外,Anthropic 还推出了为期五天的实验项目 “Imagine with Claude”,面向 Max 用户展示 Sonnet 4.5 如何从零生成应用。

    1

    夜班战士与干将智囊:开发者怎么用 Claude 4.5

    在早期客户的实验中,Sonnet 4.5 被用于从零构建一个聊天应用:模型不仅能拉起前端与后端,还能自行调试数据库接口,连续工作超过一天一夜。这种“长跑式执行”让开发者直呼“就像有了一个夜班战士”。

    在实际使用中,开发者们发现 Sonnet 4.5 与更强大的 Opus 形成了互补:前者更适合日常落地和持续推进,后者则用于解决最复杂的问题。有人戏称,“Claude 已经变成双保险:Opus 担当‘智囊’,Sonnet 则是‘干将’。”

    当然,现实也提醒我们保持冷静。一些研究指出,即便是最强的生成模型,自动生成的代码仍可能隐藏缺陷或带来安全隐患。因此,Claude 再强,也依然需要人类开发者的监督和测试。

    1

    从助手到工友:耐久执行的 Claude 时代

    Claude Sonnet 4.5 的关键词是 “耐久执行”。它不仅能做事,还能把事坚持做下去,并配套一整套工具链,把开发流程托管得更稳。这意味着 AI 正在从“对话助手”逐渐走向“可靠工友”,从短平快的输出迈向长期、系统化的执行。

    而这一切,也让人联想到不久前 Anthropic 联合创始人曾透露的那句话:“在公司内部,工程师们已经不再写代码了。” 当时不少人半信半疑,觉得这更像是一种宣传话术。可如今,当我们看到一个能连续工作 30 小时、能自己拉起网站、写前后端、调试接口的 Claude 4.5 真正发布出来时,那句“工程师已不写代码”的未来图景,似乎真的有了几分可信。

    信息来源:

    Anthropic 官方新闻稿:Introducing Claude Sonnet 4.5

    Reuters(路透社): https://www.reuters.com/business/retail-consumer/anthropic-launches-claude-45-touts-better-abilities-targets-business-customers-2025-09-29/

    点个爱心,再走 吧

    特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

    Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

    相关推荐
    热点推荐
    挪威举国庆祝 “测震仪出现明显波动”!时隔28年再度杀入16强,“有哈兰德,但不只有哈兰德”

    挪威举国庆祝 “测震仪出现明显波动”!时隔28年再度杀入16强,“有哈兰德,但不只有哈兰德”

    澎湃新闻
    2026-07-01 14:05:56
    1换7!4400万美元续约!马刺遭两大“打击”,詹姆斯恐成最后希望

    1换7!4400万美元续约!马刺遭两大“打击”,詹姆斯恐成最后希望

    麦子的篮球故事
    2026-07-01 15:17:51
    严重背离世界杯精神!厄瓜多尔足协严厉发声,怒斥墨西哥盘外招

    严重背离世界杯精神!厄瓜多尔足协严厉发声,怒斥墨西哥盘外招

    全景体育V
    2026-07-01 08:46:54
    油价一夜大变!今天7月1日调整后,全国加油站92、95汽油最新售价

    油价一夜大变!今天7月1日调整后,全国加油站92、95汽油最新售价

    沙雕小琳琳
    2026-07-01 09:41:24
    情况有变!美财长暴跳如雷:192国都不买,就中国一个买

    情况有变!美财长暴跳如雷:192国都不买,就中国一个买

    浩舞纆画
    2026-07-01 10:32:21
    基尼奥内斯1球1助,墨西哥2-0完胜南美劲旅,强势晋级世界杯16强

    基尼奥内斯1球1助,墨西哥2-0完胜南美劲旅,强势晋级世界杯16强

    侧身凌空斩
    2026-07-01 12:01:39
    48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

    48小时内!高市开始反击:召见中国大使后,日本又爆发一个噩耗

    羽逸地之光
    2026-06-30 17:15:53
    将新疆贪腐厅官拉下马后,举报人因“敲诈勒索”等获刑6年10个月

    将新疆贪腐厅官拉下马后,举报人因“敲诈勒索”等获刑6年10个月

    塔子山评说
    2026-06-30 15:30:05
    世界杯第二张捂嘴红牌出现

    世界杯第二张捂嘴红牌出现

    扬子晚报
    2026-07-01 12:35:45
    全网群嘲“希尔顿酒店蹭吃”事件,炸出了多少脸皮厚的神人

    全网群嘲“希尔顿酒店蹭吃”事件,炸出了多少脸皮厚的神人

    小椰子专栏
    2026-07-01 13:00:53
    女子聚餐醉酒入住酒店跳楼坠亡 男友施救时力竭拉拽不住脱手,家属起诉多方索赔128万!判了

    女子聚餐醉酒入住酒店跳楼坠亡 男友施救时力竭拉拽不住脱手,家属起诉多方索赔128万!判了

    红星新闻
    2026-07-01 13:50:13
    罗晋大孤山素颜照曝光,秃顶白发引热议:成年人世界哪有容易二字

    罗晋大孤山素颜照曝光,秃顶白发引热议:成年人世界哪有容易二字

    南万说娱26
    2026-07-01 09:28:40
    0-3惨败佐藤瞳!比输球更难受的是王曼昱赛后这番话,让人心疼!

    0-3惨败佐藤瞳!比输球更难受的是王曼昱赛后这番话,让人心疼!

    田先生篮球
    2026-07-01 10:19:10
    35岁男子收到岗位被 AI 取代通知,拒绝大幅降薪后被单位开除。

    35岁男子收到岗位被 AI 取代通知,拒绝大幅降薪后被单位开除。

    HR蔷薇
    2026-06-30 16:03:56
    姜萍再登热搜!涟水企业家再访姜萍家,网传其已在苏州某高校就读

    姜萍再登热搜!涟水企业家再访姜萍家,网传其已在苏州某高校就读

    火山詩话
    2026-06-30 11:34:28
    勇士向詹姆斯提出硬性招募条件:先加盟,才会全力交易戴维斯

    勇士向詹姆斯提出硬性招募条件:先加盟,才会全力交易戴维斯

    夜白侃球
    2026-07-01 12:11:24
    优必选全尺寸超仿生机器人11.98万元起:仅限成年人购买

    优必选全尺寸超仿生机器人11.98万元起:仅限成年人购买

    PChome电脑之家
    2026-06-30 18:07:08
    突发!恭喜威少爷!

    突发!恭喜威少爷!

    左右为篮
    2026-07-01 10:54:14
    我真蠢,我竟然去看了《抓特务》

    我真蠢,我竟然去看了《抓特务》

    呦呦鹿鸣
    2026-06-28 22:42:42
    世界杯16强已确定7席!1/8决赛3组对决出炉,E、F两组球队全出局

    世界杯16强已确定7席!1/8决赛3组对决出炉,E、F两组球队全出局

    我爱英超
    2026-07-01 12:07:07
    2026-07-01 15:32:49
    硅星人 incentive-icons
    硅星人
    硅(Si)是创造未来的基础,欢迎来到这个星球。
    3205文章数 10508关注度
    往期回顾 全部

    科技要闻

    Claude Fable 5恢复上线方案公布

    头条要闻

    媒体:伊朗代表受美国诱惑赴多哈 60亿美元诱惑力太大

    头条要闻

    媒体:伊朗代表受美国诱惑赴多哈 60亿美元诱惑力太大

    体育要闻

    卖球衣救子的门将,把德国扑出了世界杯

    娱乐要闻

    罗晋大孤山素颜照,秃顶白发引热议

    财经要闻

    新氧贷款:宣传年化15%,实际顶格24%

    汽车要闻

    交付持续攀升再破纪录 零跑6月全球交付93376台

    态度原创

    亲子
    手机
    健康
    游戏
    艺术

    亲子要闻

    网友:不是笑容消失了还以为是倒立表演

    手机要闻

    三星Flip命悬一线 主流手机品牌放弃小折叠

    狂吃“糯叽叽”小心肠梗阻!

    《王者荣耀》开始整二游的活了?

    艺术要闻

    这5件2026届毕业油画作品,被中国美术学院美术馆收藏

    无障碍浏览 进入关怀版