网易首页 > 网易号 > 正文 申请入驻

刚刚,Claude Sonnet 4.5重磅发布,编程新王降临!

0
分享至


新智元报道

编辑:艾伦

【新智元导读】今天凌晨,Claude Sonnet 4.5发布了!新模型在编码、计算机使用、推理、长任务能力、安全对齐上的水平全面拔高,成为新一代编程模型王者。新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。

北京时间今天凌晨,Anthropic正式发布了Claude Sonnet 4.5。


这一版本被Claude定义为全球最强的代码模型,同时在智能体构建、计算机使用、推理和数学能力上展现出显著突破。


代码无处不在,它驱动着应用程序、表格和各种工具。

现代工作的核心在于运用这些工具并解决复杂问题,而Sonnet 4.5让这一切更加高效和可靠。

全新功能与产品升级

伴随Sonnet 4.5,Anthropic对Claude全线产品进行了大规模更新:

  • Claude Code新增了备受期待的「检查点」(Checkpoints)功能,可随时保存进度并一键回滚到早先状态;同时更新了终端界面,并推出了原生VS Code插件。

  • ClaudeAPI增加了上下文编辑功能和记忆工具,让智能体能运行更久,处理更复杂的任务。

  • Claude apps现已支持在对话中直接执行代码、生成文件(包括表格、幻灯片和文档)。

  • Claude for Chrome扩展对此前等待名单中的Max用户开放。

开发者社区也迎来了新的核心资源:Claude AgentSDK

这套工具包开放了驱动Claude Code的底层基础设施,为所有人打造智能体提供了基础能力。

前沿性能与基准成绩

Sonnet 4.5在多项权威测试中表现出色:

  • SWE-bench Verified在真实软件编码能力测试中达到最新的最优水平,可在复杂的多步骤任务中保持超过30小时的专注执行。


  • OSWorld在模拟真实计算机任务的基准中,以61.4%的成绩位居首位,而四个月前Sonnet 4还保持在42.2%。

视频演示了Claude for Chrome的模拟操作计算机任务能力

  • 推理与数学:在一系列公共评测中大幅领先,特别是在金融、法律、医学和STEM等专业领域的知识与推理上,远超此前的Opus 4.1。





左右滑动查看

这些进展不仅体现在数据中,也得到了提前体验的专业用户们的高度评价:

Claude Code能自主编程30小时以上,帮助工程师在极短时间内完成原本要花费数月的架构工作。——Sean Ward, iGent AI CEO

replit内部代码编辑测试中,错误率从Sonnet 4的9%直接降至0%。——Michele Catasta, replit President




左右滑动查看

更强的对齐,更安全

Sonnet 4.5是迄今为止对齐性最好的Claude模型。

通过改进的能力和广泛的安全训练,模型在减少迎合、欺骗、权力追求和虚妄鼓励等行为方面取得了明显成效。

在智能体和计算机使用场景中,团队也特别加强了对提示注入攻击的防御。

这些改进已在系统卡(System Card)中以详细评估形式公开,其中首次引入了可解释性技术来验证安全性。


Sonnet 4.5按照AISafety Level 3(ASL-3)框架发布,包含一系列防护措施,例如针对化学、生物、放射和核相关内容的分类器过滤机制。

虽然这些过滤器可能偶尔误判正常内容,但与Sonnet 4相比,误报率已降低十倍,并将在未来继续优化。

Claude Agent SDK

在过去半年中,Claude团队不断迭代Claude Code,探索了智能体设计中的核心挑战,包括长时任务的内存管理、权限体系的平衡,以及子代理的协同方式。

如今,这些能力通过Claude AgentSDK向开发者全面开放。

Claude Agent SDK演示视频

SDK不仅适用于编码,还能支持更广泛的应用场景。

它为构建复杂任务的自主智能体提供了与Anthropic内部工具相同的基础设施。

研究预览:「Imagine with Claude」

作为额外的实验,Anthropic发布了一个临时研究预览——「Imagine with Claude」

Imagine With Claude实时生成软件演示视频

在这一体验中,Claude会实时生成软件,没有预设功能或预写代码,用户可以直接看到Claude在交互过程中即时创造与适配的过程。

该功能向Max订阅用户开放5天,可在claude.ai/imagine上体验。

API新特性

Sonnet 4.5在API层面也带来了重要更新:

  • 记忆工具(Beta)支持在上下文窗口外存储和调用信息,帮助跨会话维持知识和状态。

  • 上下文编辑通过自动清理旧的工具调用和结果来避免上下文溢出。

  • 新的停止原因提示增加了model_context_window_exceeded,更清晰地标识因上下文限制而中止生成。

  • 工具参数改进修复了字符串参数尾部换行被截断的问题,保证格式精确传递。

  • Token计数优化系统会自动添加优化Token,但用户不会为这些系统注入的部分付费。


定价与使用渠道

价格保持与Sonnet 4一致:

  • 输入:3美元/百万Tokens

  • 输出:15美元/百万Tokens


Sonnet 4.5可通过以下渠道使用:

  • Claude API:claude-sonnet-4-5-20250929

  • Amazon Bedrock:anthropic.claude-sonnet-4-5-20250929-v1:0

  • Google Cloud Vertex AI:claude-sonnet-4-5@20250929

  • 同时也在Claude.ai与Claude Code平台上线。


升级指南

当前使用Sonnet 4的开发者,只需将模型名称更新为claude-sonnet-4-5-20250929即可完成迁移。

所有现有API调用依然有效。建议同时启用新特性,例如记忆工具和上下文清理,以充分发挥模型性能。

需要注意的是,Sonnet 4.5不再允许同时指定temperaturetop_p参数,用户应选择其一。


新一轮的AI编程大战即将来临

Claude Sonnet 4.5在编码、智能体能力、计算机使用和安全性方面实现了全面跃升。

它既是开发者工具箱中的新利器,也是一个能在金融、医学、科研等领域提供专业支持的强大平台。

Anthropic通过这一版本,继续推动AI在前沿能力和安全性上的平衡发展。

编程新王降临,新一轮围绕编程展开的百模大战即将展开,而Claude Sonnet 4.5即将成为大家争相对标的新对象。

参考资料:

https://www.anthropic.com/news/claude-sonnet-4-5

https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5

https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

杨尚昆和哈梅内伊的“三无”会见,杨尚昆说了几句转身就走

犀利强哥
2026-03-04 21:40:54
新世界中国深圳首个城市更新项目亮相 总建面90万平米

新世界中国深圳首个城市更新项目亮相 总建面90万平米

观点机构
2026-03-15 18:36:23
投资1.25亿!湖南一城铁站运营仅5年停运,春运日客流不到10人

投资1.25亿!湖南一城铁站运营仅5年停运,春运日客流不到10人

小李子体育
2026-03-15 16:40:58
伊朗外长:从未提出过停火及谈判请求

伊朗外长:从未提出过停火及谈判请求

界面新闻
2026-03-15 23:08:58
北京西城推动“老破小”蝶变“好房子”

北京西城推动“老破小”蝶变“好房子”

北青网-北京青年报
2026-03-15 09:17:17
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

林子说事
2026-03-15 16:49:10
浙江人出来解释一下,这个是什么物种啊?

浙江人出来解释一下,这个是什么物种啊?

芭比衣橱
2026-03-15 17:10:22
钱钟书第一任女婿王德一,为什么杨绛书中对他一字不提?有原因!

钱钟书第一任女婿王德一,为什么杨绛书中对他一字不提?有原因!

莹莹的历史说
2026-03-14 19:59:50
世预赛:一夜3队出线+4队出局!日本爆大冷 中国女篮庆祝画面曝光

世预赛:一夜3队出线+4队出局!日本爆大冷 中国女篮庆祝画面曝光

侃球熊弟
2026-03-16 09:08:40
奔驰静置时自燃,消防认定系车辆故障引发,4S店及厂家:认定书不能作为车辆质量问题依据|3·15端上维权

奔驰静置时自燃,消防认定系车辆故障引发,4S店及厂家:认定书不能作为车辆质量问题依据|3·15端上维权

中国能源网
2026-03-13 15:57:08
中国女篮86-76捷克,离开“老六”是真不行啊!宫鲁鸣有转变迹象

中国女篮86-76捷克,离开“老六”是真不行啊!宫鲁鸣有转变迹象

冷桂零落
2026-03-16 08:35:45
包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

来科点谱
2026-02-16 07:12:06
WTI原油失守96美元/桶,日内跌0.88%

WTI原油失守96美元/桶,日内跌0.88%

每日经济新闻
2026-03-16 08:15:03
韦雪又要去整容了,自曝大半年没动脸感觉变丑了,要飞去韩国do脸

韦雪又要去整容了,自曝大半年没动脸感觉变丑了,要飞去韩国do脸

观鱼听雨
2026-03-13 21:20:17
离谱到发指!万人小区通的竟然是井水,居民:喝了8年才知道真相

离谱到发指!万人小区通的竟然是井水,居民:喝了8年才知道真相

林子说事
2026-03-15 20:00:44
飞机上大妈霸占座位,空姐劝阻遭辱骂,机长一句话让她面红耳赤

飞机上大妈霸占座位,空姐劝阻遭辱骂,机长一句话让她面红耳赤

今天说故事
2025-08-07 16:14:09
把天捅破!美国驻以色列大使:若以色列拿下整个中东,那也没问题

把天捅破!美国驻以色列大使:若以色列拿下整个中东,那也没问题

达文西看世界
2026-02-22 21:18:10
“妖板”续作:华擎推出第二款DDR5+DDR4主板H610M COMBO II

“妖板”续作:华擎推出第二款DDR5+DDR4主板H610M COMBO II

IT之家
2026-03-16 09:09:48
复仇广东赛后,付豪致谢杜锋乌戈的一番心里话,却让杨鸣无比尴尬

复仇广东赛后,付豪致谢杜锋乌戈的一番心里话,却让杨鸣无比尴尬

后仰大风车
2026-03-16 08:10:16
真相大白!以色列为何突然老实了呢?真实原因开始浮出水面

真相大白!以色列为何突然老实了呢?真实原因开始浮出水面

墨印斋
2026-01-20 16:46:58
2026-03-16 09:52:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14729文章数 66693关注度
往期回顾 全部

科技要闻

315曝光AI大模型"投毒"!39.9元篡改AI答案

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

头条要闻

牛弹琴:伊朗反击越来越幽默 拉里贾尼新警告意味深长

体育要闻

卢卡绝杀掘金:湖人有季后赛氛围了?

娱乐要闻

第98届奥斯卡金像奖获奖名单公布

财经要闻

谁在给AI“投毒”?315曝光GEO乱象

汽车要闻

倾听用户声音 东风奕派三款新车亮相

态度原创

本地
时尚
数码
房产
家居

本地新闻

坐标北京,过敏季反向迁徒

内娱小白花,公然模仿某巨星却被全网夸爆?

数码要闻

智能家电狂卷AWE!终局却是一场关于“AI算力”的竞争?

房产要闻

销量扑街!建鑫·如意芳华,为何成了全荔湾卖得最差的新盘?

家居要闻

艺术之家 法式优雅

无障碍浏览 进入关怀版