网易首页 > 网易科技 > IT业界 > 正文

“最强编程模型”,Claude Sonnet 4.5发布,能自主运行30小时

Claude 4.5发布 能连续干活30多小时

0
分享至
核心提示
  • 01 人工智能公司Anthropic发布了其最新模型Claude Sonnet 4.5,现已向所有用户开放。
  • 02 Anthropic宣称,新模型是“全球最强的编程模型”,在编程、计算机操作及满足金融、网络安全等实际业务需求方面性能优异。
  • 03 公司强调新模型能创造实际商业成果与生产力增长,其运作水平被形容为“参谋长级别”,能够自主处理复杂的多步骤任务。

9月30日消息,人工智能(AI)公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示,Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异,且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。

Anthropic称,根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试,Claude Sonnet 4.5是“全球最强的编程模型”。

Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)在接受CNBC采访时表示:“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。”


公司表示,新模型能够生成质量更高的代码,更擅长发现代码的改进空间,并且遵循指令的可靠性显著提升。

在此之前,Anthropic已于今年5月发布了Claude Sonnet 4,并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。

Anthropic由前OpenAI研究人员于2021年创立,两家公司自此形成激烈的竞争格局。

2022年,OpenAI发布聊天机器人ChatGPT,引爆生成式人工智能热潮。今年8月份,这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5,但发布过程一波三折,部分用户抱怨无法再使用OpenAI的旧版模型。

Anthropic首席产品官迈克·克里格(Mike Krieger)则表示,Claude Sonnet 4.5将成为用户的默认模型,公司推荐的这款模型适用“几乎所有使用场景”。

他还补充说,付费订阅用户仍然可以选用Opus模型,而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。

克里格补充道,Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小,但“几乎所有方面”都更智能。

克里格说:“我们自己和客户都发现,这个模型在实际工作中极具实用价值。”

据Anthropic介绍,Claude Sonnet 4.5可持续自主运行长达30小时,期间能持续专注于处理复杂的多步骤任务。相比之下,今年5月份发布的Claude Opus 4只能自主运行7小时。

Anthropic还表示,他们通过大量的安全训练成功改善了模型的行为表现,有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。

Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力,可有效避免被诱导执行泄露敏感数据等恶意操作。

卡普兰说:“这可能是过去一年到一年半以来,我们在安全性方面取得的最大突破。”

Anthropic还将发布更多新模型。卡普兰透露,更先进的模型即将问世,其中“很可能包括新版Opus”。

他表示:“虽然目前不会做出承诺,但我认为在今年年底前,我们很可能还会发布一到两款新模型。”

各方观点与市场解读

《彭博社》在报道中特意提到,最近数周的多项研究表明,AI并未给竞相采用它的公司带来显著效益。但Anthropic强调,Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为,企业要充分实现AI的价值,“必须要有几个大前提”,其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说,“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。

路透社则认为,Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布,将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能,其中包括Excel和Word中的“智能体模式”(Agent Mode)、Copilot聊天中的“Office智能体”(Office Agent)等等。随后还将在PowerPoint中上线相关功能。

《The Verge》也提到,Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示,Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能,让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受《The Verge》采访时提到,新模型的运作水平达到了“参谋长级别”,能够查询多人日程找出空闲时间并安排会议,查看数据仪表盘整合不同见解,还能根据与下属的一对一会议内容撰写工作状态更新等。

《商业内幕》(Business Insider)认为,此次升级距离前代产品Sonnet 4的发布仅四个月,凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出,新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特( Alex Albert)在接受《商业内幕》采访时表示:“这些进步证实,通过扩展计算能力等输入,AI模型的性能将持续提升。”该报道提到,Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体,从而创造出实际的商业成果。文中援引艾尔伯特的话称,“编码和智能体能力的提升正在转化为实实在在的生产力增长。”

《商业内幕》的报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能,并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外,Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包,为开发者提供精细化的工具,用于开发定制化、具备上下文感知能力的AI智能体。(辰辰)

延伸阅读
相关推荐
热点推荐
王思聪新加坡吃路边摊!全程玩手机,旁边的女生很漂亮,命太好了

王思聪新加坡吃路边摊!全程玩手机,旁边的女生很漂亮,命太好了

悦君兮君不知
2025-09-30 11:52:06
伊布口中把任意球当点球踢的大师,踢晕过克林斯曼,还戏耍过江津

伊布口中把任意球当点球踢的大师,踢晕过克林斯曼,还戏耍过江津

足篮大世界
2025-09-29 20:08:39
谭咏麟现身茶餐厅吃饭,53岁红颜知己也在保养得宜,两人育有一子

谭咏麟现身茶餐厅吃饭,53岁红颜知己也在保养得宜,两人育有一子

涵豆说娱
2025-09-30 12:10:11
金建希被捕后露面了:发型凌乱白发明显,和风光时的精致判若两人

金建希被捕后露面了:发型凌乱白发明显,和风光时的精致判若两人

照见古今
2025-09-28 18:30:59
仅剩20%!中国第一个将消失的沙漠,比台湾大,NASA:地球更绿了

仅剩20%!中国第一个将消失的沙漠,比台湾大,NASA:地球更绿了

国学璀璨
2025-09-10 14:59:01
上海绿捷遭立案调查,“臭虾”事件牵出730亿新希望家族!

上海绿捷遭立案调查,“臭虾”事件牵出730亿新希望家族!

财观潮头
2025-09-29 21:52:30
00后浙江小伙,放话“干翻大疆”,毕业一年就融资2个亿,他究竟做对了什么?

00后浙江小伙,放话“干翻大疆”,毕业一年就融资2个亿,他究竟做对了什么?

FM93浙江交通之声
2025-09-29 22:36:09
江西25岁女子曼谷失联,家属称9天后收到陌生人勒索信息:不谈条件,不会白收钱

江西25岁女子曼谷失联,家属称9天后收到陌生人勒索信息:不谈条件,不会白收钱

潇湘晨报
2025-09-30 13:22:52
恭喜湖人,连签3人!佩林卡操作封神,21人大名单出炉!老詹表态

恭喜湖人,连签3人!佩林卡操作封神,21人大名单出炉!老詹表态

篮球扫地僧
2025-09-30 17:17:40
这两条新闻放一起看,讽刺至极

这两条新闻放一起看,讽刺至极

清书先生
2025-09-28 17:07:07
福建舰回港准备入列,将配备全球最大吨位隐身舰载无人机攻击21

福建舰回港准备入列,将配备全球最大吨位隐身舰载无人机攻击21

兵国大事
2025-09-30 17:30:12
缅北第2的女魔头,喜欢活取男性的双肠,每天抽签决定1人生死

缅北第2的女魔头,喜欢活取男性的双肠,每天抽签决定1人生死

羞羞故事大全
2024-09-09 14:47:42
中国外交部通告全球:增设K字签证,引发国际高度关注

中国外交部通告全球:增设K字签证,引发国际高度关注

一个有灵魂的作者
2025-09-29 20:33:15
“臀大腰粗”的女生怎么穿好看?吊带背心搭深灰瑜伽裤,高雅自信

“臀大腰粗”的女生怎么穿好看?吊带背心搭深灰瑜伽裤,高雅自信

小乔古装汉服
2025-09-29 07:55:03
突破6万台,全新问界M7上市一周销量出炉

突破6万台,全新问界M7上市一周销量出炉

音乐时光的娱乐
2025-09-30 12:36:50
国家发展改革委下达今年第四批690亿元超长期特别国债支持消费品以旧换新资金

国家发展改革委下达今年第四批690亿元超长期特别国债支持消费品以旧换新资金

财联社
2025-09-30 16:45:14
把债务变成罪:山东微山的“模板式”冤案与权力的速成伪证学

把债务变成罪:山东微山的“模板式”冤案与权力的速成伪证学

有戏
2025-09-29 09:21:36
吕丽君儿子与刘銮雄合照曝光,与姐姐搀扶父亲,甘比俩女儿也在场

吕丽君儿子与刘銮雄合照曝光,与姐姐搀扶父亲,甘比俩女儿也在场

心静物娱
2025-09-30 11:11:43
普京“卸磨杀驴”,霸气给世界上了一课!“中国也应吸取教训“

普京“卸磨杀驴”,霸气给世界上了一课!“中国也应吸取教训“

娱乐的宅急便
2025-09-30 14:39:37
宁夏工商联主席何晓勇因病去世,曾任中卫副市长等职

宁夏工商联主席何晓勇因病去世,曾任中卫副市长等职

澎湃新闻
2025-09-30 16:58:30
2025-09-30 18:23:00

科技要闻

宇树回应机器人安全漏洞:已完成大部分修复

头条要闻

男子称女友花12800买到自己5年开房记录:还能查同住人

头条要闻

男子称女友花12800买到自己5年开房记录:还能查同住人

体育要闻

詹姆斯:愿为东契奇调整打法 失去热爱时就会退役

娱乐要闻

和张艺谋离婚后,前妻肖华现状

财经要闻

洽洽净利暴跌73% 经销商遭压货被迫清盘

汽车要闻

升级端到端高快NOA 上汽大众Pro家族2026款上市

态度原创

本地
时尚
教育
数码
公开课

本地新闻

读港校想省钱,社恐输在起跑线

她18岁成名,26岁惨遭毁容,70多岁却能和LV联名:人生没有白走的路!

教育要闻

当朋友圈的定位变成浦东机场:为了孩子的教育,朋友一个个的都出去了

数码要闻

罗技生产力鼠标 MX Master 4 发布:触觉反馈,到手 899/879 元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×