网易首页 > 网易号 > 正文 申请入驻

Claude Opus 4.8发布:速度与判断力双重升级,同价位更强协作力

0
分享至

线上办公的周五下午,一个开发者对着工作台自言自语:“它居然质疑了我的架构方案。”他的语气有点困惑。他正在测试刚发布的新版本模型,试图让它完成一项多服务编排任务,但模型没有直接执行,反而提出好几个问题,还指出计划里一处潜在的数据冲突。这件事在开发者社区引发讨论,因为“工具质疑人的决定”这类情况,大多只停留在论文的理想场景里,很少出现在日常编程协作中。

这就是Anthropic推出的新版Claude Opus 4.8。它基于Opus 4.7做了全面升级,在一系列基准测试上取得进步,官方定位为“更有效的合作者”。价格没变。


与Opus 4.8一同发布的,还有几项新功能。claude.ai的用户现在可以控制模型处理任务时投入多少算力。Claude Code获得一个叫“动态工作流”的功能,这让它可以着手解决规模非常大的问题。影响最直接的,也许是专门用于Opus 4.8的快速模式:模型能以标准的2.5倍速度工作,价格只有此前版本快速模式的不到一半。

接下来看看Opus 4.8的实际能力。用更偏向开发者口径的话来说,衡量这类模型通常看几项指标:编程、智能体自主执行任务的能力、推理,以及完成实际知识工作的水平。Anthropic公布了与前代Opus模型以及其他模型的对比数据,更多细节和更全面的能力评估,都写在了Claude Opus 4.8系统卡里。

有意思的反馈来自它的早期协作者。这些测试者大多在搭建依赖智能体的产品,比如翻译、深度调研、幻灯片生成、数据分析等,他们总结的感受都比较具体,没停留在“能力变强”这样笼统的表述上。

第一个被反复提及的词是“判断力”。在Claude Code环境下,模型能提出合适的追问,能发现自己犯的错误。如果用户给了个不够完善的执行计划,它会拒绝照做。面对涉及多个服务模块的复杂探索任务,它会在动手做大规模改动前,先把前置逻辑理顺。一位测试者这样描述:“你明显感到它在建立信心,而不是匆忙给结论。”

在“超级智能体”基准测试里,Opus 4.8是唯一全程自己跑完每个案例的模型,不仅超越之前的Opus版本,在成本接近的前提下也超过了其它模型。对于那些需要把翻译、调研、幻灯片生成等任务串联起来的智能体产品,一致性的可靠性是刚需——因为只要其中一个环节断掉,整个流程就得人工介入重启。

在CursorBench评测中,Opus 4.8在所有算力投入等级上都优于前代Opus模型。这里的重点是工具调用效率明显提升:拿到同等程度的智能产出,模型现在需要的操作步数更少了。步数少,意味着系统资源消耗降低,链式依赖的出错概率也跟着下降。

法律科技领域的测试得分创下新高。在法律智能体基准测试上,Opus 4.8拿到最高分,并且是首个在全通过标准上超过10%总体得分的模型。这不是一个抽象的数字跃迁,它直接关系到客户能将多大比例的实质律师工作放心交给系统处理。因为法律文本不允许模棱两可的理解,哪怕准确率提升一个百分点,都对应着可量化的人员工时释放。

还有一条反馈关乎长时间协作的体验。测试者发现Opus 4.8比Opus 4.7更能承载长会话里的上下文和风格引导。在处理那些需要声音、品味和技术执行并行的任务时,他选择持续信任这个版本。这意味着模型在长链路交互中的稳定性得到了实际验证,而不是仅仅在短平快的问答场景里亮眼。

在计算机操作和浏览器智能体这类测试方向上,Opus 4.8的成绩是84%的在线场景得分,明显高于Opus 4.7和其他模型。测试者提到它在执行过程中保持反思、守在任务目标上的能力,这恰好是客户在部署端到端智能体工作流时最看重的特性:不需要人盯着,也能从头跑到尾不跑偏。

工程团队看重的是工具使用和指令执行的干净程度。在无人值守的自主工程负载中,模型不会随意猜测意图,也不会在多步骤之间存在漂移式的行为变化。这种一致性对自动化流程至关重要——任何一步的工具调用出错,都可能导致整个流水线停下来等人工修正。

把这些碎片拼在一起,Opus 4.8的更新思路是清晰的:不强求推理能力的跳跃式突破,而是把协作的可靠性、指令理解的一致性、工具调用的效率这些“工程化落地”的维度做扎实。对于开发者来说,这意味着更少的意外中断和更少的人工兜底操作。快速模式的价格下调,也是一个推动实际部署的信号。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
过气明星有多可怜?韦小宝韩栋无戏可拍,还不起房贷,当众哭红眼

过气明星有多可怜?韦小宝韩栋无戏可拍,还不起房贷,当众哭红眼

林轻吟
2026-05-27 08:04:39
炸裂!北京榜一大哥狂砸1700万,女主播美若天仙,聊天记录辣眼睛

炸裂!北京榜一大哥狂砸1700万,女主播美若天仙,聊天记录辣眼睛

小鋭有话说
2026-05-28 08:27:38
尼姑拿千年佛像鉴宝,专家直言是赝品,尼姑笑问:你可知贫尼是谁

尼姑拿千年佛像鉴宝,专家直言是赝品,尼姑笑问:你可知贫尼是谁

灿烂夏天
2025-03-27 16:48:30
景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

萌神木木
2026-05-27 11:42:30
河南中考新政:初中生7年直通本科,告别高考压力!

河南中考新政:初中生7年直通本科,告别高考压力!

辉哥说动漫
2026-05-28 13:29:30
货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

货车在南京一小区内超速撞击4岁幼童致重伤,奶奶为护孩子不幸身亡

大风新闻
2026-05-28 21:25:04
A股:紧急提醒2.5亿股民!从5月29日起,明天A股或将历史再次重演?

A股:紧急提醒2.5亿股民!从5月29日起,明天A股或将历史再次重演?

趋势清风侠
2026-05-28 18:20:07
仅一夜!湖人连裁10人,詹姆斯降薪或离队 下家黑马曝光 骑士慌了

仅一夜!湖人连裁10人,詹姆斯降薪或离队 下家黑马曝光 骑士慌了

老侃侃球
2026-05-28 14:56:29
越打越强?莫斯科全面限制私人飞行!乌克兰首次空袭加里宁格勒

越打越强?莫斯科全面限制私人飞行!乌克兰首次空袭加里宁格勒

项鹏飞
2026-05-26 17:51:41
西媒:B席加盟巴萨进度已完成90%,转会有望在世界杯前完成

西媒:B席加盟巴萨进度已完成90%,转会有望在世界杯前完成

懂球帝
2026-05-28 23:35:30
彻底社死!女子白嫖外卖出圈,海外播放量超2000万,已被公司处理

彻底社死!女子白嫖外卖出圈,海外播放量超2000万,已被公司处理

青梅侃史啊
2026-05-27 14:28:37
雷军沦陷了!回应武契奇总统买不起小米车,被批情商低,评论笑死

雷军沦陷了!回应武契奇总统买不起小米车,被批情商低,评论笑死

做一个合格的吃瓜群众
2026-05-27 15:18:42
接力爆涨!两大电力央企彻底火了!

接力爆涨!两大电力央企彻底火了!

格隆汇
2026-05-28 19:30:21
卡鲁索有望竞争西决MVP!名记:伊戈达拉FMVP剧情或重演

卡鲁索有望竞争西决MVP!名记:伊戈达拉FMVP剧情或重演

罗说NBA
2026-05-28 14:59:19
王晶没撒谎!8天塌房 大陆20年资源一夜清零的林志玲,印证他的话

王晶没撒谎!8天塌房 大陆20年资源一夜清零的林志玲,印证他的话

临云史策
2026-05-28 14:22:41
特朗普警告盟友阿曼:不守规矩会被炸飞

特朗普警告盟友阿曼:不守规矩会被炸飞

环球网资讯
2026-05-28 06:17:15
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

混沌录
2026-05-26 22:05:52
联合国还有存在的必要吗?当着100国的面,王毅外长提出五大方案

联合国还有存在的必要吗?当着100国的面,王毅外长提出五大方案

素衣读史
2026-05-28 21:36:16
人伦之乱,正在悄悄毁掉无数家庭!看完一身冷汗

人伦之乱,正在悄悄毁掉无数家庭!看完一身冷汗

三农老历
2026-05-08 19:20:12
同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

同济大学、中山大学等多所高校学者被举报涉嫌学术不端,有人被免职;科研人员:有些“大咖”太忙,甚至不清楚手下在做什么

每日经济新闻
2026-05-26 21:49:15
2026-05-29 02:32:49
闪存猎手
闪存猎手
全网蹲好价的野生捕手,算力与羊毛都不可辜负。
3975文章数 37关注度
往期回顾 全部

科技要闻

利润跌27%:快手只剩“可灵”这张牌?

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

头条要闻

男子疑遭家暴跳楼身亡 母亲:儿媳说"你不配活在世上"

体育要闻

唐斯经历的一切,此刻的他与尼克斯

娱乐要闻

林俊杰七七与大哥嫂子的瓜剪不断理还乱

财经要闻

小米仍需一次创业

汽车要闻

宋Ultra DM-i售12.99万起 选装天神之眼B承诺一年城市领航兜底

态度原创

本地
数码
艺术
时尚
公开课

本地新闻

用剪纸的方式,打开江苏扬州

数码要闻

宏碁推出Predator Atlas 8掌机:8" FHD+ 120Hz 500nits触屏

艺术要闻

2026陕西省青年美术作品展 入选油画

光脚、背“外卖盒”、羽毛头饰...早春秀谁赢了?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版