网易首页 > 网易号 > 正文 申请入驻

Anthropic Opus 4.8让查Bug成本打了两折,但别急着信

0
分享至

2026年3月4日,Anthropic在Claude Code中发布了Opus 4.8模型和ultracode模式。这个时间点很有意思——就在24小时前,SemiAnalysis刚发了一篇文章,标题是《寻找错误编译:有趣但不赚钱》。新版本看起来直接回应了那篇文章指出的核心经济问题:在AI生成的代码里找严重Bug,实在太贵了。

SemiAnalysis对新工作流做了初步实验,结论指向一个明确的改善方向。Opus 4.8配合ultracode模式,"在过滤低严重性Bug方面表现显著更好"。这类低危漏洞历来是自动化检测工具噪声的主要来源,占了大头却没什么实际价值。按照SemiAnalysis的估算,现在每找到一个中高危Bug的成本,大约是那篇文章中描述的老工作流的"五分之一,但误差范围非常大"。


这家机构特别强调了两点:误差范围极大,结果仍是初步的。但改善的方向与原文的结构性论证一致。那篇文章提出的核心判断是,AI辅助代码审查的瓶颈不在检测能力,而在分流判断。如果Opus 4.8能压下那些琐碎发现的"长尾",开发者看到有效信号的比例会大幅提升。这就像把收音机的噪音调低,真正重要的频道自然变得清晰。

这不是一次普通的模型升级。Anthropic在SemiAnalysis文章发出24小时后就跟进发布,速度之快至少说明两种可能:要么相关能力已在测试中,时机刚好凑巧;要么Anthropic现在调整了发布节奏,专门针对实际成本指标来做回应,而不是盯着基准测试的分数跑分。

SemiAnalysis没有披露ultracode模式的具体机制,也没有说明Opus 4.8的架构变化。题图的发布说明和博客文章截至实验时都还没公开。但有一点已经清晰了:新系统改变了成本曲线。如果那个"五分之一"的改善能在严格测量下站住脚,每个可落地的有效Bug发现成本将从大约2到5美元,降至0.4到1美元。

接下来值得关注的,是Anthropic会怎么解释Opus 4.8和ultracode模式的工作原理。改善点究竟发生在模型的分类头、Claude Code的自主运行循环,还是两者兼有,这些细节将决定这波改进的牢固程度。另外,Curs的独立复现结果同样值得等待,因为单一一家的"初步实验"还不足以支撑结论。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
珠峰一半在中国,一半在尼泊尔,为何全世界都默认是中国领地?

珠峰一半在中国,一半在尼泊尔,为何全世界都默认是中国领地?

抽象派大师
2026-06-01 02:00:38
金饰克价已大降300元

金饰克价已大降300元

界面新闻
2026-06-02 22:38:43
22岁男子入室杀害前女友,曾称“你不过是长得漂亮,你凭啥?”

22岁男子入室杀害前女友,曾称“你不过是长得漂亮,你凭啥?”

中国新闻周刊
2026-06-02 18:00:54
乐子大了!日菲联合划界,中国顺势管控台海全域

乐子大了!日菲联合划界,中国顺势管控台海全域

超级学爸蛋总
2026-06-02 20:01:39
罗马诺爆料!皇马2大重磅官宣,签5000万铁卫、2500万飞翼敲定?

罗马诺爆料!皇马2大重磅官宣,签5000万铁卫、2500万飞翼敲定?

阿纂看事
2026-06-03 17:40:04
5个月过去,委内瑞拉拒绝搞选举,马杜罗之子声称:只想歇口气!

5个月过去,委内瑞拉拒绝搞选举,马杜罗之子声称:只想歇口气!

观史搜寻着
2026-06-02 23:07:34
王皓最新揭秘:梁靖崑打张本智和之前,我在房间问了他三个问题

王皓最新揭秘:梁靖崑打张本智和之前,我在房间问了他三个问题

借你一生
2026-06-03 09:21:37
最多3年2.07亿!这是步行者给西亚卡姆的全部,能否续约已有答案

最多3年2.07亿!这是步行者给西亚卡姆的全部,能否续约已有答案

奕辰说球
2026-06-03 09:44:45
为了讨好西方不顾民众死活!俄议长公开警告,亚美尼亚代价惨痛

为了讨好西方不顾民众死活!俄议长公开警告,亚美尼亚代价惨痛

风流女汉
2026-06-03 19:03:28
花费2600万整容的日本模特公开整容前后的对比照片,引热议

花费2600万整容的日本模特公开整容前后的对比照片,引热议

随波荡漾的漂流瓶
2026-06-03 17:30:30
刘少奇之子刘源身陷困境求助宋庆龄,九字回复令他动容

刘少奇之子刘源身陷困境求助宋庆龄,九字回复令他动容

唠叨说历史
2026-05-29 14:16:53
正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

正常人可以偶尔偷吃一颗伟哥吗?有什么副作用?本文为你讲出实情

健康科普365
2026-05-09 21:05:04
“碳水脸”引争议,网友:令人不适的网络词!

“碳水脸”引争议,网友:令人不适的网络词!

中国日报
2026-05-21 15:28:00
41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

路医生健康科普
2026-06-03 16:36:08
哈佛教授曾给中美关系支招:中国要是害怕,可以学学北宋澶渊之盟

哈佛教授曾给中美关系支招:中国要是害怕,可以学学北宋澶渊之盟

观史搜寻着
2026-06-03 11:01:04
成都高温持续 热热热晒晒晒

成都高温持续 热热热晒晒晒

掌上金牛
2026-06-03 16:59:30
伤病猛于虎!10大巨星无缘世界杯,巴西3人缺席,荷兰真核伤退

伤病猛于虎!10大巨星无缘世界杯,巴西3人缺席,荷兰真核伤退

奥拜尔
2026-06-03 13:19:25
被特朗普怒斥后内塔尼亚胡强硬表态

被特朗普怒斥后内塔尼亚胡强硬表态

财联社
2026-06-02 17:14:20
英伟达薪资曝光:最贵的不是AI研究员,基本工资200万/年的扎堆

英伟达薪资曝光:最贵的不是AI研究员,基本工资200万/年的扎堆

量子位
2026-06-02 19:14:43
俄顶级战略精英大胆预测,中美争锋的最终结果,6年后就会揭晓

俄顶级战略精英大胆预测,中美争锋的最终结果,6年后就会揭晓

深析古今
2026-05-31 19:32:20
2026-06-03 19:52:49
赛博兰博
赛博兰博
专注捣鼓AI效率工具,试图在这个时代留下数字分身的探索者。
4511文章数 50关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

民警驾车致1死1残获刑1年2个月 女伤者刚试管有了胚胎

头条要闻

民警驾车致1死1残获刑1年2个月 女伤者刚试管有了胚胎

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

健康
房产
教育
公开课
军事航空

违规干细胞抗衰美容,为何肆无忌惮

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

教育要闻

26年高考报名人数1290万!比去年少45万,大学会更好考?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版