网易首页 > 网易号 > 正文 申请入驻

刚刚,Anthropic深夜血洗500亿美金行业!代码审计末日来了

0
分享至


新智元报道

编辑:Aeneas KIngHZ

【新智元导读】刚刚,全球AI圈地震了:Anthropic的一个新功能,直接干掉了价值500亿美元的传统代码审计行业!年费5万美元的传统安全厂商,现在直接被一锅端掉,新工具最低只要15美金。

就在刚刚,Anthropic又出手了!

Claude Code之父重磅官宣:Claude Code新增代码评审(Code Review)新功能。


这一次,它瞄准了一个价值500亿美元的产业——代码安全审计。

Anthropic刚刚发布的新功能,可以说是在用极其简单粗暴的方式,直接挑战整个代码安全行业。

有人惊呼:价值500亿美元的行业,被Anthropic一夜干翻了!

现在,可以坐等安全股大跌了。


在Anthropic,几乎每个PR都测试了此系统。

经过数月的测试,结果如下:

  • 包含实质性评审意见的PR比例从16%增加到54%。

  • 工程师认为评审结果错误的比例不到1%。

  • 在大型Pull Request(1000行以上)中,84%的PR存在表面问题,平均每份PR存在7.5个问题。

目前,该功能已给Claude Team和Enterprise测试版中作为研究预览上线。


500亿美金市场的噩梦

Anthropic的这个产品,简直是让全球AI圈和网络安全界(AppSec)发生了一场足以载入史册的大地震。

资深开发者纷纷惊呼,价值500亿的代码审计行业被端了!

这是因为,在过去,大公司为了防止代码里的Bug或安全漏洞流向生产环境,每年要支付给传统安全厂商(如Snyk、Checkmarx 等)高达5万美金甚至更高的授权费,雇佣专业团队进行扫描和审计。

而现在,Claude却可以直接派一队AI智能体潜伏在你的PR里,24小时待命。

而且,按token计算,它的单次Review成本,平均只要15-25美元!

5万美金和25美金,差了2000倍。

这根本不是功能更新,这是给传统代码审计吹响了终结的号角。




Code Review,开发者最痛苦的环节

如果你问一个任何一个工程团队:软件开发中最大的瓶颈环节,是哪一个?

相信很多人的答案,都是代码评审(Code Review)。

过去几年,AI写代码的能力是日新月异,突飞猛进,无论是GitHub Copilot、Cursor、Claude Code还是ChatGPT,用上这些工具的开发者,写出的代码量直接暴涨。

结果,问题来了——虽然代码被飞速产出,审代码的人却并没有变多。

Anthropic发现,过去一年里,每位工程师的代码产出增加了200%,但很多PR(Pull Request)只是被快速扫了一眼。

连开发者自己都承认,很多代码评审,不过是在走流程而已。

于是,大量Bug、漏洞、逻辑问题就这样被带进生产环境。

这也就是为什么,很多企业愿意花天价去买安全扫描工具。

然而问题来了——这些工具并不聪明。

传统代码扫描工具,到底有什么问题?

如果你用过传统AppSec工具,比如Snyk、Checkmarx、Veracode、SonarQube等,你大概率会有这样的感受:误报太多了。

原因在于,这些工具大多数基于静态规则和已知漏洞库,可以扫描代码,却无法真正理解代码。

经常发生的一个场景,就是工具提醒「可能有SQL注入风险」,开发者检查了半天,却发现没有问题。

于是大家慢慢开始忽略警告,而真正危险的问题,就往往被忽略过去。

因此,企业仍然需要大量人工Code Review,而Anthropic这次做的,就是把它自动化。

Anthropic,扔出一个AI代码评审军团

这一次,Claude Code Review的思路其实很简单。

在Claude Code中,系统可以自动分析Pull Request,并从多个角度进行检查,例如:

  • 代码规范是否符合项目规则

  • 是否存在潜在bug

  • 修改是否与历史代码逻辑冲突

  • 之前PR中提出的问题是否再次出现

最终,它们会输出两个结果:一个高信号总结评论,和一个具体代码位置的inline评论。

也就是说,你打开PR时,就能看到一份AI评审报告,看到真正重要的问题,而不是几十页的流水账。

「AI写代码,AI评审」的时代,终于还是来了。


Claude自我循环、自我递归,苗头出现了。




随着AI能力日益强大,以后人类唯一的作用可能就是打开AI开关了,键盘上只需要Claude按键了。


多Agent系统,Claude Code评审军团出动

Claude Code Review最大的特点就是,它不是一个AI,而是一个团队。

当一个PR被创建时,系统会自动启动一支AI Agent团队。

据介绍,Claude新的代码评审功能会派出多个AI「评审智能体」并行工作,每个智能体负责不同类型的检查。


这些智能体通过验证来过滤误报,并根据严重性对错误进行排序。最终结果会作为一条高信号的综合评语,以及针对特定错误的内联评论,呈现在PR上。

评审规模会随PR大小调整。

大型或复杂的变更会获得更多智能体和更深入的审阅;微小的变更则会快速通过。根据Anthropic的测试,平均评审时间约为20分钟。

最终,通过多Agent相互验证,就可以减少误报。

这个过程中,它会重点查找逻辑错误、安全漏洞、边界条件(edge case)缺陷和隐蔽的回归问题。

所有发现的问题都会按严重等级(severity)标记。


  • 红色圆点表示普通问题,即合并代码前应修复的bug;

  • 黄色圆点表示轻微问题,建议修复,但不会阻止合并;

  • 紫色圆点表示既存问题,非本次PR引入的bug。

每条评审评论还包含一个可折叠的推理说明(extended reasoning)

展开后,你可以看到:

  • Claude 为什么标记该问题

  • 它是如何验证这个问题确实存在的


需要注意的是,这些评论不会自动批准或阻止PR合并,因此不会破坏现有的代码评审流程.

默认情况下,Claude Code Review主要关注代码正确性(correctness)

也就是说,它重点检查:

  • 会导致生产环境故障的bug

  • 实际逻辑问题

而不会重点关注代码格式、风格偏好、是否缺少测试等问题。

如果希望扩展检查范围,需要用户进行配置。

内部测试结果,堪称恐怖

Anthropic的内部测试结果,堪称恐怖!也更加证明了,传统的代码评审,基本就是个笑话。

内部数据实在是触目惊心:只有16%的PR获得了实质性的评审意见。

在1000行以上的大型PR中,84%的代码都被它揪出了问题,平均每个PR抓到7.5个Bug。

为什么?原因就是,工程师太忙了。

Anthropic在过去一年里,每个工程师的代码产出增长了200%。代码越来越多,谁还有功夫一行一行细看?

而在实施该功能后,代码库中有实质性修复建议的PR比例,从16%暴涨到了54%。

这意味着,以前有近40%的潜在屎山代码,是在人类程序员眼皮子底下溜过去的,而现在,它们全被Claude揪了出来。

更恐怖的是小于50行的小PR,从前大家觉得,就这么几行,能有什么问题。

结果,其中的31%都被发现了问题,每三个小改动,就有一个藏着bug。

而那些被揪出来的问题,工程师的的认可度直接达到99%以上!只有不到1%的结果,被工程师标记为误报。

这个准确率,已经超过了绝大多数人类reviewer。


Anthropic举了自己内部的一个例子:对一个生产服务的一行代码更改,看起来是常规操作,属于通常会快速获得批准的差异。但代码评审将其标记为严重问题。

该更改会导致身份验证失效,这种故障模式在差异对比中容易被忽略,但一经指出就非常明显。

该问题在合并前得到了修复,工程师事后表示,他们自己可能不会发现这个问题。

再讲一个真实案例。

iXsystems,一家做TrueNAS的公司,在用Code Review评审了一个ZFS加密相关的代码重构。

这是一个很深度的技术改动,review的人都是这个领域的专家。

结果,Code Review干了一件让所有人意外的事:它在「相邻代码」里发现了一个潜在的bug。


PR链接:https://github.com/truenas/middleware/pull/18291

那个bug不在这次改动的核心范围,只是代码「恰好被改动涉及到了」。这个类型不匹配的问题,会导致每次同步时悄悄擦除加密密钥缓存。

这是一个隐藏了很久很久的bug,一直在那里,只是没人发现。

人类专家几乎不可能发现,因为它不在diff里,不是要关注的重点,但说不定某一天,它就会炸掉你的系统。

但是,现在Code Review一下子将它揪出。

行业大洗牌,来了

现在,安全公司和SaaS厂商都在哀嚎。

每年收5万美金的代码安全公司,还能活多久?

不是它们的技术不好,而是商业逻辑变了。

如果Anthropic可以用智能体团队,花20美元就能解决深度的业务逻辑安全审计,谁还会去买那些动辄几万美金、误报率还高得离谱的传统扫描器?

如果你还在手动Review几千行代码,或者还在为高昂的安全审计费买单,醒醒吧,时代变了。

今夜,AppSec行业的股票,可能真的要感受一下AI的寒意了。

参考资料:

https://x.com/claudeai/status/2031088171262554195

https://claude.com/blog/code-review

https://x.com/cryptopunk7213/status/2031094411635896594

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
惊天内幕!1984年中美黑鹰交易只交付24架,真相竟是战略失误!

惊天内幕!1984年中美黑鹰交易只交付24架,真相竟是战略失误!

人生录
2026-04-25 15:13:17
网友拿光明会成立250周年来质疑华晨宇,粉丝被气得不行

网友拿光明会成立250周年来质疑华晨宇,粉丝被气得不行

映射生活的身影
2026-04-25 18:10:22
25万吨!美国对华封锁打响,解放军在南海集结世界最强航母战斗群

25万吨!美国对华封锁打响,解放军在南海集结世界最强航母战斗群

军机Talk
2026-04-24 17:32:10
钱学森夫人蒋英的罕见照片,美的不可方物

钱学森夫人蒋英的罕见照片,美的不可方物

黎庶文史
2026-04-25 22:56:52
死了这条心!人民日报表态:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报表态:中国不会救菲律宾,马科斯投机到头了

风干迷茫人
2026-04-24 16:01:23
太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

太惨了!燃油车再迎大降价:最大跌幅50%,豪华车带头“跳水”

沙雕小琳琳
2026-04-23 02:29:16
为啥末代皇帝往往是昏君 看网友分析 思想境界都上了一个大台阶

为啥末代皇帝往往是昏君 看网友分析 思想境界都上了一个大台阶

侃神评故事
2026-04-23 15:40:03
太着急了,王钰栋两次表达不满都被镜头捕捉到

太着急了,王钰栋两次表达不满都被镜头捕捉到

懂球帝
2026-04-25 21:40:47
国产镜头把"专业级"干到1699元

国产镜头把"专业级"干到1699元

码上闲叙
2026-04-24 10:02:54
詹皇29+13+6无缘今日最佳,申京33+16也落选,只因塔图姆刷爆纪录

詹皇29+13+6无缘今日最佳,申京33+16也落选,只因塔图姆刷爆纪录

你的篮球频道
2026-04-25 13:33:54
骗了全世界17年!保镖临终日记揭开迈克杰克逊死前最凄凉的真相

骗了全世界17年!保镖临终日记揭开迈克杰克逊死前最凄凉的真相

自说自话的总裁
2026-04-24 17:23:51
演员脱掉和服才向观众鞠躬致谢,本人回应:撕掉这层皮,做回真真正正中国人

演员脱掉和服才向观众鞠躬致谢,本人回应:撕掉这层皮,做回真真正正中国人

台州交通广播
2026-04-23 22:50:01
特斯拉中国:官方版扩展坞上架了,售价 249 元!

特斯拉中国:官方版扩展坞上架了,售价 249 元!

新浪财经
2026-04-25 15:53:30
建国后外逃级别最高的贪官!至今未落网,23年来逃跑方式仍是谜

建国后外逃级别最高的贪官!至今未落网,23年来逃跑方式仍是谜

铁血江湖人
2026-04-23 22:21:26
特斯拉将迎来重磅更新,太猛了!

特斯拉将迎来重磅更新,太猛了!

花果科技
2026-04-23 15:08:15
美国人终于清醒了,质问:特朗普女婿库什纳有什么资格去谈判?

美国人终于清醒了,质问:特朗普女婿库什纳有什么资格去谈判?

混沌录
2026-04-23 17:11:07
芯片观察者:美国先将中国芯片锁死在28nm,然后打击成熟芯片扩产

芯片观察者:美国先将中国芯片锁死在28nm,然后打击成熟芯片扩产

蜉蝣说
2026-04-24 11:38:51
5倍大牛股 宣布将“戴帽”, DeepSeek概念股称可能“戴帽”

5倍大牛股 宣布将“戴帽”, DeepSeek概念股称可能“戴帽”

每日经济新闻
2026-04-25 12:22:54
四川成都一小区火灾致5死2伤,深圳电动车早就不能进楼栋了

四川成都一小区火灾致5死2伤,深圳电动车早就不能进楼栋了

九方鱼论
2026-04-25 14:29:53
“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

“骨盆前倾成这样,还不去医院?”家长晒一年级女儿体态,被群嘲

妍妍教育日记
2026-04-24 11:15:25
2026-04-25 23:47:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15062文章数 66804关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

头条要闻

媒体:美军在中东罕见高密度集结 伊朗开始调整战术

体育要闻

那一刻开始,两支球队的命运悄然改变了

娱乐要闻

《我们的爸爸2》第一季完美爸爸翻车了

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

艺术
时尚
手机
公开课
军事航空

艺术要闻

蓬皮杜中心的韩国分馆,6月4日开幕!

这些穿搭适合春天!外套彩色内搭白色、裤子穿基础款,舒适大方

手机要闻

最新手机市场份额出炉:华为断层第一,小米荣耀压力山大!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美防长:战事不会“没完没了”

无障碍浏览 进入关怀版