网易首页 > 网易号 > 正文 申请入驻

Anthropic"危险"AI实测:5个漏洞里4个是误报

0
分享至

AI安全审计工具正在经历一场信任危机。Anthropic内部将Claude Mythos模型评为"危险地出色"——它在发现软件漏洞方面展现出惊人的涌现能力,甚至因能力过强而被限制公开访问。这家公司声称,该模型在主流操作系统和浏览器中发现了数千个高危漏洞,仅向特定组织开放以协助修复关键缺陷。

但真正的考验来自一行行真实的代码。curl项目创始人Daniel Stenberg获得了一次难得的验证机会:让Mythos分析他维护了二十余年的17.6万行C代码。这个被全球数十亿设备调用的网络工具库,是开源社区最成熟、审查最严格的代码库之一。模型返回了五个"已确认的安全漏洞",听起来颇具说服力。


人工复核的结果却相当尴尬。五个发现中,四个是误报,唯一成立的仅是一个低严重性问题。这一落差揭示了AI安全工具的核心困境:它们能大规模扫描代码、标记潜在风险,但"信噪比"才是决定实用价值的关键变量。模型宣布的"已确认"漏洞,实际上是人工调查的起点,而非终点。


对正在将AI集成进安全流程的工程师而言,这一案例的启示在于重新定位工具的角色。这些模型本质是强大的模式匹配器,缺乏资深安全研究员所拥有的真实上下文和世界模型。它们会标记出形似已知漏洞模式的代码,即便惯用法或周边逻辑已使其无害化。Mythos这类模型的输出不是一份待修复的CVE清单,而是一份需要人类专家逐条验证的优先调查清单。

内部工具和工作流必须围绕这一认知重构。当AI标记潜在问题时,流程应将其视为待验证的断言,而非待修复的事实。一个典型的自动化报告可能包含漏洞ID、文件路径、行号、严重等级、CWE分类和置信度评分——但所有这些元数据都无法替代人工的最终判断。工程师需要建立"验证优先"的流水线:AI筛选缩小范围,人类专家完成定性。


这不是在否定AI安全工具的价值,而是在校准预期。Mythos在curl上的表现说明,当前技术尚无法实现全自动化的安全审计,但已能显著提升人工审计的效率。关键在于承认局限:模型的输出是信号,而非裁决。将这一认知嵌入工作流程,才是负责任地使用AI安全工具的前提。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
等了16年,0失误,41分!他终于摸到了总决赛的地板

等了16年,0失误,41分!他终于摸到了总决赛的地板

云隐南山
2026-05-13 17:29:16
U17国足VS沙特:4231最强出击,万项领衔前场进攻,海归新星冲锋

U17国足VS沙特:4231最强出击,万项领衔前场进攻,海归新星冲锋

零度眼看球
2026-05-14 06:46:02
俞浩没有汪滔的命

俞浩没有汪滔的命

钛媒体APP
2026-05-14 08:25:07
11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

11年前优衣库男女主现状曝光,他们还在一起生了两个孩子

半糖甜而不腻
2026-04-06 12:09:15
猝死的人越来越多?医生再次强调:宁可吃猪肉,也别做这6事

猝死的人越来越多?医生再次强调:宁可吃猪肉,也别做这6事

任医生聊健康
2026-05-14 10:09:56
《给阿嬷的情书》破亿,史上“最寒酸”赞助商赢麻了

《给阿嬷的情书》破亿,史上“最寒酸”赞助商赢麻了

首席品牌观察
2026-05-12 14:44:48
俄军苏57首开记录?乌军预警机刚到手没几天,就被“斩落马下”

俄军苏57首开记录?乌军预警机刚到手没几天,就被“斩落马下”

混沌录
2026-05-13 17:57:22
申请美签“邪修捷径”火了:大量OnlyFans成人片博主申请艺术家签证

申请美签“邪修捷径”火了:大量OnlyFans成人片博主申请艺术家签证

小星球探索
2026-05-13 14:59:00
到底什么意思?卢比奥随特朗普来北京,高志凯:中美双方都很聪明

到底什么意思?卢比奥随特朗普来北京,高志凯:中美双方都很聪明

一个有灵魂的作者
2026-05-14 08:34:46
8年前击败北大硕士,拿下诗词大会冠军的外卖大叔,如今过得怎样

8年前击败北大硕士,拿下诗词大会冠军的外卖大叔,如今过得怎样

从零到一研究所
2026-05-09 16:17:39
1.5亿根本不够!大巴黎全力争抢“小蜘蛛”,马竞强硬要价2亿欧!

1.5亿根本不够!大巴黎全力争抢“小蜘蛛”,马竞强硬要价2亿欧!

田先生篮球
2026-05-13 06:17:35
12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

12岁男孩确诊癌症晚期!研究证实:这5种添加剂正在升高癌症风险……

环球网资讯
2026-05-11 14:21:45
特朗普访华没带夫人,没给出具体原因!估计是她本人不愿随叫随到

特朗普访华没带夫人,没给出具体原因!估计是她本人不愿随叫随到

魔都姐姐杂谈
2026-05-13 21:49:17
美国本次访华人员包括国务卿鲁比奥

美国本次访华人员包括国务卿鲁比奥

名人苟或
2026-05-13 19:13:24
领导的网名叫上善若水,我该叫什么才能压他一头?

领导的网名叫上善若水,我该叫什么才能压他一头?

摩登人类
2026-05-11 19:43:02
宁夏恶魔,白天在谢晋电影里演好人,晚上回家当阎王,杀人喂狗!

宁夏恶魔,白天在谢晋电影里演好人,晚上回家当阎王,杀人喂狗!

莫地方
2026-05-14 00:55:03
太突然!香港80后“地产女王”烧炭身亡,曾向朋友发信息称要自杀!她草根出生,做过百亿级收购,生前已陷入严重财务困境

太突然!香港80后“地产女王”烧炭身亡,曾向朋友发信息称要自杀!她草根出生,做过百亿级收购,生前已陷入严重财务困境

每日经济新闻
2026-05-13 19:54:12
民营:不能永远带着原罪的镣铐前行

民营:不能永远带着原罪的镣铐前行

生命可以承受之轻
2026-05-12 08:50:45
阿联酋否认以色列总理访阿

阿联酋否认以色列总理访阿

新华社
2026-05-14 06:31:02
官宣!6月1日起车管所“下岗”?3.3亿车主迎来特大喜讯

官宣!6月1日起车管所“下岗”?3.3亿车主迎来特大喜讯

生活魔术专家
2026-05-13 18:49:27
2026-05-14 12:16:49
硬核玩家2哈
硬核玩家2哈
沉淀中,勿扰
2667文章数 13关注度
往期回顾 全部

科技要闻

马斯克:只有我和黄仁勋坐上了"空军一号"

头条要闻

媒体:特朗普开始访华 中方有一句话是说给全世界听的

头条要闻

媒体:特朗普开始访华 中方有一句话是说给全世界听的

体育要闻

哈登30+8+6创8纪录 第8次赢天王山

娱乐要闻

肖战提名金海燕奖,这一步走得太稳

财经要闻

片仔癀依旧困在“片仔癀”

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

健康
旅游
房产
数码
公开课

干细胞能让人“返老还童”吗

旅游要闻

河北游客来德州旅游被感动 写下2000字感谢信 为一座城点赞

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

数码要闻

索尼被内存涨价逼到墙角!PS6要从32GB猛砍至24GB:位宽也砍半

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版