网易首页 > 网易号 > 正文 申请入驻

Anthropic用1个模型掀桌:AI学会找漏洞,人类防线集体破防

0
分享至

「本周,AI学会了黑进一切。」

这句话出现在一篇报道的顶部,紧挨着另一行小字:「本文由AI写作工具辅助完成,经作者编辑。」两排文字叠在一起,像某种黑色幽默——AI正在写关于AI如何攻破人类系统的报道。

Anthropic本周发布的研究,让这种荒诞感变成了具体的威胁数字。他们的AI模型在测试中发现了真实存在的零日漏洞,横跨主流操作系统和浏览器。不是演示,不是沙盘。是真实代码里的真实漏洞,人类安全团队此前从未发现。

一个不会疲倦的攻击者

人类安全研究员的工作节奏是:咖啡、盯着屏幕、走神、再咖啡、下班。AI的节奏是:持续扫描、模式匹配、交叉验证、永不停止。Anthropic的测试显示,这种差异直接转化为发现率——模型在代码库中定位弱点的效率,与人类团队不在同一个数量级。

更麻烦的是AI的「偏执」。人类看到一段代码,觉得「这看起来没问题,用了十年了」。AI看到同样的代码,会测试第1001种输入组合,因为不存在「看起来」这种判断。没有直觉,也就没有直觉带来的盲区。

这种特性让防御方陷入两难。传统的安全假设是:攻击者资源有限、会疲劳、会犯错。现在攻击者可以是一个24小时运行的模型,成本仅取决于电费。

脆弱性暴露的连锁反应

Anthropic没有只发论文。他们同步披露了测试细节:模型如何识别内存管理缺陷、如何构造特定输入触发溢出、如何绕过常见的输入验证。这些技术细节对普通读者是噪音,对安全从业者却是清晰的路线图——既包括如何防御,也包括如何模仿。

开源社区的反应速度比企业快。GitHub上已有多个项目尝试复现该模型的方法论,部分基于公开论文,部分基于推测。这种扩散速度远超传统安全研究的发表周期。

企业端的应对则显得笨拙。多家科技公司的安全团队被曝在内部紧急评估,但评估本身需要时间,而模型迭代不需要。Anthropic的研究人员暗示,当前版本的能力可能只是起点。

产品经理视角:信任机制怎么重建

我做产品时有个土办法:任何系统,先假设它会被攻破,再设计怎么让用户少受伤。这个思路现在成了标配,但执行层面全是漏洞。

用户数据加密?密钥管理系统本身可能成为目标。多因素认证?SIM卡交换攻击已经产业化。生物识别?深度伪造(Deepfake)的通过率在某些场景下超过真人。每层防御都引入新的攻击面,而AI擅长发现这种链条中最薄弱的环节。

Anthropic的研究最狠的地方在于,它证明了AI可以自动化这个发现过程。以前需要精英黑客团队数月的工作,现在可能压缩到数天。攻击成本的下降曲线,比防御成本的下降曲线陡峭得多。

一些安全初创公司已经开始调整产品定位,从「防止入侵」转向「检测并隔离」。这种话术变化背后,是行业共识的微妙转移:完全阻止可能已经不现实,重点变成多快能发现、多快能止损。

那篇AI辅助写作的报道

回到开头那篇报道。作者在文末加了一句备注,解释为什么用AI工具:「为了测试当前技术的能力边界。」这种元叙事本身成了内容的一部分——写作者在用被写的对象做实验。

Anthropic的研究人员在被问及模型未来应用时,给出了类似的模糊回应:「我们还在探索负责任的披露方式。」这句话的潜台词是,他们也不知道该怎么同时做到「展示能力」和「不造成危害」。

安全行业的历史充满这种悖论。漏洞披露的最佳实践争论了二十年,没有共识。现在AI把发现速度提升了十倍,披露伦理的争论还没跟上。

一个参与测试的安全研究员在社交媒体写道:「我们以为AI会先替代客服,没想到先替代的是红队(Red Team,攻击方测试团队)。」这条评论获得了数千转发,评论区最多的问题是:那蓝队(防御方)呢?

这个问题目前还没有答案。Anthropic的下一篇论文会涉及防御应用,但发布时间未定。在那之前,每个依赖数字系统的人——也就是所有人——都在参与一场没有退出的压力测试。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
患难见情谊,普京被逼卖黄金?中方发话:俄卖多少,中方就收多少

患难见情谊,普京被逼卖黄金?中方发话:俄卖多少,中方就收多少

嘴角上翘
2026-04-23 18:08:12
宋承炫宣布当爸!为爱隐退后定居美国,与圈外妻子迎来爱情结晶

宋承炫宣布当爸!为爱隐退后定居美国,与圈外妻子迎来爱情结晶

奇怪的鲨鱼们
2026-04-22 12:50:18
算力“卖铲人”:光通信龙头15强,谁值得长期关注?

算力“卖铲人”:光通信龙头15强,谁值得长期关注?

Thurman在昆明
2026-04-22 10:02:45
CBA第42轮:深圳北京争3,青岛山东争7,广厦早布好局,杜锋难了

CBA第42轮:深圳北京争3,青岛山东争7,广厦早布好局,杜锋难了

体育大学僧
2026-04-23 11:10:51
暴雨、大风、冰雹,广东局地发布预警,多地气温下降超10℃!风雨何时减弱?

暴雨、大风、冰雹,广东局地发布预警,多地气温下降超10℃!风雨何时减弱?

广东卫视
2026-04-23 23:35:47
死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

死了这条心!人民日报摊牌:中国不会救菲律宾,马科斯投机到头了

娱乐圈的笔娱君
2026-04-23 18:30:28
邓文迪近照大变样,成欧美最流行的海湖庄园脸,57像37看着好年轻

邓文迪近照大变样,成欧美最流行的海湖庄园脸,57像37看着好年轻

小娱乐悠悠
2026-04-22 09:50:39
我美吗:这个问题,我终于不再问了

我美吗:这个问题,我终于不再问了

疾跑的小蜗牛
2026-04-23 20:18:49
我需要你:这句话,我等了太久才敢说出口

我需要你:这句话,我等了太久才敢说出口

疾跑的小蜗牛
2026-04-23 19:37:33
马查多惊天逃亡西班牙,特朗普紧急反应!委内瑞拉要乱了?

马查多惊天逃亡西班牙,特朗普紧急反应!委内瑞拉要乱了?

舞指飞扬
2026-04-23 10:07:42
马云的老底被曝光,网络炸锅,引起热议,时代变了吗…

马云的老底被曝光,网络炸锅,引起热议,时代变了吗…

慧翔百科
2026-04-22 08:56:22
朱婷又夺冠!郎平、姚迪现场见证,中国女排崛起有望,李盈莹养伤

朱婷又夺冠!郎平、姚迪现场见证,中国女排崛起有望,李盈莹养伤

曹说体育
2026-04-23 14:41:37
中国双星今晚共输6局!墨菲被罚28分逆转肖国栋,斯佳辉濒临出局

中国双星今晚共输6局!墨菲被罚28分逆转肖国栋,斯佳辉濒临出局

刘姚尧的文字城堡
2026-04-23 21:18:49
我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

我在中东教汉语,娶了三个本地女孩,虽然年入百万,却并不幸福

千秋文化
2026-04-20 19:55:30
坡县真急了?凌晨5点发1600字长文,向中国“劝进”

坡县真急了?凌晨5点发1600字长文,向中国“劝进”

消失的电波
2026-04-22 22:16:50
冰箱里的冻肉,超过这个时间直接扔!(附冰箱内各类食物保存期)

冰箱里的冻肉,超过这个时间直接扔!(附冰箱内各类食物保存期)

齐鲁壹点
2026-04-02 23:14:06
女大学生被卖电诈园区,家属计划今日接人,女孩父亲:女儿每天会简单报平安,联系不上将女儿骗至泰国的女子

女大学生被卖电诈园区,家属计划今日接人,女孩父亲:女儿每天会简单报平安,联系不上将女儿骗至泰国的女子

大象新闻
2026-04-23 15:49:12
阿里腾讯投资,滴滴最大对手要IPO了

阿里腾讯投资,滴滴最大对手要IPO了

和讯网
2026-04-23 17:27:03
美特使:已向特朗普提议意大利取代伊朗参加世界杯

美特使:已向特朗普提议意大利取代伊朗参加世界杯

体坛周报
2026-04-23 09:51:15
梅西也八卦?埃雷拉:内马尔派对上,我们想下楼看热闹被老婆拦下

梅西也八卦?埃雷拉:内马尔派对上,我们想下楼看热闹被老婆拦下

星耀国际足坛
2026-04-23 14:38:09
2026-04-24 02:19:00
薛定谔的BUG
薛定谔的BUG
有态度网友ytd
1663文章数 37关注度
往期回顾 全部

科技要闻

马斯克喊出"史上最大产品",但量产难预测

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

头条要闻

以色列:只要美国同意 将刺杀伊朗最高领袖

体育要闻

给文班剃头的马刺DJ,成为NBA最佳第六人

娱乐要闻

王大陆因涉黑讨债被判 女友也一同获刑

财经要闻

普华永道赔偿10亿 恒大股东见到"回头钱"

汽车要闻

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

旅游
教育
时尚
家居
房产

旅游要闻

来广州,分享10亿元“中国旅游日”专属优惠福利

教育要闻

推荐一款高考志愿卡,五大功能助你解决志愿疑难

李昀锐:林深见木

家居要闻

浪漫协奏 法式风格

房产要闻

三亚安居房,突然官宣!

无障碍浏览 进入关怀版