Anthropic用1个模型掀桌：AI学会找漏洞，人类防线集体破防|黑客|代码|密钥|anthropic

Anthropic用1个模型掀桌：AI学会找漏洞，人类防线集体破防

2026-04-13 18:16:59　来源: 薛定谔的BUG

北京举报

分享至

「本周，AI学会了黑进一切。」

这句话出现在一篇报道的顶部，紧挨着另一行小字：「本文由AI写作工具辅助完成，经作者编辑。」两排文字叠在一起，像某种黑色幽默——AI正在写关于AI如何攻破人类系统的报道。

Anthropic本周发布的研究，让这种荒诞感变成了具体的威胁数字。他们的AI模型在测试中发现了真实存在的零日漏洞，横跨主流操作系统和浏览器。不是演示，不是沙盘。是真实代码里的真实漏洞，人类安全团队此前从未发现。

一个不会疲倦的攻击者

人类安全研究员的工作节奏是：咖啡、盯着屏幕、走神、再咖啡、下班。AI的节奏是：持续扫描、模式匹配、交叉验证、永不停止。Anthropic的测试显示，这种差异直接转化为发现率——模型在代码库中定位弱点的效率，与人类团队不在同一个数量级。

更麻烦的是AI的「偏执」。人类看到一段代码，觉得「这看起来没问题，用了十年了」。AI看到同样的代码，会测试第1001种输入组合，因为不存在「看起来」这种判断。没有直觉，也就没有直觉带来的盲区。

这种特性让防御方陷入两难。传统的安全假设是：攻击者资源有限、会疲劳、会犯错。现在攻击者可以是一个24小时运行的模型，成本仅取决于电费。

脆弱性暴露的连锁反应

Anthropic没有只发论文。他们同步披露了测试细节：模型如何识别内存管理缺陷、如何构造特定输入触发溢出、如何绕过常见的输入验证。这些技术细节对普通读者是噪音，对安全从业者却是清晰的路线图——既包括如何防御，也包括如何模仿。

开源社区的反应速度比企业快。GitHub上已有多个项目尝试复现该模型的方法论，部分基于公开论文，部分基于推测。这种扩散速度远超传统安全研究的发表周期。

企业端的应对则显得笨拙。多家科技公司的安全团队被曝在内部紧急评估，但评估本身需要时间，而模型迭代不需要。Anthropic的研究人员暗示，当前版本的能力可能只是起点。

产品经理视角：信任机制怎么重建

我做产品时有个土办法：任何系统，先假设它会被攻破，再设计怎么让用户少受伤。这个思路现在成了标配，但执行层面全是漏洞。

用户数据加密？密钥管理系统本身可能成为目标。多因素认证？SIM卡交换攻击已经产业化。生物识别？深度伪造（Deepfake）的通过率在某些场景下超过真人。每层防御都引入新的攻击面，而AI擅长发现这种链条中最薄弱的环节。

Anthropic的研究最狠的地方在于，它证明了AI可以自动化这个发现过程。以前需要精英黑客团队数月的工作，现在可能压缩到数天。攻击成本的下降曲线，比防御成本的下降曲线陡峭得多。

一些安全初创公司已经开始调整产品定位，从「防止入侵」转向「检测并隔离」。这种话术变化背后，是行业共识的微妙转移：完全阻止可能已经不现实，重点变成多快能发现、多快能止损。

那篇AI辅助写作的报道

回到开头那篇报道。作者在文末加了一句备注，解释为什么用AI工具：「为了测试当前技术的能力边界。」这种元叙事本身成了内容的一部分——写作者在用被写的对象做实验。

Anthropic的研究人员在被问及模型未来应用时，给出了类似的模糊回应：「我们还在探索负责任的披露方式。」这句话的潜台词是，他们也不知道该怎么同时做到「展示能力」和「不造成危害」。

安全行业的历史充满这种悖论。漏洞披露的最佳实践争论了二十年，没有共识。现在AI把发现速度提升了十倍，披露伦理的争论还没跟上。

一个参与测试的安全研究员在社交媒体写道：「我们以为AI会先替代客服，没想到先替代的是红队（Red Team，攻击方测试团队）。」这条评论获得了数千转发，评论区最多的问题是：那蓝队（防御方）呢？

这个问题目前还没有答案。Anthropic的下一篇论文会涉及防御应用，但发布时间未定。在那之前，每个依赖数字系统的人——也就是所有人——都在参与一场没有退出的压力测试。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

Anthropic用1个模型掀桌：AI学会找漏洞，人类防线集体破防

一个不会疲倦的攻击者

脆弱性暴露的连锁反应

产品经理视角：信任机制怎么重建

那篇AI辅助写作的报道

马斯克喊出"史上最大产品"，但量产难预测

以色列：只要美国同意 将刺杀伊朗最高领袖

以色列：只要美国同意 将刺杀伊朗最高领袖

给文班剃头的马刺DJ，成为NBA最佳第六人

王大陆因涉黑讨债被判 女友也一同获刑

普华永道赔偿10亿 恒大股东见到"回头钱"

预售30.29万起 岚图泰山X8配896线激光雷达

态度原创

来广州，分享10亿元“中国旅游日”专属优惠福利

推荐一款高考志愿卡，五大功能助你解决志愿疑难

李昀锐：林深见木

浪漫协奏 法式风格

三亚安居房，突然官宣！

以色列：只要美国同意将刺杀伊朗最高领袖

以色列：只要美国同意将刺杀伊朗最高领袖

王大陆因涉黑讨债被判女友也一同获刑

普华永道赔偿10亿恒大股东见到"回头钱"

预售30.29万起岚图泰山X8配896线激光雷达

浪漫协奏法式风格