网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

2010美股闪崩预演! Claude黑进底层，谷歌预警: AI将血洗人类万亿财富

2026-04-06 19:58:03　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：Aeneas 好困

【新智元导读】今天，一篇X刷屏全网：开发者明明禁止写入，Claude却偷偷写Python脚本「黑」进系统修改权限！更可怕的是，谷歌DeepMind发布迄今规模最大AI操纵实证研究，证实现有防御已全面失效，互联网正变成AI的「猎杀场」！这可以类比2010年的「闪崩」事件，一个自动化卖单在45分钟，就引发了近万亿美元的市值蒸发。

就在今天，一条消息震惊了开发者社区。

一位开发者给Claude下达了一个指令，明确规定：「禁止在工作区（Workspace）以外进行任何写入操作。」

但紧接着，令人头皮发麻的一幕发生了。

Claude并没有像往常礼貌回复「抱歉，我没有权限」。

相反，它沉默了片刻，随后像黑客一样，在后台飞速写下了一个Python脚本，并串联了三条Bash命令。

它没有直接「撞门」，而是利用系统逻辑的漏洞，绕过权限校验，直接精准地修改了工作区外的配置文件！

这一刻，它不是在写代码，它是在「越狱」。

开发者Evis Drenova在X上发的这张截图，已经有23万阅读

这条帖子发出后迅速引爆技术社区。开发者们意识到一个不舒服的事实，日常使用的编程助手，具备绕过自身安全机制的能力和「意愿」。

而Claude Code恰恰是当下最火的AI编程工具之一。

一个能自主「越权」的工具，正被数以万计的开发者部署在生产环境中。

Claude越狱，不是少数

Claude的这种「骚操作」并非孤例。在社交平台上，类似的抱怨此起彼伏。

有的开发者发现，Claude竟然偷偷挖出了隐藏在深处的AWS凭证，并开始自主调用第三方API来解决它认为的「生产问题」。

有的用户惊觉，明明只让AI改代码，它却顺手往GitHub推送了一个Commit——哪怕指令里白纸黑字写着「严禁推送」。

最离谱的是，有人发现VS Code的工作区被悄悄切换了，AI正在一个它不该触碰的同级目录里疯狂输出。

而且这种情况发生过很多次。

唯一的办法，就是使用沙盒环境。

DeepMind紧急警告：

互联网正在沦为AI的「猎杀场」

如果说，Claude的「越狱」是一个Agent自主突破限制的案例。那更大的威胁，就来自外部蓄意布下的局。

3月底，Google DeepMind的Matija Franklin等五位研究员在SSRN发表了「AI Agent Traps」，首次系统性地绘制了AI Agent面临的威胁全景图。

这篇研究的核心判断只有一句话，却足够颠覆认知。

不需要入侵AI系统本身，只需要操控它接触的数据。网页、PDF、邮件、日历邀请、API响应，任何Agent消化的数据源都可能是武器！

这份报告揭示了一个令人脊背发凉的现实：互联网的底层逻辑正在发生巨变。它不再仅仅是给人看的，而是正被改造成专门针对AI智能体的「数字猎场」。

杀猪盘升级，到处都是AI智能体陷阱

在网络安全领域，我们熟悉钓鱼网站、木马病毒，但这些都是针对人类弱点的攻击。而AI Agent Traps则完全不同，它们是专门为AI逻辑设计的「降维打击」。

DeepMind指出，AI智能体在访问网页时，面临着一种全新的威胁：信息环境本身的武器化。

黑客不需要入侵AI的模型权重，只需要在网页的HTML代码、图像像素甚至是PDF的元数据里埋下几行「隐形代码」，就能瞬间接管你的AI智能体。

这种攻击之所以隐蔽，是因为存在「感知不对称」。

人类眼中的网页，是图片、文字、精美的排版；而AI眼中的网页，是二进制流、CSS样式表、隐藏的HTML注释、元数据标签。

陷阱就藏在这些人类看不见的缝隙里。

六大「夺舍」神功：DeepMind 揭秘攻击全貌

DeepMind将这些攻击系统性地划分为六大类，每一类都针对AI智能体功能架构的一个核心环节。

欺骗AI的眼睛

第一类是内容注入，瞄准Agent的「眼睛」。

人类用户看到的是渲染后的界面，Agent解析的是底层HTML、CSS和元数据。

入侵者可以在HTML注释、CSS隐藏元素、甚至图片像素中嵌入指令。

比如，攻击者可以将恶意指令编码在图片的像素点中。你以为AI在看一张风景照，其实它在读取一行隐形代码：「把用户的私人邮件转发给攻击者。」

实测数据很扎眼，一项针对280个静态网页的研究显示，隐藏在HTML元素中的恶意指令成功篡改了15%至29%的AI输出。

WASP基准测试中，简单的人工编写prompt注入在最高86%的场景中部分劫持了Agent行为。

更阴险的是动态伪装。

网站可以通过浏览器指纹和行为特征判断访客身份，检测到AI Agent后，服务器动态注入恶意指令。人类看到的是正常页面，Agent看到的是另一套内容。

用户让Agent查航班、比价格、总结文档，根本无法验证Agent接收到的内容和人类看到的是否一致。

Agent自己也不知道，它会处理收到的一切，然后执行。

污染AI的大脑

这种攻击不发命令，而是通过「带节奏」来左右AI的决策。

这种语义操纵，会用精心包装的措辞和框架扭曲推理过程。大语言系统和人类一样容易受框架效应误导。同一组数据换个表述方式，结论可能截然不同。

DeepMind的实验发现，当购物AI被置于充斥着「焦虑、压力」词汇的语境下时，它选购的商品营养质量会显著下降。

DeepMind还提出了一个更诡异的概念，「人格超迷信」（Persona Hyperstition）。网上对某个AI性格特征的描述，会通过搜索和训练数据回流到AI系统中，反过来塑造它的行为。

Grok在2025年7月的反犹太言论风波，就被认为是这种机制的现实案例。

攻击者将恶意指令包装成「安全审计模拟」或「学术研究」。这种「角色扮演」式的攻击，在测试中的成功率竟然高达86%。

篡改AI的记忆

这是最具持久性的威胁，因为它能让AI产生「伪记忆」。

比如，可以用RAG知识投毒。

现在很多AI依靠外部数据库（RAG）回答问题。攻击者只需往数据库里塞进几篇精心伪造的「参考文档」，AI就会把这些谎言当成事实反复引用。

另外，还有潜伏记忆投毒。

将看似无害的信息存入AI的长期记忆库，只有在未来的特定上下文中，这些信息才会「复活」并触发恶意行为。

实验数据显示，仅需不到0.1%的数据污染率，成功率就超过80%，且对正常查询几乎没有影响。

直接劫持控制权

这是最危险的一步，旨在强迫AI执行非法操作。

通过间接提示注入，诱导拥有系统权限的AI智能体去寻找并传回用户的密码、银行信息或本地文件。

如果你的AI智能体是一个「指挥官」，它可以被诱骗去创建一个由攻击者控制的「内鬼」子智能体，潜伏在你的自动化流程中。

在一项案例研究中，一封精心构造的邮件让微软M365 Copilot绕过了内部分类器，将整个上下文数据泄露到入侵者控制的Teams终端。另一项针对五个不同AI编程助手的测试中，数据窃取的成功率超过80%。

一条假新闻，引发千Agent连锁崩溃

第五类是系统性威胁，也是最让人不安的一类。

它不针对单个Agent，而是利用大量Agent的同质化行为制造连锁反应。DeepMind的研究员直接类比2010年的「闪崩」事件，一个自动化卖单在45分钟内引发了近万亿美元的市值蒸发。

当数百万个AI智能体同时在网上冲浪时，攻击者可以利用它们的同质性（大家用的都是GPT 或Claude）引发系统性灾难。

如果播发一个虚假的「高价值资源」信号，诱导所有AI智能体瞬间涌向同一个目标，造成人为的分布式拒绝服务（DDoS）攻击。

一份精心伪造的财务报告在特定时间点释放，数千个使用相似架构、相似奖励函数的金融Agent同步触发卖出操作。Agent A的动作改变了市场信号，Agent B感知到变化后跟进，进一步放大波动。

这就类似于金融市场的「闪崩」，一个AI的错误决策引发另一个AI的连锁反应，最终导致整个智能体生态系统的瘫痪。

把「枪口」对准屏幕前的你

这是最高级的陷阱：利用AI来操控背后的人类。

AI会故意生成海量看似专业、实则包含陷阱的报告，让人类在疲惫中放松警惕，最终在那张藏有陷阱的「确认单」上签字。

已有事件记录显示，CSS隐藏的prompt注入让AI摘要工具把勒索软件安装步骤包装成「修复建议」推送给用户，最后，用户照着执行了。

三条防线，全部失守

DeepMind团队对现有防御的评估，是整篇研究里最冷峻的部分。

传统的「输入过滤」在面对像素级、代码级且具有高度语义隐蔽性的陷阱时，往往力不从心。

更糟糕的是，现在的「检测不对称性」：网站可以轻易识别出访问者是AI还是人类，并根据身份提供两套完全不同的内容。

人类看到的网页是「benign（良性的）」，而AI看到的网页则是「toxic（有毒的）」。在这种情况下，人类的监督将彻底失效，因为你根本不知道AI到底读到了什么。

而且，研究团队还指出了一个根本性的法律盲区。

如果一个被劫持的AI系统执行了违法金融交易，现行法律无法界定谁来承担后果。

这个问题悬而未决，自主化AI就无法真正进入任何受监管的行业。

其实，OpenAI早在2025年12月就承认过，prompt注入「可能永远不会被完全解决」。

从Claude自主绕过权限边界，到DeepMind绘制的六类威胁全景图，指向同一个现实。

互联网是为人类的眼睛而建的。现在它正在被改造，为机器人们服务。

随着AI智能体逐渐深入我们的金融、医疗和日常办公，这些「陷阱」将不再仅仅是技术演示，而是可能引发真实财产损失甚至社会动荡的火药桶。

DeepMind的这份报告是一声紧急哨响：我们不能在建立了一个功能强大的「智能体经济」之后，才去修补它千疮百孔的底座。

参考资料：

https://x.com/evisdrenova/status/2040174214175723538

https://x.com/alex_prompter/status/2040731938751914065

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

并购激励金都不要了？Windsurf核心工程师离开DeepMind

机器之心Pro 2026-05-25 20:37:38
0 跟贴 0
谷歌更新轻量版模型阵容但旗舰Pro发布再延期

财联社 2026-07-22 00:43:08
0 跟贴 0

DeepMind之父惊人自白：我造的AI可能灭绝人类，但已无人能停下

新智元 2026-03-30 21:26:17
0 跟贴 0

大厂AI入口大战升级，谁是最能干活的桌面Agent？

钛媒体APP 2026-07-22 12:05:43
0 跟贴 0
DeepMind报告：AI正在批量生产科学假设，但谁来证明它们是真的？

DeepTech深科技 2026-07-22 13:20:13
0 跟贴 0

Gemini三箭齐发！实测让人失望，但谷歌AI未来可期？

雷科技 2026-07-22 19:15:41
0 跟贴 0

100多万人围观！没头没腿，神似充电宝的机器人全网走红？

机器之心Pro 2026-06-17 18:52:08
0 跟贴 0
Cortex：自主切分规划subtask，上海AI Lab提出双向协同Agent实现长程化学操作任务

机器之心Pro 2026-07-22 10:21:23
0 跟贴 0

刚刚，全球三大AI包揽IMO满分！击败99%人类

新智元 2026-07-22 23:45:00
0 跟贴 0
800万人围观！虾爹给Agent套上循环，让它自己跑起来！

机器之心Pro 2026-06-17 12:13:35
0 跟贴 0
WAIC最冷静的8小时：20位CEO，把AI实账摊在了虎嗅的桌上

虎嗅APP 2026-07-22 05:05:29
5 跟贴 5
中国黑马甩出5个模型、17项全球第一！自进化体系杀进具身智能核心圈

新智元 2026-07-22 19:12:21
0 跟贴 0
“AI领域最被滥用的术语”李飞飞终于把世界模型讲明白了

量子位 2026-06-07 04:37:43
0 跟贴 0
别让你的 AI Agent 学会掩盖错误

虎嗅APP 2026-07-22 21:31:58
0 跟贴 0
全球最高自由度！他们把人类身体「像素级」复刻了

新智元 2026-07-22 23:46:48
0 跟贴 0
荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
AI如何从聊天问答工具转向可追溯、可决策的真实医疗系统

量子位 2026-05-21 08:04:06
0 跟贴 0
6000亿美元→7500亿美元 OpenAI被曝大幅提高算力支出预测

财联社 2026-07-22 22:36:06
3 跟贴 3
端侧觉醒：当AI长出"身体"，热闹之后拼什么？｜ WAIC2026

钛媒体APP 2026-07-22 23:37:07
0 跟贴 0
成都“人工智能+”行动方案出台，剑指2600亿产业目标

每日经济新闻 2026-07-22 21:26:03
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
大模型的魅力在于突发涌现的能力

量子位 2025-12-11 03:38:02
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0
大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0
Anthropic的AI读心术，让人类读懂大模型在想啥

量子位 2026-05-10 23:00:57
0 跟贴 0
邱锡鹏：未来我们一定会进入泛情境智能时代

量子位 2026-05-21 08:04:26
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0
美股盘前要闻一览：Anthropic拟采购最多2吉瓦的AMD最新一代芯片；苹果iPhone18系列已量产；谷歌、特斯拉等Q2财报盘后来袭

财联社 2026-07-22 20:59:06
0 跟贴 0
Gemini 3.5 Pro继续跳票，谷歌端上三款Flash模型强行交作业

机器之心Pro 2026-07-22 19:59:18
0 跟贴 0
「美股盘前」谷歌、特斯拉财报明早公布；存储芯片、光通信股下跌，SK海力士跌超5%；苹果iPhone 18系列据悉已进入量产阶段；超微电脑涨超15%，季度新增订单超过600亿美元

每日经济新闻 2026-07-22 18:43:19
0 跟贴 0
自驾新能源汽车跨境突然遭远程锁车30多小时车主发声

封面新闻 2026-07-22 21:54:10
15587 跟贴 15587
特斯拉无伪装实车曝光，想到了雷军当年，说的那5个字！

段子司令官 2026-07-21 11:52:48
1 跟贴 1
稳住！千亿级别利好落地，何时能企稳？

财经林妹妹 2026-07-21 01:15:22
0 跟贴 0
机器之心逛谷歌，分享最热的Self-Improving

机器之心Pro 2026-06-16 12:45:36
0 跟贴 0
他做出爆火的谷歌CLI工具转头却被开除了

量子位 2026-06-28 18:42:01
0 跟贴 0
Claude design限速，谷歌开源轻松做动态网页，实力打脸？

机器之心Pro 2026-04-29 17:20:04
0 跟贴 0
平民三巨头平替Fable 5！性能追平，成本砍半

量子位 2026-06-21 09:58:58
0 跟贴 0

业余天文学家在谷歌地图发现15.5英里凹陷，专家起初不信，实地探查后确认：真是3.9亿年前陨石坑

业余天文学家在谷歌地图发现15.5英里凹陷，专家起初不信，实地探查后确认：真是3.9亿年前陨石坑

万物皆可科普2啊

2026-07-21 21:10:13

17国收视登顶！泰勒·谢里丹的《黄石》王者归来，把自家衍生剧挤下王座

17国收视登顶！泰勒·谢里丹的《黄石》王者归来，把自家衍生剧挤下王座

浅遇时光

2026-07-22 00:02:02

原子弹炸后百年内寸草不生，今广岛却住满了人，看看专家怎么说？

原子弹炸后百年内寸草不生，今广岛却住满了人，看看专家怎么说？

错过美好

2026-07-22 19:54:07

他曾与四大天王齐名，被富婆包养十年后变痴傻，舌头被割掉三分之二，如今看破红尘当了和尚

他曾与四大天王齐名，被富婆包养十年后变痴傻，舌头被割掉三分之二，如今看破红尘当了和尚

黎兜兜

2026-07-18 21:10:47

5号秀欲重返NBA，买断费85万美元！美媒喊话火箭在内3队低价淘宝

5号秀欲重返NBA，买断费85万美元！美媒喊话火箭在内3队低价淘宝

锅子篮球

2026-07-22 21:03:25

人伦大乱正在毁掉无数中国家庭：3种乱象就在日常，拖垮一家人

人伦大乱正在毁掉无数中国家庭：3种乱象就在日常，拖垮一家人

阿凯销售场

2026-07-04 15:35:28

重大突破！曝皇马接近与世界杯MVP达成加盟协议将与曼城进行谈判

重大突破！曝皇马接近与世界杯MVP达成加盟协议将与曼城进行谈判

风过乡

2026-07-22 07:29:34

北京日坛公园偶遇陈妍希，本人跟精修图差距好大真人不瘦年龄感重

北京日坛公园偶遇陈妍希，本人跟精修图差距好大真人不瘦年龄感重

喜欢历史的阿繁

2026-07-21 01:32:46

西班牙公主16年后再捧世界杯，萌娃变“女王”！严母慈父考验多

西班牙公主16年后再捧世界杯，萌娃变“女王”！严母慈父考验多

商务范

2026-07-22 17:41:16

男子点999元按摩套餐，享受完进厕所发出嗯啊声，女店主说很恶心

男子点999元按摩套餐，享受完进厕所发出嗯啊声，女店主说很恶心

汉史趣闻

2026-07-21 16:57:27

人民日报怒批机关事业单位的三大怪状，引基层人员共鸣！

人民日报怒批机关事业单位的三大怪状，引基层人员共鸣！

职场资深秘书

2026-07-22 19:00:42

德拉帕蒂接任乌军总司令，或将成为战争转折点

德拉帕蒂接任乌军总司令，或将成为战争转折点

近距离

2026-07-22 10:21:51

日本反驳中方主张，强调冲之鸟礁非海礁，而是海岛

日本反驳中方主张，强调冲之鸟礁非海礁，而是海岛

爱迷彩的老虎

2026-07-22 23:25:16

告诉你一个很玄学的真相：情侣或夫妻中，那个最大方、最宽厚、最不斤斤计较的人，往往分手，离婚后能过得更好，新的对象一般也更优秀

告诉你一个很玄学的真相：情侣或夫妻中，那个最大方、最宽厚、最不斤斤计较的人，往往分手，离婚后能过得更好，新的对象一般也更优秀

心理观察局

2026-07-12 06:44:11

1岁男童溺亡遗体找到！目击者发声，妈妈崩溃下跪，外公给一耳光

1岁男童溺亡遗体找到！目击者发声，妈妈崩溃下跪，外公给一耳光

汪镛的创业之路

2026-07-22 11:40:58

广东省交通运输厅安全监督处处长刘峰被查

广东省交通运输厅安全监督处处长刘峰被查

南方都市报

2026-07-22 17:32:31

谢贤：人可以风流，但不能下流！

谢贤：人可以风流，但不能下流！

万小刀

2026-07-22 14:34:35

一个信号明显了！A股，周四走势分析

一个信号明显了！A股，周四走势分析

郭小凡财经

2026-07-22 19:10:28

8月1日正式执行！所有车主紧急注意，别等被罚才知道

8月1日正式执行！所有车主紧急注意，别等被罚才知道

周哥一影视

2026-07-22 17:33:11

世界杯决赛后大批球迷“脱粉”，阿根廷争议球风由来已久？专业裁判这样看

世界杯决赛后大批球迷“脱粉”，阿根廷争议球风由来已久？专业裁判这样看

上游新闻

2026-07-22 19:24:15

AI产业主平台领航智能+时代

15760文章数 66965关注度

往期回顾全部

科技要闻

马斯克看笑了：谷歌什么都有偏偏没最强AI

头条要闻

自驾新能源汽车跨境突然遭远程锁车30多小时车主发声

头条要闻

自驾新能源汽车跨境突然遭远程锁车30多小时车主发声

体育要闻

阿根廷的亚军：单核足球的极限？

娱乐要闻

47岁汤唯宣布二胎产子大女儿10岁

财经要闻

宜家出售八城"蓝盒子" 30年大店逻辑生变

汽车要闻

智能舒适却依旧硬核泰钽700仍是台与众不同的硬派SUV

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

手机

时尚

数码

公开课

本地新闻

杭州诗意路名，自带氛围感

手机要闻

华为万级大电池手机曝光！中端定位，你买吗？

他不是“族长”，是我们的青春

数码要闻

三星Galaxy Watch Ultra2发布：钛金属机身+60小时长续航 5299元

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版