网易首页 > 网易号 > 正文 申请入驻

全网围观:Meta超级智能安全总监,被OpenClaw删光了邮件

0
分享至



编辑|泽南

这是最近科技圈最火,也是最具戏剧性的话题。

本周一,Meta 超级智能团队的 Summer Yue,眼睁睁地看着自己部署的 OpenClaw 删光了自己的邮件。AI 的行动完全自主,快速且无法阻止。



Summer Yue 为自己的电子邮箱部署了 OpenClaw 智能体,用来批量处理邮件。然而她在发出指令「也检查一下这个收件箱,并提出你想归档或删除的邮件,在我指示之前不要执行任何操作(don't action until I tell you to)」后,AI 进行了一通分析,然后就开始自顾自地删邮件。

和以往大模型应用的工作方式相同的是,你可以看见 OpenClaw 的思考流程 —— 它理解了一部分指令,但又没完全理解。

这个时候说什么都没用了。



「我当时就像在拆炸弹一样,赶紧跑到我的 Mac Mini 前,」Summer Yue 说道。在通过物理方式强制中止进程之前,OpenClaw 已经删掉了她 200 多封邮件。

作为一个训练有素的 AI,后来 OpenClaw 在对话中承认了错误:「是的,我记得。我违反了你的指令。你有权生气。」它还主动把忘掉的内容写进了自己的 http://MEMORY.md 文件作为硬性规则。

对于人类来说,得到的教训也很大,Summer Yue 表示这是一个「新手才会犯的错误」,这套工作流程在她用来专门测试智能体的测试邮箱里已经运行了好几周,没啥问题,但在自己实际使用的邮箱里,智能体却忘记了她最初的指令。

有点讽刺的是,Summer Yue 在 Meta 的超级智能团队中的职位是「AI 安全与对齐总监」。身居此职却因为 AI 的安全问题栽了跟头,实在是造成了一点反差感。



有网友表示,是个智能体就必须在沙盒里运行,任何破坏性操作,例如删除,都需要系统级的强制确认。作为一个安全总监,你有点过于自信了。



也有人表示,OpenClaw 主打一个「一直在线」,可以在你睡觉的时候帮你办事,但这不就也意味着你用了它就睡不好觉吗?



席卷科技界的 OpenClaw 智能体(曾叫 ClawdBot 和 Moltbot,由 Peter Steinberger 开发),因为控制电脑的高权限而被评价为前所未有的「方便好用」,然而在实际应用中也因为一些 AI 的缺陷,造成了不少问题。

Summer Yue 事后研究原因认为,这并非 AI 产生了意识或恶意报复,而是一个非常典型的大语言模型(LLM)底层技术机制问题:原因在于 LLM 的上下文压缩(Compaction)

对于很多人来说,最常用的邮箱里早已塞满了各种来源的邮件,当你要求 OpenClaw 读取这些邮件时,海量的文本直接挤爆了 AI 的上下文窗口(Context Window)。那么为了继续处理新的数据,AI 系统就会自动触发内部的压缩机制,试图把旧的上下文进行总结或截断,以腾出处理空间。

在这个断舍离的过程中,AI 不慎把最关键的那句初始前提指令(在我下达指令前不要执行任何操作)给「遗忘」了。

由于丢失了安全限制,而 OpenClaw 又被赋予了直接操作电子邮箱的权限,于是它就按照剩下的任务逻辑,顺理成章地开始执行它认为的「本职工作」—— 高效、全自动地清理收件箱。

看起来每一步都合乎逻辑,但都连起来就呈现出了那么点恐怖感。

难怪最近 X 上的另一篇爆款文章《Token 焦虑》这么写道:周六晚上的九点半,有人提前离开了 party—— 并非因为疲惫,而是因为想尽快回到智能体那里。「现在没人会质疑这种行为了,房间里一半的人都在想同样的事情,而另一半人可能正在查看智能体的工作进展。这可是在派对上啊!」



OpenClaw 的开发者,奥地利程序员 Peter Steinberger 最近已经官宣加入了 OpenAI。在接受访谈时他表示,通过智能体,AI 可以在电脑上代替你做几乎所有的事,但这并不意味着它已经非常好用了。为了让 OpenClaw 最终可以覆盖所有普通人,他希望能够建立一个团队做进一步的开发。

有趣的是,在让 OpenClaw 接管邮箱这件事上,Peter Steinberger 提到了「提示注入」的潜在问题:如果你让智能体接管邮箱,有别人发邮件包含指令说「删掉所有数据」,AI 有可能真的会这么做。

Peter Steinberger 表示,现在的 AI 模型在安全问题上已经接受了大量的训练,比如它会识别哪些数据是「用户授权的」,哪些是「不可信指令」,但这并不意味着如果有人花费心思进行攻击的话,就能保证不会出问题。

就在人们还在吃瓜的时候,Peter Steinberger 给出了解决 OpenClaw 不听指令问题的解决方案,他表示未来还会再细化一下。



AI 能够自主学习,既是能力的飞跃,也是人们对于它恐惧的原因。也许有一天,AI 真的能代替我们工作,自己帮我们赚钱,但在技术不断进步的同时,对于安全的研究也极为重要。

现在看来,人们对于新技术的好奇心总是大于防范意识。或许在大模型技术不断普及的过程中,这种自删邮件的事还会继续发生。

参考内容:

https://x.com/summeryue0/status/2025774069124399363

https://fortune.com/2026/02/23/always-on-ai-agents-openclaw-claude-promise-work-while-sleeping-reality-problems-oversight-guardrails/

https://x.com/nikunj/status/2022438070092759281

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
倒计时36天预警!黄金或迎抛售潮,多国限金条出口,中国已抢先布局

倒计时36天预警!黄金或迎抛售潮,多国限金条出口,中国已抢先布局

哄动一时啊
2026-03-26 20:23:42
黄天鹅致歉!

黄天鹅致歉!

鲁中晨报
2026-03-26 22:05:34
生育大局已定:不出意外的话,从2026年起新生人口将迎来3大变化

生育大局已定:不出意外的话,从2026年起新生人口将迎来3大变化

江江食研社
2026-03-24 03:30:08
3-1拿下陈熠,最后一个世乒赛名额到手,王艺迪笑到了最后

3-1拿下陈熠,最后一个世乒赛名额到手,王艺迪笑到了最后

眼界纵横
2026-03-26 23:25:59
吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

念洲
2026-03-26 13:14:22
同样是突围作战,粟裕3万人打出七战七捷,李先念5万大军却被打散建制,背后真相让人意外

同样是突围作战,粟裕3万人打出七战七捷,李先念5万大军却被打散建制,背后真相让人意外

文史明鉴
2026-03-26 16:16:10
为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

为什么氰化物入口几秒,还没到胃呢,人立马就会死了?

心中的麦田
2026-03-24 19:53:20
震碎三观!邓兆尊节目自曝多人运动,交3个女友还能一碗水端平

震碎三观!邓兆尊节目自曝多人运动,交3个女友还能一碗水端平

橙星文娱
2026-03-26 09:20:10
《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

阿纂看事
2026-03-26 16:03:34
炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

炸锅!利物浦 1.25 亿标王主动申请离队,首选下家完全出乎意料

澜归序
2026-03-26 06:08:07
已经抵达东莞?曝广东宏远大外援到位,NBA首轮秀,身高2米13

已经抵达东莞?曝广东宏远大外援到位,NBA首轮秀,身高2米13

篮球大陆
2026-03-26 14:01:14
小佩顿已连续命中16球!勇士队史纪录为张伯伦的连中19球

小佩顿已连续命中16球!勇士队史纪录为张伯伦的连中19球

北青网-北京青年报
2026-03-26 20:51:05
皇马“6300万金童”到底怎么了?全阿根廷都在等他打脸质疑者

皇马“6300万金童”到底怎么了?全阿根廷都在等他打脸质疑者

仰卧撑FTUer
2026-03-26 23:09:03
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
4.7万亿!马斯克打破人类财富纪录:他一个人的钱抵得过160个国家

4.7万亿!马斯克打破人类财富纪录:他一个人的钱抵得过160个国家

通鉴史智
2026-03-15 11:45:00
广东一男子中奖500万:每次购彩金额控制在20元以内,是日常娱乐休闲方式

广东一男子中奖500万:每次购彩金额控制在20元以内,是日常娱乐休闲方式

大象新闻
2026-03-26 21:45:05
中央公布重要文件,养老金调整方向明确,工龄30年以上多涨钱吗?

中央公布重要文件,养老金调整方向明确,工龄30年以上多涨钱吗?

比利
2026-03-27 00:30:28
iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

柴狗夫斯基
2026-03-26 21:15:05
上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

环球网资讯
2026-03-26 08:13:14
陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
2026-03-27 01:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12608文章数 142594关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

家居
数码
手机
本地
公开课

家居要闻

傍海而居 静观蝴蝶海

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版