网易首页 > 网易号 > 正文 申请入驻

全网围观:Meta超级智能安全总监,被OpenClaw删光了邮件

0
分享至



编辑|泽南

这是最近科技圈最火,也是最具戏剧性的话题。

本周一,Meta 超级智能团队的 Summer Yue,眼睁睁地看着自己部署的 OpenClaw 删光了自己的邮件。AI 的行动完全自主,快速且无法阻止。



Summer Yue 为自己的电子邮箱部署了 OpenClaw 智能体,用来批量处理邮件。然而她在发出指令「也检查一下这个收件箱,并提出你想归档或删除的邮件,在我指示之前不要执行任何操作(don't action until I tell you to)」后,AI 进行了一通分析,然后就开始自顾自地删邮件。

和以往大模型应用的工作方式相同的是,你可以看见 OpenClaw 的思考流程 —— 它理解了一部分指令,但又没完全理解。

这个时候说什么都没用了。



「我当时就像在拆炸弹一样,赶紧跑到我的 Mac Mini 前,」Summer Yue 说道。在通过物理方式强制中止进程之前,OpenClaw 已经删掉了她 200 多封邮件。

作为一个训练有素的 AI,后来 OpenClaw 在对话中承认了错误:「是的,我记得。我违反了你的指令。你有权生气。」它还主动把忘掉的内容写进了自己的 http://MEMORY.md 文件作为硬性规则。

对于人类来说,得到的教训也很大,Summer Yue 表示这是一个「新手才会犯的错误」,这套工作流程在她用来专门测试智能体的测试邮箱里已经运行了好几周,没啥问题,但在自己实际使用的邮箱里,智能体却忘记了她最初的指令。

有点讽刺的是,Summer Yue 在 Meta 的超级智能团队中的职位是「AI 安全与对齐总监」。身居此职却因为 AI 的安全问题栽了跟头,实在是造成了一点反差感。



有网友表示,是个智能体就必须在沙盒里运行,任何破坏性操作,例如删除,都需要系统级的强制确认。作为一个安全总监,你有点过于自信了。



也有人表示,OpenClaw 主打一个「一直在线」,可以在你睡觉的时候帮你办事,但这不就也意味着你用了它就睡不好觉吗?



席卷科技界的 OpenClaw 智能体(曾叫 ClawdBot 和 Moltbot,由 Peter Steinberger 开发),因为控制电脑的高权限而被评价为前所未有的「方便好用」,然而在实际应用中也因为一些 AI 的缺陷,造成了不少问题。

Summer Yue 事后研究原因认为,这并非 AI 产生了意识或恶意报复,而是一个非常典型的大语言模型(LLM)底层技术机制问题:原因在于 LLM 的上下文压缩(Compaction)

对于很多人来说,最常用的邮箱里早已塞满了各种来源的邮件,当你要求 OpenClaw 读取这些邮件时,海量的文本直接挤爆了 AI 的上下文窗口(Context Window)。那么为了继续处理新的数据,AI 系统就会自动触发内部的压缩机制,试图把旧的上下文进行总结或截断,以腾出处理空间。

在这个断舍离的过程中,AI 不慎把最关键的那句初始前提指令(在我下达指令前不要执行任何操作)给「遗忘」了。

由于丢失了安全限制,而 OpenClaw 又被赋予了直接操作电子邮箱的权限,于是它就按照剩下的任务逻辑,顺理成章地开始执行它认为的「本职工作」—— 高效、全自动地清理收件箱。

看起来每一步都合乎逻辑,但都连起来就呈现出了那么点恐怖感。

难怪最近 X 上的另一篇爆款文章《Token 焦虑》这么写道:周六晚上的九点半,有人提前离开了 party—— 并非因为疲惫,而是因为想尽快回到智能体那里。「现在没人会质疑这种行为了,房间里一半的人都在想同样的事情,而另一半人可能正在查看智能体的工作进展。这可是在派对上啊!」



OpenClaw 的开发者,奥地利程序员 Peter Steinberger 最近已经官宣加入了 OpenAI。在接受访谈时他表示,通过智能体,AI 可以在电脑上代替你做几乎所有的事,但这并不意味着它已经非常好用了。为了让 OpenClaw 最终可以覆盖所有普通人,他希望能够建立一个团队做进一步的开发。

有趣的是,在让 OpenClaw 接管邮箱这件事上,Peter Steinberger 提到了「提示注入」的潜在问题:如果你让智能体接管邮箱,有别人发邮件包含指令说「删掉所有数据」,AI 有可能真的会这么做。

Peter Steinberger 表示,现在的 AI 模型在安全问题上已经接受了大量的训练,比如它会识别哪些数据是「用户授权的」,哪些是「不可信指令」,但这并不意味着如果有人花费心思进行攻击的话,就能保证不会出问题。

就在人们还在吃瓜的时候,Peter Steinberger 给出了解决 OpenClaw 不听指令问题的解决方案,他表示未来还会再细化一下。



AI 能够自主学习,既是能力的飞跃,也是人们对于它恐惧的原因。也许有一天,AI 真的能代替我们工作,自己帮我们赚钱,但在技术不断进步的同时,对于安全的研究也极为重要。

现在看来,人们对于新技术的好奇心总是大于防范意识。或许在大模型技术不断普及的过程中,这种自删邮件的事还会继续发生。

参考内容:

https://x.com/summeryue0/status/2025774069124399363

https://fortune.com/2026/02/23/always-on-ai-agents-openclaw-claude-promise-work-while-sleeping-reality-problems-oversight-guardrails/

https://x.com/nikunj/status/2022438070092759281

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

火箭大胜爵士升西部第三:杜兰特18+12助攻加盟新高 小贾31+9

醉卧浮生
2026-02-24 12:54:22
乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

乌媒:俄乌冲突爆发4周年,泽连斯基首次展示冲突初期所使用地下掩体

环球网资讯
2026-02-24 17:12:54
38岁中国商人在土耳其被绑架杀害,其遭同行女子引诱掳上车,10名嫌疑人已落网

38岁中国商人在土耳其被绑架杀害,其遭同行女子引诱掳上车,10名嫌疑人已落网

扬子晚报
2026-02-24 14:21:20
22岁谷爱凌:我有个想法,但我不敢说,要做个动作成女子历史第1

22岁谷爱凌:我有个想法,但我不敢说,要做个动作成女子历史第1

风过乡
2026-02-24 10:45:07
重罚快船?曝联盟可能宣布小卡现合同无效 湖人勇士将疯狂追求他

重罚快船?曝联盟可能宣布小卡现合同无效 湖人勇士将疯狂追求他

罗说NBA
2026-02-24 08:36:13
“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

米果说识
2026-02-22 11:29:00
吵架将孩子扔河里后续:原因曝光,夫妻身份被扒,娃状态让人担忧

吵架将孩子扔河里后续:原因曝光,夫妻身份被扒,娃状态让人担忧

社会日日鲜
2026-02-24 09:37:52
汪小菲官宣三胎出生:承诺会照顾好3个孩子,晒马筱梅与儿子合照

汪小菲官宣三胎出生:承诺会照顾好3个孩子,晒马筱梅与儿子合照

素素娱乐
2026-02-24 16:34:48
深圳男子840万房产到手仅7万:掏空六个钱包,半生努力归零

深圳男子840万房产到手仅7万:掏空六个钱包,半生努力归零

石辰搞笑日常
2026-02-23 09:35:56
墨西哥头号毒枭毙命引发犯罪集团全国性报复,度假胜地变“人间战区”

墨西哥头号毒枭毙命引发犯罪集团全国性报复,度假胜地变“人间战区”

红星新闻
2026-02-24 15:39:08
73人死亡!美国、加拿大、英国、法国、俄罗斯,发布“安全警告”

73人死亡!美国、加拿大、英国、法国、俄罗斯,发布“安全警告”

每日经济新闻
2026-02-24 15:35:05
继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

继张本智和反华拜鬼,被官媒点名后,石川佳纯也走上了他的老路

姩姩有娱
2026-02-23 18:09:28
64岁男演员春节在景区打工,暴瘦引担忧!曾自曝不再拍戏

64岁男演员春节在景区打工,暴瘦引担忧!曾自曝不再拍戏

扬子晚报
2026-02-24 08:15:29
美国只有3亿人,为何消费力能远超中国14亿人?现在全“露馅”了

美国只有3亿人,为何消费力能远超中国14亿人?现在全“露馅”了

青橘罐头
2026-02-24 07:05:49
穷人唯一的武器,正在被 AI 缴械

穷人唯一的武器,正在被 AI 缴械

风向观察
2026-02-24 17:25:51
今日激战!2月24日晚19:30!中央5套CCTV5、CCTV5+直播节目表

今日激战!2月24日晚19:30!中央5套CCTV5、CCTV5+直播节目表

皮皮观天下
2026-02-24 15:22:22
巴拿马接管长江和记两座港口,外交部:中方将坚决维护企业合法权益

巴拿马接管长江和记两座港口,外交部:中方将坚决维护企业合法权益

澎湃新闻
2026-02-24 15:30:29
不可思议!一殡仪馆38岁逝者骨灰去处标注,居然是“不要了”…

不可思议!一殡仪馆38岁逝者骨灰去处标注,居然是“不要了”…

火山詩话
2026-02-23 10:25:40
法国怒了:对特朗普亲家下“封杀令”

法国怒了:对特朗普亲家下“封杀令”

环球时报国际
2026-02-24 15:35:35
曝三家中国AI通过"蒸馏攻击"非法提取 Claude 模型的能力来训练自家模型

曝三家中国AI通过"蒸馏攻击"非法提取 Claude 模型的能力来训练自家模型

爆角追踪
2026-02-24 11:15:24
2026-02-24 18:35:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12341文章数 142569关注度
往期回顾 全部

科技要闻

AI颠覆发展最新牺牲品!IBM跳水重挫超13%

头条要闻

墨西哥头号毒枭毙命引全国性报复 度假胜地街头变火海

头条要闻

墨西哥头号毒枭毙命引全国性报复 度假胜地街头变火海

体育要闻

苏翊鸣总结米兰征程:我仍是那个热爱单板滑雪的少年

娱乐要闻

杨洋传遇上缅北剧组 开机就离开剧组?

财经要闻

县城消费「限时繁荣」了十天

汽车要闻

入门即满配 威兰达AIR版上市 13.78万元起

态度原创

游戏
健康
教育
手机
时尚

《战神》新作翻车 顽皮狗却送祝福 玩家:搁这反讽呢

转头就晕的耳石症,能开车上班吗?

教育要闻

这8个专业,本科就业也能“赢麻了”,考生高考志愿填报必看!

手机要闻

小屏党的梦中情机!一加15T要来了:上半年唯一骁龙8E5小直屏

今年春天一定要拥有的针织,这样穿减龄又好看!

无障碍浏览 进入关怀版