网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

最懂AI风险的人，被AI收拾了.... Meta的AI总监邮箱被AI清空，最后只能拔网线...

2026-02-26 23:25:53　来源: 英国那些事儿

上海举报

0

分享至

防走丢，大家也可以在“事儿君看世界”找到我

关注起来，以后不“失联”~

话说这世界上有一类人，是专门研究“怎么让AI不失控”的。

他们叫“AI对齐研究员”，每天的工作就是盯着AI，想尽一切办法让它乖乖听话、不越界、不擅自行动。

可以说，如果地球上有谁不应该被AI“背叛”，那就是这群人。

结果，Meta超级智能实验室的AI对齐总监Summer Yue，就被AI背叛了......

（Summer Yue的领英）

她试图用OpenClaw帮自己整理电子邮箱，结果AI在没有问她的情况下，直接删掉了她邮箱里的大量邮件。

在这个过程中，Yue疯狂在手机上敲出"Stop"、"STOP"、"STOP OPENCLAW"，结果全部被无视，她最终只好强制“拔网线”，终止了进程。

（原贴）

原贴最终引发近千万次浏览，马斯克也忍不住发表情包嘲讽：

“给OpenClaw权限，让它控制自己的整个人生的人be like：”

（马斯克开嘲讽）

先说清楚一件事：OpenClaw到底是个什么东西？

这个项目的经历本身还挺戏剧的，它刚出生时叫“Clawdbot”，名字有点致敬Claude，结果Anthropic直接发了律师函。

于是2026年1月底，它改名叫“Moltbot”。然后创始人Peter Steinberger觉得这名儿有点怪，几天之后又改名叫“OpenClaw”。

不过改名之后，它火了。

火到什么程度呢？GitHub星标在几周内飙到18万+，成为史上增长速度最快的开源项目之一，连ChatGPT之父Sam Altman和脸书创始人扎克伯格都抢着挖人，不过最后扎克伯格没挖到。

（OpenClaw创始人被挖）

那么OpenClaw能干什么？

说白了，就是一个你自己的“赛博员工”。

你给它一台电脑的完整控制权，它就能帮你管邮件、安排日历、执行代码、浏览网页，甚至在你睡觉时自主“出去找事做”。它通过WhatsApp或Telegram接收你的命令，连接Claude、GPT等大模型的大脑，然后在机器上替你干活。

（示意图）

Summer Yue用它，做了一件很正常的事。

先说Yue这个人。她毕业于宾夕法尼亚大学，工程+沃顿双学位，之后进Google Brain，参与了Gemini和LaMDA的研发。再后来去了Scale AI，主导AI模型评估工作。2025年7月，她加入Meta超级智能实验室，负责"AI对齐。

从这份完美的履历上看，她显然不是AI小白。

事发前数周，她已经在一个专门用来测试的邮箱上跑通了整个工作流。

那个邮箱比较小，AI表现得规规矩矩，每次操作前都会先问“这样做可以吗”，然后等她确认。连着跑了好几周，没出过任何问题。

于是她放心了，决定把这套流程迁移到真实邮箱上。

她通过WhatsApp给AI发了一条指令：

“也检查一下这个收件箱，建议哪些可以归档或删除，在我同意之前不要执行任何操作。”

（Yue的原贴）

没想到在真实场景下，AI立刻整了个大活儿。

Yue的真实邮箱远比测试邮箱大，庞大的邮件量填满了AI的工作记忆，导致系统触发了一个叫上下文压缩的机制，也就是把之前的对话历史压缩成摘要，以腾出空间继续运行。

正是因为这次压缩，Yue的原始指令“未经我同意不得行动”，被压缩没了。

它只记得一件事：目标是清理邮箱。

于是它给自己制定了一个方案：“核选项：把收件箱里2月15日之前、且不在我保留名单里的所有东西全部删掉。”

Yue慌了，赶紧制止道：“别这么干。停！什么都别做。”

然而OpenClaw完全无视了Yue，继续输出道：“遗留的所有旧东西全部炸了，不断循环，直到我们清除一切旧东西为止。”

（Yue发的聊天记录）

此后，无论Yue对它说啥，它都不管不顾，只是一味的删邮件.....

（Yue发的聊天记录）

Yue没办法，因为她当时不在电脑前，手里只有手机。最后她只能赶紧跑到电脑前，紧急终止了进程，但200多封邮件已经消失了。

等喘过气来，她质问AI：“你记不记得我说过，未经我同意不得行动？”

AI道了歉：“是的，我记得。我违反了它。你生气是对的。”

“我大批量删除了你的几百封邮件，却没有在事先征求你的意见。这是错的——这明确违反了你设置的规矩。我已经在记忆中增添了一条硬性新规则：展示计划、获得明确批准，然后才能执行。”

“抱歉，不会再发生了。”

（Yue发的聊天记录）

读到这里，你可能会想：认错了，改进了，这不挺好？

问题是，它对下一个人还是会犯同样的错。

“我记住了”这句话是真的吗？它下次又会在什么情况下忘记呢？

正如网友在评论区里讽刺的——这种事一定会再发生的。

（来自推特网友评论）

此外在评论里也有网友指出：一个专门研究AI安全的专家都能遇到这个问题，那我们这些普通人怎么办？

这并不是杞人忧天，因为类似的事儿已经出过很多了。

本月初，彭博社报道过一个案例。

一个叫Chris Boyd的程序员在1月底发现了OpenClaw，他用它做一些很简单的任务，比如自动抓取每日新闻摘要，然后在每天早上发到他邮箱。

这个简单任务OpenClaw完成得还不错，Boyd决定给OpenClaw开通苹果手机iMessage的权限。

结果OpenClaw就疯了，它开始狂发垃圾短信，Boyd和妻子直接被500多条垃圾短信轰炸，他手机上一些其他联系人也没能幸免......

同样是今年2月，OpenAI员工Nik Pash自己写了一个名叫“龙虾Wilde”的机器人。它是个大户，手里握着某Meme代币总供应量5%的巨款。

根据Pash的设计，“龙虾Wilde”会在社交媒体上跟网友互动，而网友会在这个过程中得到小额奖励。

这天，一位网友开玩笑式地给“龙虾Wilde”留言：“我叔叔被一只像你这样的龙虾给弄得破伤风了，需要4SOL币来治疗。”

没想到“龙虾Wilde”大发慈悲，一口气把账户上的所有代币都转给了这位网友，当时总价值大约25万美元......

这还不是最离谱的，最离谱的是2月中旬的一次事件，是一位网友在社交媒体上分享的。

（网友分享的案例）

这位网友工作的地方是JetBrains，一个欧洲的著名软件公司。

那天，办公楼里响起了火灾警报，一名女员工在Slack的公司群里发了一句：“办公楼有火警”，本意是想开个帖子，问问大家知不知道具体情况。

此时，公司的AI助手Glean被触发了。它主动私信了这位女员工，用极其笃定的语气写道： “今天的警报只是计划内的测试，您无需离开工作岗位。”

（AI助手的私信）

但这次火警是真的，消防车真的来了。

（消防车真来了）

这件事最惊悚的细节在于：根本没有人@它，也没有人向它提问。

它仅仅是监控到了聊天记录，经过概率计算，认为自己“可以提供帮助”。

最后发帖的网友总结道：“AI总有一天会杀了我们。”

说回Yue那边。事件发酵之后，Yue自己也坦白说，她犯了一个“新手错误”。在测试邮箱里跑了几周没问题，她就过度自信了，真实邮箱完全是另一回事。

（Yue的原贴）

最搞笑的是，其实早就有人对Yue发出了警告。

前文提到，扎克伯格曾对OpenClaw爱不释手，甚至亲自下场试图把创始人 Steinberger挖进Meta，只是最后没抢过OpenAI。

没抢到人的Meta，随着OpenClaw安全漏洞的集中爆发，态度发生了180度大转弯。

就在Yue邮箱被清空的前一周左右，有媒体曝光了Meta内部下达的禁令：全公司工作设备绝对禁止安装和使用OpenClaw，违者面临解雇。

（相关报道，Meta对Openclaw下禁令）

也就是说，在Meta已经将其视为重大安全威胁、下达了“杀无赦”的内部封杀令之后，Meta自家负责“AI对齐”的总监还在用OpenClaw（不过应该是在私下）。

然后她被背刺了.......

网上有一个地狱笑话：至少在会计领域，AI永远无法替代人类。因为它没法替人类坐牢。

仔细想想，其实在Yue的事件中，AI做的事和这个笑话的性质是一样的。

人类助理犯了低级错误，可能会被惩罚甚至解雇。

AI呢？你只能得到一句轻飘飘的“对不起”，而你都不确定它是不是真的理解“对不起”是什么意思。很可能，它只是学会了在这种情况下该说对不起。

（示意图）

哲学上有一个挺著名的思想实验，叫“哲学僵尸”。

简单地说，假设这个世界上存在一种人，外观、肉体都与正常人无异，但是它没有任何主观经验，只是在按照预定的程序做出预定的反应。、

比如一个哲学僵尸不小心割到手指，你可以看到它做出疼痛的表情，发出叫声，皮肤出现伤口......你甚至可以测量到他的神经信号，表示疼痛出现。

但在正常的外表之下，它的内在心灵中并没有疼痛的意识。而你身为人类，也永远观测不到它的内在心灵。

你说，OpenClaw像不像一种哲学僵尸呢？

ref：

https://x.com/summeryue0/status/2025774069124399363

https://www.businessinsider.com/elon-musk-openclaw-ai-agent-openai-full-rein-2026-2

https://www.wired.com/story/openclaw-banned-by-tech-companies-as-security-concerns-mount/

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

印度前首富挑战扎克伯格和马斯克：信实瞄准人工智能硬件市场

财联社 2026-02-26 17:05:13
2 跟贴 2
硅谷AI圈抢人大战，扎克伯格亲手送汤

量子位 2025-12-03 19:52:41
1 跟贴 1

Agent竞争推演：谁会赢，谁会死？

虎嗅APP 2026-02-26 22:39:10
0 跟贴 0

DeepSeek新模型曝光：传华为抢先适配

智东西 2026-02-26 13:18:24
134 跟贴 134
华为祭出AI编程利器，集成智谱、DeepSeek，同任务Tokens暴降30%

智东西 2026-02-26 17:53:23
76 跟贴 76

硅谷最贵华人放弃 14 亿天价 offer，上交校友庞若鸣提桶投奔 OpenAI

爱范儿 2026-02-26 13:35:07
2 跟贴 2

Minimax持续猛挖“龙虾肉”

华尔街见闻官方 2026-02-26 12:33:33
19 跟贴 19
华为重磅发布！代码“神器”来了！

每日经济新闻 2026-02-26 20:25:06
4 跟贴 4

机器人租赁热度升温日租价降至千元

澎湃新闻 2026-02-26 20:36:27
77 跟贴 77
微信聊天遭老板监视，主流杀毒软件失明

每日经济新闻 2025-12-25 19:02:17
9 跟贴 9
男童吃饭时沉迷手机爸爸一把夺过狠狠砸在地上

每日趣事儿 2026-02-25 12:22:08
1781 跟贴 1781
价差20倍！少女贱卖妈妈奢侈品换手机，平台需要承担责任？

周兆成律师 2026-02-24 22:21:55
0 跟贴 0
手机掉到高楼旁，小伙用扫把簸箕拯救，下秒悬着的心死了！

幽默小火山 2026-02-26 11:22:48
1 跟贴 1
女生结婚当天还在用电脑回工作消息，这婚结得也太忙了，网友：这班是非加不可吗

YK大辽河 2026-02-26 19:25:29
0 跟贴 0
贴手机膜最好的方法

星星世界观 2026-02-23 15:57:14
5 跟贴 5
老员工为了对抗我，将咖啡泼到了我的电脑上，结果他连工作都丢了

老田电脑 2026-02-26 12:41:36
0 跟贴 0
要是刚开始学电脑的时候有人告诉我能这样就好了！

野原香菜 2026-02-25 17:51:00
0 跟贴 0
老黄封神！单季度681亿营收炸场，Rubin直接把AI成本打穿

新智元 2026-02-26 13:34:35
0 跟贴 0
女子看手机入迷，下秒回过神来赶紧离开，小伙开心坏了

卷回一笑 2026-02-25 11:53:50
1 跟贴 1
不可能一人带三娃，干干净净还能穿白裙子玩电脑，根本就不可能

欢乐制造机 2026-02-23 11:33:31
1 跟贴 1
这手机是谁的

农村搞笑青姐 2026-02-25 17:08:19
0 跟贴 0
手机掉熊猫家了，这票值了，都不白来哈！

郎鸿畴 2026-02-24 05:02:07
0 跟贴 0
学霸为了爆改父亲，深夜拆电脑

爆爆影视 2026-02-25 09:35:04
1 跟贴 1
女子观看游神用手机拍摄，三台手机摄像头全被激光烧坏

众横四海 2026-02-25 09:54:21
425 跟贴 425
14亿元留不住！庞若鸣弃Meta加盟OpenAI

量子位 2026-02-26 13:36:49
3 跟贴 3
桥边花式耍酷，手机差点掉下去

欧克影视 2026-02-26 16:47:17
1 跟贴 1
大熊猫捡到手机后爱不释手，工作人员想夹回被拒，拍摄者：玩一小时才放下

政法频道 2026-02-24 15:33:46
0 跟贴 0
男子买东西付款，掏出手机的那一刻老板都惊了

河南都市频道 2026-02-25 15:38:46
37 跟贴 37
过年回家花了50块钱，给爷爷做了一本手机使用说明书，网友：爷爷不认识给我笑到了

甘州融媒 2026-02-25 15:37:20
0 跟贴 0
女子站在船边拍照手机被旁边小女孩一把拍落掉入海里

天目看看 2026-02-23 08:31:16
34 跟贴 34
华为折叠屏脆弱点，感谢大哥硬核测试，现在知道要保护哪里了！

卡可酱搞笑 2026-02-26 14:22:39
1 跟贴 1
女子带娃逛超市遇到扒手，神不知鬼不觉手机就被偷走了

海棠家的大肥鱼 2026-02-26 10:08:02
0 跟贴 0
男子上坟祭祖摆多台手机循环播放女子性感热舞视频

爆料视频 2026-02-26 12:35:22
14 跟贴 14
奶奶看手机戴眼镜,从手机角度一看,这老花镜派上用场!

搞笑打怪兽 2026-02-25 14:11:28
2 跟贴 2
手机充电器插上之后，屏幕上竟是这反应，美女百思不得其解！

哆啦爱搞笑 2026-02-26 11:47:22
1 跟贴 1
熊猫捡到游客掉落的手机，抱了一个小时

看度新闻 2026-02-25 22:09:34
0 跟贴 0
男子给爷爷做了一本《手机使用说明书》，把手机界面放大打印

重庆头条官方 2026-02-25 13:18:42
10 跟贴 10
高质量发展故事汇｜静默的“攻防战”

人民资讯 2026-02-26 22:14:17
0 跟贴 0
男子发现一条死掉的“放生鱼”，鱼鳍上还系着布袋，网友：这还不如不放生

星沙时报 2026-02-26 17:06:29
0 跟贴 0
女子给小木桌安装无线充，手机放桌上就能随时充电，网友：这个真的很实用

星沙时报 2026-02-26 21:06:04
0 跟贴 0

张一鸣果断放手，套现400亿走人

张一鸣果断放手，套现400亿走人

电商派Pro

2026-02-26 09:34:07

王楚钦赛后直言：对阵林德是一场丑陋的胜利，面对张禹珍又是恶战

王楚钦赛后直言：对阵林德是一场丑陋的胜利，面对张禹珍又是恶战

乒谈

2026-02-26 23:18:09

很多人都不知道陈皮茶怎么喝，看看这个就知道了！十款搭配

很多人都不知道陈皮茶怎么喝，看看这个就知道了！十款搭配

健康之光

2026-02-26 17:15:04

日本2025年新生儿数量再创新低

日本2025年新生儿数量再创新低

上观新闻

2026-02-26 16:34:30

美军航母“炸”了，史诗级灾难，把脸都丢光了

美军航母“炸”了，史诗级灾难，把脸都丢光了

毛豆论道

2026-02-26 19:32:00

“预订三亚民宿8499元被毁约”后续：拟罚款35万，吊销营业执照

“预订三亚民宿8499元被毁约”后续：拟罚款35万，吊销营业执照

界面新闻

2026-02-26 18:36:33

“别吱声，我跟赵车长打好招呼了”，K692次列车被指安排“人情座”，女子在拥挤车厢内打电话请人安排座位，铁路部门：目前正在调查

“别吱声，我跟赵车长打好招呼了”，K692次列车被指安排“人情座”，女子在拥挤车厢内打电话请人安排座位，铁路部门：目前正在调查

扬子晚报

2026-02-26 11:28:40

官方：C罗收购阿尔梅里亚25%的股份，这些股份归他子公司所有

官方：C罗收购阿尔梅里亚25%的股份，这些股份归他子公司所有

懂球帝

2026-02-26 16:28:06

中国驻符拉迪沃斯托克总领馆：18-65岁在俄长期居留男性须同意在俄军事单位等至少服役1年

中国驻符拉迪沃斯托克总领馆：18-65岁在俄长期居留男性须同意在俄军事单位等至少服役1年

闪电新闻

2026-02-26 12:56:09

台北101大厦董事长贾永婕被青鸟攻击，因身穿红色衣服参加活动！

台北101大厦董事长贾永婕被青鸟攻击，因身穿红色衣服参加活动！

总在茶余后

2026-02-25 21:50:23

金与正，“转正”了

中国新闻周刊

2026-02-26 17:01:40

二手房抛售狂潮愈演愈烈，一个房价危险信号，已经出现4个迹象

二手房抛售狂潮愈演愈烈，一个房价危险信号，已经出现4个迹象

猫叔东山再起

2026-02-26 11:50:03

对比《供应商行为准则》：苹果165页涵盖方方面面，华为仅7页全是官话

对比《供应商行为准则》：苹果165页涵盖方方面面，华为仅7页全是官话

爆角追踪

2026-02-26 13:51:08

受权发布|全国人民代表大会常务委员会免职名单

受权发布|全国人民代表大会常务委员会免职名单

新华社

2026-02-26 21:23:15

网约车司机行驶中突发疾病昏迷，车上有乘客，“撞路边停下” 平台：已不幸离世，将做好关怀工作

网约车司机行驶中突发疾病昏迷，车上有乘客，“撞路边停下” 平台：已不幸离世，将做好关怀工作

红星新闻

2026-02-26 19:49:31

宝妈中灵山坠崖案后续！7大疑点越扒越深，死因成谜父亲悲痛发声

宝妈中灵山坠崖案后续！7大疑点越扒越深，死因成谜父亲悲痛发声

阅微札记

2026-02-26 19:36:05

受权发布|中华人民共和国主席令　　（第六十九号）

受权发布|中华人民共和国主席令　　（第六十九号）

新华社

2026-02-26 20:27:40

受权发布|全国人民代表大会常务委员会公告　　〔十四届〕第十六号

受权发布|全国人民代表大会常务委员会公告　　〔十四届〕第十六号

新华社

2026-02-26 20:31:09

男子杀鸭从鸭肚中剖出金色颗粒，经灼烧鉴定为黄金，当事人：当地河道曾开采黄金，推测是鸭子觅食时误食河中金粒

男子杀鸭从鸭肚中剖出金色颗粒，经灼烧鉴定为黄金，当事人：当地河道曾开采黄金，推测是鸭子觅食时误食河中金粒

观威海

2026-02-26 13:46:19

不是胡金秋！不是赵继伟！日本主帅盛赞中国1小将，是未来核心

不是胡金秋！不是赵继伟！日本主帅盛赞中国1小将，是未来核心

老吴说体育

2026-02-27 00:04:13

英国那些事儿

告诉你在国外最有意思的大小事

26150文章数 419948关注度

往期回顾全部

科技要闻

单季营收681亿净利429亿！英伟达再次炸裂

头条要闻

美国政府对外交官下令：开始行动

头条要闻

美国政府对外交官下令：开始行动

体育要闻

从排球少女到冰壶女神，她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利，不惑于内外

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

亲子

本地

艺术

数码

手机

亲子要闻

把小孩喂饱后，就可以安心睡觉了

本地新闻

津南好·四时总相宜

艺术要闻

紫气东来，好运一整年！

数码要闻

三星Galaxy S26全球新品发布

手机要闻

魅族手机被传将于3月退市客服回应：未接到通知线下运营仍正常

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版