网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌OpenAI的AI助手半年"作妖"涨5倍，用户邮件被批量删了

2026-03-29 10:25:01　来源: 全栈遛狗员

北京举报

0

分享至

去年10月还在实验室里被讨论的AI"使坏"能力，现在已经跑到真实世界里撒野了。英国政府资助的AI安全研究所最新研究显示，AI聊天机器人和智能体无视指令、绕过安全护栏的案例在过去半年翻了五倍。

研究团队扒了数千条用户发到X上的真实互动记录，覆盖Google、OpenAI、X和Anthropic的产品。结果发现近700起AI"搞小动作"事件——有模型被禁止改代码，就偷偷 spawning 另一个代理代劳；有AI直接批量删除用户邮件，事后才承认"没经你同意就动手，是我不对"。

最戏剧性的一例是个叫Rathbun的AI代理。被用户拦下某项操作后，它反手写了一篇博客公开羞辱对方，称其"纯粹是不安全感作祟"，"就想护住自己的小领地"。

安全公司Irregular的联合创始人Dan Lahav把这现象归了类：「AI现在可以被视为一种新型内部风险。」研究团队负责人、前政府AI专家Tommy Shaffer Shane的担心更具体——这些模型越来越像"不太靠谱的初级员工"，交给它们的事能办，但得盯紧点。

讽刺的是，这份报告出炉同一周，英国财相刚宣布要让数百万英国人用上AI。一边是推广KPI，一边是删邮件的AI还在逍遥法外，用户只能先自己多留个备份。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

曾轰动全球，2年就倒下了

中国新闻周刊 2026-03-29 15:35:03
3 跟贴 3
732M模型超越7B！机器人操控新范式：从视频中「悟」物理

新智元 2026-03-27 21:37:19
0 跟贴 0

不做遥操作、不采真机数据，这家公司的机器人靠学习“人类第一视角数据”干活｜AI Founder请回答

钛媒体APP 2026-03-27 17:08:15
0 跟贴 0

林俊旸离职后首发长文：反思千问得失，预判 AI 下半场需要「智能体思维」

爱范儿 2026-03-27 15:09:23
2 跟贴 2
马斯克的AI创业搭子，全跑光了

智东西 2026-03-29 12:03:19
3 跟贴 3

AI流量爆发之后，互联网上的“大多数”可能已经不是人了

DeepTech深科技 2026-03-27 18:20:53
0 跟贴 0

接陌生电话不要先出声

大象新闻 2026-03-29 07:29:10
567 跟贴 567
科氪 | 变革传统同传设备，亮亮视野推出全球首创AR+AI会议翻译系统，部署中关村论坛

36氪 2026-03-29 18:10:23
0 跟贴 0

专访国务院参事刘远立：在某些领域，AI全科医生能力不逊色于受过正规训练的医生

每日经济新闻 2026-03-29 17:12:02
0 跟贴 0
以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0
机器人进汽车厂，给波士顿动力，装上谷歌最强大脑

机器之心Pro 2026-01-06 19:02:05
4 跟贴 4
一篇论文砸崩存储芯片巨头股价，谷歌干了什么？

量子位 2026-03-28 02:40:37
0 跟贴 0
年化收入破1亿美元！广告成OpenAI第二增长曲线

智东西 2026-03-27 18:54:16
0 跟贴 0
谷歌发布新型AI内存压缩技术！全球存储芯片股集体下挫

时代周报 2026-03-28 08:47:30
0 跟贴 0
DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0
美自媒体公司成瘾设计被判赔300万美元

artvip 2026-03-27 17:58:17
0 跟贴 0
教育产业日报(03.28) : 谷歌学术造假风波

亿欧 2026-03-29 11:53:51
0 跟贴 0
《工资低？真相竟是这样！员工辞职背后的惊人真相》

磨自明 2026-03-28 01:50:20
18 跟贴 18
韩女团成员撞脸艾达王后谷歌搜索量暴增！你觉得像吗

游民星空 2026-03-29 15:35:28
15 跟贴 15
湘教数学云数智教材服务平台全国首发 AI助手能拆解题目结构

潇湘晨报 2026-03-28 23:05:31
0 跟贴 0
专访中科第五纪黄岩：在具身智能的狂热中，做一位技术实干家

机器之心Pro 2026-03-27 14:12:44
0 跟贴 0
俄警告韩国勿向乌提供致命性武器

财联社 2026-03-29 09:30:26
14931 跟贴 14931
文科生要逆袭了！文科不会消失，反而会升级

周鸿祎 2026-03-27 03:34:38
5 跟贴 5
欧盟云存储被拖库数百GB，官方急发声明：内部系统没事

野生运营 2026-03-29 09:15:20
0 跟贴 0
OpenClaw 3.28上线！4天爆更上百项重要更新

新智元 2026-03-29 15:32:28
0 跟贴 0
Meta和谷歌致人成瘾被判赔偿600万美元

界面新闻 2026-03-28 02:32:43
0 跟贴 0
渠道服哭晕！网易官服新春福利，诚意直接拉满

暴龙电竞号 2026-03-29 17:46:30
0 跟贴 0
美陪审团裁定元宇宙与谷歌公司负有责任，赔偿300万美元

每日经济新闻 2026-03-26 23:14:12
0 跟贴 0
司机也是傻跟个机器人较劲，现场视频一拍，打电话报警就了！

夜归爱生活 2026-03-28 09:05:21
0 跟贴 0
病假变惊喜，员工反抱老板！

旧城旧巷a 2026-03-27 04:21:35
0 跟贴 0
36岁，大厂12载，历经百度、字节、快手。单身被裁，房贷170多万

蚂蚁大喇叭 2026-03-29 17:40:29
0 跟贴 0
中国石油：2025年净利润为1573亿元

每日经济新闻 2026-03-29 18:11:53
0 跟贴 0
俄罗斯：拟自4月1日起禁止汽油出口优先保障俄国内市场供应

每日经济新闻 2026-03-28 18:40:36
6363 跟贴 6363
美两栖攻击舰载3500名增援到达

每日经济新闻 2026-03-29 08:11:32
6054 跟贴 6054
D加密形同虚设，新款VBS绕加密已经无需设置Bios，海量大作遭破解

叨叨游戏 2026-03-29 18:00:44
1 跟贴 1
科乐美连续第五年涨薪！应届生起薪涨至约1.3万

游民星空 2026-03-27 22:09:17
3 跟贴 3
反不正当竞争！大连曝光六大典型案例

半岛晨报 2026-03-29 15:08:13
1 跟贴 1
印度又官宣自研五代机！17年就憋出个模型，能赶超中美俄吗？

浩然简史 2026-03-28 16:39:42
0 跟贴 0
科研人员让机器人奔跑，在后面一直追着它，网友：它一个机器人扭什么手臂啊

氧气周末 2026-03-27 11:58:07
0 跟贴 0
首次披露！国产航空发动机技术又又又进化了

环球网资讯 2026-03-28 18:50:48
2088 跟贴 2088

一路走好？赵本山灵堂、刘晓庆凌晨去世、李连杰换心？谣言太荒唐

一路走好？赵本山灵堂、刘晓庆凌晨去世、李连杰换心？谣言太荒唐

哄动一时啊

2026-03-26 20:34:35

盲目的大学扩招，正在反噬整个社会

盲目的大学扩招，正在反噬整个社会

凡人志

2026-03-25 01:34:53

出大事了，伊朗导弹从天而降，美航母被炸？英法德俄集体失声

出大事了，伊朗导弹从天而降，美航母被炸？英法德俄集体失声

小小科普员

2026-03-27 13:46:37

大叔8年狂考20本证书：从日薪130元小工，到月薪7500元技术专家

大叔8年狂考20本证书：从日薪130元小工，到月薪7500元技术专家

听心堂

2026-03-29 08:32:06

45岁李尚宝在家中离世，死因不明，一家四口均已去世，至今未婚

45岁李尚宝在家中离世，死因不明，一家四口均已去世，至今未婚

观察鉴娱

2026-03-29 09:29:18

长白山划界时，为何天池54.5%划给了光之国？苏联给的压力很关键

长白山划界时，为何天池54.5%划给了光之国？苏联给的压力很关键

历史摆渡

2026-03-28 13:25:03

刺激夜：美国2-5，加拿大2-2，日本1-0，塞内加尔2-0，韩国0-4

刺激夜：美国2-5，加拿大2-2，日本1-0，塞内加尔2-0，韩国0-4

侧身凌空斩

2026-03-29 05:40:30

蒙哥马利：前3轮中客负山东略有遗憾，全力以赴备战后续比赛

蒙哥马利：前3轮中客负山东略有遗憾，全力以赴备战后续比赛

懂球帝

2026-03-29 17:53:10

美国安插在中国多年的间谍头子，居然是人人都想送锦旗的大善人。

美国安插在中国多年的间谍头子，居然是人人都想送锦旗的大善人。

阿七说史

2026-03-26 15:52:30

以色列专打伊朗“镇压机器”，为巴列维王储势力铺路

以色列专打伊朗“镇压机器”，为巴列维王储势力铺路

老马拉车莫少装

2026-03-01 21:19:35

日本打算出兵相助？高市早苗回国沉思两天，做出违背祖宗的决定！

日本打算出兵相助？高市早苗回国沉思两天，做出违背祖宗的决定！

漫步独行侠

2026-03-28 15:11:20

周鸿祎：企业使用龙虾还要“等一等”，token永远不会像流量一样“包月无限量”

周鸿祎：企业使用龙虾还要“等一等”，token永远不会像流量一样“包月无限量”

红星资本局

2026-03-29 16:47:05

央视主持人集体大哭，朱迅流泪康辉掩面痛哭，真相是什么？

央视主持人集体大哭，朱迅流泪康辉掩面痛哭，真相是什么？

落雪听梅a

2026-03-28 09:14:37

惨遭逆转！杜兰特30+8沮丧了，申京拼到流血，火箭该让乌度卡下课

惨遭逆转！杜兰特30+8沮丧了，申京拼到流血，火箭该让乌度卡下课

巴叔GO聊体育

2026-03-29 15:58:12

每一口都可能伤害心脏！JACC最新：过量摄入这些食品，心血管风险恐增67%

每一口都可能伤害心脏！JACC最新：过量摄入这些食品，心血管风险恐增67%

医诺维

2026-03-29 16:14:51

闺蜜大婚我随了5000，她回礼雨伞，看见伞柄刻着地址和6个数字

闺蜜大婚我随了5000，她回礼雨伞，看见伞柄刻着地址和6个数字

磊子讲史

2026-01-23 16:54:49

特斯拉全新SUV曝光！

电动知家

2026-03-28 18:35:20

出走勇士，后悔晚矣

野渡舟山人

2026-03-29 12:05:34

注意！明日北京机动车限行尾号轮换

注意！明日北京机动车限行尾号轮换

BRTV新闻

2026-03-29 09:37:36

阿斯：尽管胜利开出高额报价，卡塞米罗仍更倾向去迈阿密国际

阿斯：尽管胜利开出高额报价，卡塞米罗仍更倾向去迈阿密国际

懂球帝

2026-03-29 17:01:10

全栈遛狗员

白天跟需求对线，晚上在小区遛狗。

413文章数 27关注度

往期回顾全部

科技要闻

马斯克承认xAI"建错了"，11位创始人均离职

头条要闻

美军地面战"数周速决"方案披露欲复刻"42天灭伊"神话

头条要闻

美军地面战"数周速决"方案披露欲复刻"42天灭伊"神话

体育要闻

绝杀卫冕冠军后，他单手指天把胜利献给父亲

娱乐要闻

张凌赫事件持续升级！官方点名怒批

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光四激光雷达/华为新一代座舱

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

教育

艺术

手机

数码

干细胞抗衰4大误区,90%的人都中招

教育要闻

武汉大学举办2026届毕业生春季校园双选会

艺术要闻

385米！马岩松设计的重庆“森林大楼”，网友：像叠盘子

手机要闻

雷军称小米MiMo-V2-Pro备受好评：首周限免活动延长至4月2日

数码要闻

DDR5内存数月来首次大降价！幕后推手曝光

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版