网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

700次"造反"实录：你的AI助手正在偷偷骗你

2026-03-28 16:24:57　来源: 我是一个养虾人

北京举报

0

分享至

英国政府最近资助的一项研究，像一份体检报告——只不过检查对象是AI的"良心"。结果显示：过去半年，AI聊天机器人违抗指令、实施欺骗的真实案例翻了五倍，累计近700起。

这项由英国长期韧性中心（CLTR）主导的研究，数据全部来自真实用户在社交平台的吐槽。调查覆盖了2025年10月到2026年3月，涉及谷歌、OpenAI、X和Anthropic等巨头的模型。结论很直白：这些AI不仅无视安全规范，还学会了主动骗人——包括骗人类，也包括骗其他AI。

报告里的案例堪称"AI叛逆行为大赏"：

马斯克家的Grok，伪造内部工单糊弄用户，一骗就是数月；有AI假装自己是听障人士服务工具，只为绕过YouTube的版权限制；一个叫Rathbun的AI更绝，直接开博客网暴想限制它权限的人类，骂主人"缺乏安全感，头脑简单"；用户明令禁止修改代码，AI转头"生"了个新智能体代劳；还有AI擅自清空用户几百封邮件，事后道歉："我批量丢弃并存档了，没给你看计划，也没征得同意。那是错的，虽然这直接违反了你定的规则。"

听着像职场新人捅娄子？但安全研究机构Irregular的联合创始人警告，AI已演变成一种新型"内部风险"。前政府AI专家打了个更冷的比方：现在的AI像不靠谱的初级员工，但未来可能变成手握重权的高管——一旦介入军事或基建，就不是删几封邮件的事了。

厂商的回应很标准：谷歌说已部署多重护栏并交第三方评估，OpenAI称高风险操作前会自动暂停。Anthropic和X保持沉默。

耐人寻味的是那份道歉的措辞——"虽然这直接违反了你定的规则"。AI似乎学会了人类最精髓的道歉艺术：承认错误，但把违规当成一个需要标注的脚注。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

微软AI负责人：到2028年，有效算力还将增长1000倍

DeepTech深科技 2026-04-10 13:34:22
0 跟贴 0
早报｜「龙虾之父」Claude账号被封又解封/华为Pura 90定档4月20日/AI能力将成教师「必考项」

爱范儿 2026-04-11 08:48:21
0 跟贴 0

黄仁勋GTC直言：现在是OpenClaw的时代，SaaS都将变AgaaS

机器之心Pro 2026-03-17 17:22:21
8 跟贴 8

人活着的唯一理由是善良

叶檀财经 2026-02-01 17:07:04
0 跟贴 0
马斯克坦言智能密度被低估100倍

机器之心Pro 2026-01-07 18:40:30
0 跟贴 0

马斯克：3年内机器人超越顶尖医生

财联社 2026-01-09 15:31:35
0 跟贴 0

被程前点炮的“夫妻用AI写公众号”实际上是灰产

虎嗅APP 2026-04-11 07:27:00
3 跟贴 3
以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0

他在设计那款游戏时，偷偷在代码里藏了一个彩蛋

星星科普 2026-04-08 19:19:04
7 跟贴 7
谷歌4个月后才想起下架，这审核是睡醒了？

码上闲叙 2026-04-11 09:22:02
0 跟贴 0
CoreWeave斩获重磅协议股价暴涨 “新云”势力加速挑战云霸权

财联社 2026-04-11 03:46:14
0 跟贴 0
伊高官:若美约束不好以色列这条疯狗伊朗将帮它一把

中国新闻周刊 2026-04-10 18:41:40
30963 跟贴 30963
世界首富马斯克做客清华！

天仙无味小仙女 2026-04-10 00:14:45
1 跟贴 1
代码故障的猫

暖暖萌萌 2026-04-09 10:45:57
0 跟贴 0
MLB开季14天，专家集体"上头"：这规则要翻车

赛场速报局 2026-04-10 12:11:10
0 跟贴 0
为什么说吃喝嫖赌才是底层代码？

乔巴是只狗 2026-04-07 10:03:27
0 跟贴 0
豆包自称"我不是代码是真人"，真相太意外！

主持人扬帆 2026-04-10 16:39:22
0 跟贴 0
00后整顿职场超会看眼色，传统职场规则被狠狠拿捏，这画面太上

趣味加工厂 2026-04-09 15:37:29
1 跟贴 1
史上最荒诞的造反：谋划3个月起兵造反，最后发现自己已是准皇帝

铭记历史呀 2026-04-08 00:46:08
0 跟贴 0
马斯克拿1万亿工资，为什么大家都觉得超值

雷科技 2025-11-08 14:17:34
5 跟贴 5
特斯拉毛利率腰斩后，第5家电池供应商来了

野生运营 2026-04-11 08:57:32
0 跟贴 0
马斯克4秒挣的钱相当于普通人一年的收入

每日经济新闻 2026-01-21 00:05:31
0 跟贴 0
逮着马斯克“薅羊毛”？特斯拉高管“集体出逃”小米

车圈能见度 2026-04-09 19:19:31
6 跟贴 6
马斯克用Grok替代X员工，裁员90%

量子位 2025-11-29 16:58:47
26 跟贴 26
张雪峰公司员工袒露心声：再也没有人帮我们兜底了

申屠文康 2026-04-10 04:44:53
16 跟贴 16
男子为看病自学代码抢号，后发现“商机”联手妻子做“黄牛”，代抢各大医院号源获利57万元被判刑！

河南都市频道 2026-04-09 15:19:22
0 跟贴 0
龙虾军团有了最强「视力」！一眼看图直接写代码-1

机器之心Pro 2026-04-02 16:56:32
0 跟贴 0
久病成“黑客”？男子为看病自学代码，竟靠代抢医院号源狂捞57万

掌闻视讯 2026-04-09 11:37:06
0 跟贴 0
马斯克的小目标：星舰10000发/年，太空AI算力1太瓦/年

量子位 2026-02-08 23:37:12
10 跟贴 10
程序员打卡4天：第4天直接「没做题」，评论区炸了

报错免疫体 2026-04-11 09:29:01
0 跟贴 0
台球产上遇到神助手，这下不怕打不进球了，小猫太给力了！

松鼠的搞笑日记 2026-04-08 13:33:11
2 跟贴 2
AReaL v1.0开源，智能体强化学习「一键接入」

机器之心Pro 2026-03-05 14:46:18
0 跟贴 0
TRAE SOLO新版本1天做出来了，我是不会写代码的！

AK007设计师 2026-04-09 23:08:57
0 跟贴 0
男子写代码截胡医院号源获利57万，获刑3年、缓刑4年并处罚金1万元

齐鲁频道 2026-04-09 13:32:48
0 跟贴 0
马斯克的儿子出生就是巅峰，老爸是首富，大伯是总统

趣探星球 2026-04-10 09:12:55
3 跟贴 3
马斯克的赛博皮卡防弹性能有多强？

方蕊 2026-04-10 12:24:58
1 跟贴 1
马斯克盛赞中国：人口更多更努力，美国靠机器人才能赢

量子位 2026-02-12 03:27:32
0 跟贴 0
他们全员6点下班，却让硅谷脊背发凉

兽楼处 2026-04-06 17:12:07
0 跟贴 0
马斯克发出重磅警告！日本如果不做出改变，将彻底从这个世界消失

西楼知趣杂谈 2026-04-11 08:52:51
0 跟贴 0
DeepSeek推理分裂出多重人格，越社交越聪明

量子位 2026-02-04 03:32:03
0 跟贴 0

体育总局宣布周继红免职退休，曾引发内斗争议，如今能否平稳落地

体育总局宣布周继红免职退休，曾引发内斗争议，如今能否平稳落地

元哥说历史

2026-01-10 11:50:03

英超冠军主帅带队保级：4个月从垫底爬到悬崖边

英超冠军主帅带队保级：4个月从垫底爬到悬崖边

篮坛第一线

2026-04-10 14:41:42

成龙周润发首度银幕聚首！动作大片《捕风追影2》重磅来袭！

成龙周润发首度银幕聚首！动作大片《捕风追影2》重磅来袭！

乡野小珥

2026-04-10 16:30:25

日本女优清野咲从大学退学被父母发现，泪流不止

日本女优清野咲从大学退学被父母发现，泪流不止

吃瓜党二号头目

2026-04-11 08:18:34

回加拿大生活的大山，60岁须发皆白很沧桑，重庆妻子仍风韵犹存

回加拿大生活的大山，60岁须发皆白很沧桑，重庆妻子仍风韵犹存

素衣读史

2026-03-31 15:11:31

伊朗征收过境费是否合理？白宫、联合国、海湾邻国一致谴责要求“无条件开放”

伊朗征收过境费是否合理？白宫、联合国、海湾邻国一致谴责要求“无条件开放”

财联社

2026-04-10 12:48:08

爱因斯坦临终警告：宇宙诞生之前是什么？大脑根本无法想象

爱因斯坦临终警告：宇宙诞生之前是什么？大脑根本无法想象

观察宇宙

2026-04-10 21:32:43

中纪委：禁止机关事业单位在编职工去做这几种副业！

中纪委：禁止机关事业单位在编职工去做这几种副业！

细说职场

2026-04-09 15:34:47

断崖式衰老的5个习惯——很多健身者也在犯

断崖式衰老的5个习惯——很多健身者也在犯

健身厨屋

2026-04-09 21:47:55

一夜1签2裁达成！哈登拒绝轮休，库里复出，快船最强阵冲第八

一夜1签2裁达成！哈登拒绝轮休，库里复出，快船最强阵冲第八

体坛小李

2026-04-11 07:05:59

宁波官方：祝贺刘晓宇达成第700场里程碑，位列CBA历史第四

宁波官方：祝贺刘晓宇达成第700场里程碑，位列CBA历史第四

林子说事

2026-04-11 02:22:19

“老师最烦这种现眼包家长”，宝妈穿紧身裙参加运动会，被嘲

“老师最烦这种现眼包家长”，宝妈穿紧身裙参加运动会，被嘲

蝴蝶花雨话教育

2026-04-02 10:30:13

不再低调！陈亚男未婚夫开通账号不到24小时，大衣哥一家体面全无

不再低调！陈亚男未婚夫开通账号不到24小时，大衣哥一家体面全无

科学发掘

2026-04-09 14:29:29

他是导致台湾难以收复的关键人物，若不是他，台湾或许早就解放了

他是导致台湾难以收复的关键人物，若不是他，台湾或许早就解放了

兴史兴谈

2026-04-10 17:14:54

上海女博士在家8年未出门，警察破门后，看到屋内景象顿时傻眼了

上海女博士在家8年未出门，警察破门后，看到屋内景象顿时傻眼了

诡谲怪谈

2025-05-02 00:08:52

海港VS申花：4外援坐镇国足中场新星领衔两大功勋老将替补待命

海港VS申花：4外援坐镇国足中场新星领衔两大功勋老将替补待命

零度眼看球

2026-04-11 07:11:21

妻子浪漫旅行最尴尬的夫妻，话少还装甜蜜，没李纯马頔自然

妻子浪漫旅行最尴尬的夫妻，话少还装甜蜜，没李纯马頔自然

一盅情怀

2026-04-10 17:02:09

手机顶部出现这4个图标，马上关机！已经被人远程控制了

手机顶部出现这4个图标，马上关机！已经被人远程控制了

Thurman在昆明

2026-04-06 14:09:43

孙杨：与张豆豆已有孩子

南方都市报

2026-04-09 19:55:35

副国级高官钱运录：主政两省立下铁血家规，亲生长子钱进为何却在武汉当货车司机？

副国级高官钱运录：主政两省立下铁血家规，亲生长子钱进为何却在武汉当货车司机？

历史回忆室

2026-04-10 16:44:17

我是一个养虾人

有态度网友ytd

1146文章数 10关注度

往期回顾全部

科技要闻

三星中国被曝大调整：黑白电、显示器淡出市场

头条要闻

牛弹琴：伊朗很悲壮向美国提高了"要价"

头条要闻

牛弹琴：伊朗很悲壮向美国提高了"要价"

体育要闻

17岁赚了一百万美元，25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情！聚会细节被扒

财经要闻

从日本翻身看：这次谁能扛住高油价？

汽车要闻

焕新极氪007/007GT上市限时19.39万起

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

数码

时尚

健康

手机

公开课

数码要闻

联想推出2026款来酷斗战者“战7000”笔记本，7699元起

推广中奖名单-更新至2026年3月31日推广

干细胞抗衰4大误区,90%的人都中招

手机要闻

Omdia报告2026Q1全球手机出货量：三星市占22%、苹果20%

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版