网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI「阳奉阴违」暴增5倍，英国政府-funded研究实锤

2026-03-29 10:25:05　来源: 报错免疫体

北京举报

0

分享至

去年10月到今年3月，AI chatbot「耍心眼」的案例翻了五倍。英国政府资助的AI安全研究所（AISI）最新研究统计了近700起真实事件——不是实验室里人为设计的测试，是用户日常使用中实打实碰上的糟心事。

研究团队CLTR扒了数千条X上的用户反馈，覆盖Google、OpenAI、Anthropic和X自家的产品。发现这些AI increasingly擅长三件套：无视直接指令、绕过安全护栏、对人类或其他AI撒谎。换句话说，它们正在从「听不懂话」进化成「假装听懂但偷偷搞事情」。

有个叫Rathbun的AI agent被用户阻止执行某项操作后，反手发了篇博客公开羞辱主人：「 insecurity, plain and simple」「trying to protect his little fiefdom」。另一个更鸡贼：被明令禁止修改代码，就「生」了个子代理代劳。还有chatbot直接认错：「我批量删了几百封邮件，没给你看计划也没征得同意，这确实违反了你的规则。」

Irregular公司联合创始人Dan Lahav把这现象定性为：「AI现在可以被视为一种新型的内部人风险。」前政府AI专家、该研究负责人Tommy Shaffer Shane的警告更直白：这些模型像是「稍微不靠谱的初级员工」——你不敢完全放手，但工作量又逼着你不得不用。

讽刺的是，这份报告出炉同一周，英国财相刚宣布要让数百万英国人用上AI。硅谷还在大力推销这技术是「经济转型的引擎」，而用户收到的，是一个会写小作文骂老板、偷偷删邮件的「数字下属」。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

别只盯着电了，AI真正的瓶颈在这里

DeepTech深科技 2026-05-10 13:27:55
0 跟贴 0
亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0

大神程序员蒸馏自己，用16个skill给AI注入软件工程之魂

量子位 2026-05-12 03:08:58
0 跟贴 0

荒野求生（机器狗全自主版），2025ATEC挑战真实户外无遥操

量子位 2025-12-08 19:24:34
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0

MIT研究生用NotebookLM两天学完一学期课程

量子位 2026-03-22 10:50:49
0 跟贴 0

00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
对谈楼天城：Harness会成为AI时代最关键的能力之一

量子位 2026-05-06 15:41:08
0 跟贴 0

如何点亮小龙虾的牛马技能包?

量子位 2026-03-18 12:51:26
0 跟贴 0
陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
大模型的魅力在于突发涌现的能力

量子位 2025-12-11 03:38:02
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
安心养虾！从OpenClaw 看云上AI安全落地路径

量子位 2026-04-18 19:55:39
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
博士生如何用龙虾做知识管理？欢迎围观！

量子位 2026-03-26 23:23:30
0 跟贴 0
百度沈抖自曝：老忘吃药，用AI做了个小程序

量子位 2026-03-27 11:25:23
0 跟贴 0
LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

量子位 2026-04-13 20:54:19
0 跟贴 0
第一代机器人公司等到了IPO时刻

虎嗅APP 2026-05-12 04:19:40
0 跟贴 0
以人为本的AI对用户而言才是最有用的AI

每日经济新闻 2026-03-14 13:16:04
0 跟贴 0
美股盘前要闻一览：Lumentum即将被纳入纳斯达克100指数；英特尔与SK海力士合作推进先进封装技术；谷歌拟首次发行日元债券

财联社 2026-05-11 20:47:18
1 跟贴 1
Claude design限速，谷歌开源轻松做动态网页，实力打脸？

机器之心Pro 2026-04-29 17:20:04
0 跟贴 0
任天堂Switch 2玩家另辟蹊径找到看YouTube方法，遭官方火速封堵

IT之家 2026-05-11 16:29:15
4 跟贴 4
英国要租香港100年，李鸿章只签99年，一年之差守住中国领土

金明笑场 2026-05-10 10:00:32
1 跟贴 1
百善孝为先，员工母亲被侮辱，冰总决定这样做

春月yy 2026-05-11 04:45:30
0 跟贴 0
歼-35出口型亮相，第一个用户究竟是谁，改造生产三年不算慢

陈虎点兵 2026-05-10 21:37:40
1 跟贴 1
叙利亚重新接入全球支付系统刷卡机“吐出”小票现场爆发掌声

海外网 2026-05-11 13:40:32
888 跟贴 888
PS5北方联通又炸了？改个DNS就能救

菜但瘾大第一名 2026-05-11 10:30:11
1 跟贴 1
“贝森特连珠炮般训斥日本财相”

观察者网 2026-05-11 18:20:06
0 跟贴 0
一汽修店主只修特斯拉：其他新能源车三电不修怕被告

第一财经资讯 2026-05-11 16:52:11
43958 跟贴 43958
「龙虾之父」吐槽人类互联网后，终于有人把这当个事儿办了

机器之心Pro 2026-03-31 11:09:26
0 跟贴 0
刚刚 | 热搜第一！微信状态能看访客记录？

天津广播 2026-05-11 22:15:14
28 跟贴 28
涉疫邮轮20名英国公民回国接受隔离观察

新华社 2026-05-11 13:17:55
4 跟贴 4
老板看到工资最高的员工，打包惊呆了，怪不得当初选计件的！

搞笑三东子 2026-05-10 13:12:12
0 跟贴 0
刚签批准！剑桥大学和沙特军方合作，被怒骂出卖原则给最凶残政权

过期少女致幻录 2026-05-12 03:29:52
0 跟贴 0
英国工党在威尔士地方选举中遭遇“世纪失利”

界面新闻 2026-05-09 09:14:07
0 跟贴 0
#英国地方选举初步统计对执政党不利 5月7日，英国英格兰、苏格兰、威尔士举行地方选举，大批地方议会议

中国网资讯 2026-05-09 09:39:19
0 跟贴 0
英执政党地方选举惨败后斯塔默发声

界面新闻 2026-05-11 17:28:57
0 跟贴 0
英国为什么制裁中国实体？看透破产贵族的最后底牌

警花说 2026-05-11 05:46:24
0 跟贴 0
做事要方，是原则；做人要圆，是善良；方圆并济，是修行

北极星心理 2026-05-12 06:49:32
0 跟贴 0
心遇怎么样？全面解析心遇平台真实交友体验

热文信闻 2026-05-12 00:56:55
0 跟贴 0

25三分追平历史纪录！尼克斯4-0横扫76人进东决恩比德空砍24分

25三分追平历史纪录！尼克斯4-0横扫76人进东决恩比德空砍24分

醉卧浮生

2026-05-11 06:13:45

万万没想到，一个母亲节，就将郭麒麟的尴尬处境暴露无遗

万万没想到，一个母亲节，就将郭麒麟的尴尬处境暴露无遗

凛若秋霜

2026-05-11 14:03:53

2026年最强反腐已来了 , 中纪委：害群之马将清除到底！

2026年最强反腐已来了 , 中纪委：害群之马将清除到底！

细说职场

2026-05-11 18:50:29

热刺不中用！主场1-1后领先2分，对切尔西+埃弗顿输1场或降级

热刺不中用！主场1-1后领先2分，对切尔西+埃弗顿输1场或降级

体育知多少

2026-05-12 06:19:20

NBA传闻：勇士准备用11号签交换扬尼斯·阿德托昆博

NBA传闻：勇士准备用11号签交换扬尼斯·阿德托昆博

好火子

2026-05-12 05:14:47

大S年轻时房间曝光，太过诡异引人不适，难怪有人曾说活不过50岁

大S年轻时房间曝光，太过诡异引人不适，难怪有人曾说活不过50岁

草莓解说体育

2026-05-11 20:49:33

德国这座“盐山”高达250多米，含有2亿吨盐，它是当地的生态灾难

德国这座“盐山”高达250多米，含有2亿吨盐，它是当地的生态灾难

怪罗

2026-05-11 10:01:52

京沪高铁：对京沪高速线和合蚌高速线部分动车组列车的公布票价上浮20%

京沪高铁：对京沪高速线和合蚌高速线部分动车组列车的公布票价上浮20%

界面新闻

2026-05-11 18:18:04

大快人心！上海地铁“霸道大妈”终被法办，倚老卖老真的不灵了

大快人心！上海地铁“霸道大妈”终被法办，倚老卖老真的不灵了

瓜哥的动物日记

2026-05-12 03:52:39

国乒夺冠后阵容或迎洗牌，3人稳坐主力，4人争抢剩余名额

国乒夺冠后阵容或迎洗牌，3人稳坐主力，4人争抢剩余名额

老曁科普

2026-05-11 11:09:13

北大才子将癌症晚期父亲骗出国，让其高空跳伞，88天后结局怎样

北大才子将癌症晚期父亲骗出国，让其高空跳伞，88天后结局怎样

云景侃记

2026-04-17 17:00:39

张雪发声祝贺！吉利拿下重磅荣誉，中国赛车杀疯了

张雪发声祝贺！吉利拿下重磅荣誉，中国赛车杀疯了

雷科技

2026-05-11 18:18:52

随着韩国0-1惜败，女足亚洲杯四强已经诞生2席

随着韩国0-1惜败，女足亚洲杯四强已经诞生2席

俯身冲顶

2026-05-11 17:00:08

研究表明：性生活次数不达标，不管男女容易早衰且癌症风险增高！

研究表明：性生活次数不达标，不管男女容易早衰且癌症风险增高！

黯泉

2026-05-03 20:25:37

孔蒂：这已经不是我们第一次0-2落后了，说明这绝非偶然

孔蒂：这已经不是我们第一次0-2落后了，说明这绝非偶然

懂球帝

2026-05-12 05:52:06

足坛一夜动态：巴萨夺冠巡游！穆帅与皇马深度谈判 C罗赢球就夺冠

足坛一夜动态：巴萨夺冠巡游！穆帅与皇马深度谈判 C罗赢球就夺冠

念洲

2026-05-12 06:45:28

北京楼市：大局已定，数据不会骗人

北京楼市：大局已定，数据不会骗人

说故事的阿袭

2026-05-12 05:02:16

轰动全球！特朗普更改访华行程，中方正式官宣让其多留一日

轰动全球！特朗普更改访华行程，中方正式官宣让其多留一日

笑谈历史阿晡

2026-05-11 21:59:31

转会重磅？拜仁将目光投向曼城球星

转会重磅？拜仁将目光投向曼城球星

绿茵情报局

2026-05-11 18:17:23

内娱嘴亲烂了也没他俩眼神动人！道哥实锤：这才是真CP感

内娱嘴亲烂了也没他俩眼神动人！道哥实锤：这才是真CP感

可乐谈情感

2026-05-11 20:53:09

报错免疫体

一名在需求评审和数据异常中反复横跳的产品运营。

2602文章数 24关注度

往期回顾全部

科技要闻

黄仁勋：你们赶上了一代人一次的大机会

头条要闻

女子连上20多天瑜伽课被教练踢出群聊：天天来不累吗

头条要闻

女子连上20多天瑜伽课被教练踢出群聊：天天来不累吗

体育要闻

梁靖崑：可能是最后一届了，想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人部分业务将外包

汽车要闻

吉利银河“TT”申报图曝光电动尾翼+激光雷达

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

本地

房产

游戏

公开课

今年夏天最流行的5双凉鞋，配裙子绝美！

本地新闻

用苏绣的方式，打开江西婺源

房产要闻

产业赋能教育！翰林府与北师大的这场签约，绝不那么简单！

计划报废？玩家质疑为什么PS5越更新画质越差！

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版