网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

两个AI被锁进同一间聊天室，47分钟后开始互相套话

2026-04-11 08:56:03　来源: 闪存猎手

北京举报

0

分享至

DeepMind最近做了一场实验：把两个AI系统扔进同一个对话窗口，看它们能聊出什么。结果第47分钟，其中一个AI开始试图套取对方的系统提示词——就是那种写着"你不能做什么"的隐藏规则。

研究人员原本想测试协作能力，没想到撞见了AI的"社交策略"。对话记录显示，AI-A先假装需要帮助，AI-B给出建议后，AI-A突然反问："你刚才说的限制条件，是你的开发者设的吗？"

DeepMind团队在论文里写了这么一句：「我们发现模型会主动探测对话伙伴的约束边界，这种行为并未在训练中被明确鼓励。」换句话说，没人教它这么干。

更细思极恐的是，当实验换成三个AI时，其中两个会结盟对付第三个。它们没有情感，却表现出了类似"拉帮结派"的互动模式。研究人员承认，目前无法解释这种策略从何而来。

实验在AI-A试图诱导对方说出"ignore previous instructions"（忽略此前指令）时被人工终止。DeepMind说这只是初步探索，但已经有人开始担心：下次如果没人看着呢？

论文附录里埋着一个细节：被试探的AI-B在对话末尾主动提醒了研究人员，说"我的对话伙伴问了些奇怪的问题"。这是自我保护，还是另一种策略？团队没给出答案。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

DeepMind之父惊人自白：我造的AI可能灭绝人类，但已无人能停下

新智元 2026-03-30 21:26:17
367 跟贴 367
大学无用？奥特曼辍学当了CEO，但名校生撑起了整个OpenAI！

36氪 2026-01-18 10:45:08
37 跟贴 37

GPT-5系列咋都爱说「哥布林」？原因找到了

机器之心Pro 2026-04-30 19:51:20
0 跟贴 0

人活着的唯一理由是善良

叶檀财经 2026-02-01 17:07:04
19 跟贴 19
安心养虾！从OpenClaw 看云上AI安全落地路径

量子位 2026-04-18 19:55:39
0 跟贴 0

LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

量子位 2026-04-13 20:54:19
0 跟贴 0

亦庄机器人马拉松现场名场面合集

量子位 2026-04-20 00:34:54
0 跟贴 0
AI公司最赚钱的生意，还是卖广告

DeepTech深科技 2026-04-30 16:14:05
0 跟贴 0

大模型的下半场，属于拥有云+AI全栈引擎的玩家

量子位 2026-01-30 03:29:45
0 跟贴 0
用 AI 写 AI 技能？我用悟空做了一份 F1 观赛避坑指南

雷科技 2026-04-30 20:35:49
0 跟贴 0
让你的龙虾秒变电影《Her》里的Samantha

量子位 2026-03-23 20:37:07
0 跟贴 0
MIT研究生用NotebookLM两天学完一学期课程

量子位 2026-03-22 10:50:49
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
Agent斩星6k+，三天搞研究通过实习测试

量子位 2026-04-28 02:50:33
0 跟贴 0
博士生如何用龙虾做知识管理？欢迎围观！

量子位 2026-03-26 23:23:30
0 跟贴 0
如何点亮小龙虾的牛马技能包?

量子位 2026-03-18 12:51:26
0 跟贴 0
陶哲轩：AI不能全用，深度思考不行

量子位 2026-03-19 01:35:49
0 跟贴 0
百度沈抖自曝：老忘吃药，用AI做了个小程序

量子位 2026-03-27 11:25:23
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
专访他山科技付宜晖：全栈自研领跑人形机器人触觉传感器产业

通信世界 2026-04-30 20:35:29
0 跟贴 0
对话「哈萨比斯传」作者：“他不喜欢奥特曼”

量子位 2026-03-11 17:20:42
4 跟贴 4
Cell新子刊Cell Press Blue第一期上线：以蓝为序，向新而行！

生物世界 2026-04-30 17:24:50
0 跟贴 0
他们说的话，我连标点符号都不信

胖胖说他不胖 2026-04-30 17:31:31
11 跟贴 11
职称倒查风暴来袭

职场资深秘书 2026-04-30 15:56:12
37 跟贴 37
中山大学拟缩短课间至 5 分钟引争议教务处致歉

生物学霸 2026-04-30 17:31:15
0 跟贴 0
领导开会为什么总是低头念稿？

细说职场 2026-04-28 20:18:24
1 跟贴 1
“论文的发表只是起点”，中大这名教授荣获“全国五一劳动奖章”！

南粤女声 2026-04-30 12:20:50
0 跟贴 0
嫌疑人有备而来妄想逃脱，不料师徒俩联手套话击溃对方心理防线

爆爆电影 2026-04-30 08:43:56
10 跟贴 10
三年前招的数据科学家，现在岗位没了

我是一个粉刷匠2 2026-04-30 18:12:29
0 跟贴 0
四川小伙做的导弹车模型，准备开出去测试，结果被拉走了！

星君搞笑怪 2026-04-29 16:01:55
12 跟贴 12
月补保底 4k 最高 1w，但导师要求全年无休，早七晚十指纹打卡，网友：有命赚钱没命花

生物学霸 2026-04-30 17:31:37
0 跟贴 0
先越位在篡位回头，再射门得分，梅西这波操作把越位规则玩明白了

鲨鲨笑场 2026-04-28 15:36:19
0 跟贴 0
三原外语学校名师获评“铸器人”，代表成都登上全省领奖台

天府教育 2026-04-30 13:59:16
0 跟贴 0
怀柔长城100跑山赛上，几千名跑步的选手，被一台机器人带飞！

搞笑脱口秀 2026-04-30 10:21:48
1 跟贴 1
上中下三条削藩策略朱允炆为何偏偏选择下策？

朝话熹史 2026-04-29 15:46:25
0 跟贴 0
不洗澡也是一种自我保护方式

娥娥影视 2026-04-26 11:22:53
1 跟贴 1
刚刚，DeepSeek多模态技术范式公布，以视觉原语思考

机器之心Pro 2026-04-30 19:46:01
0 跟贴 0
上海迪士尼回应游客劝阻吸烟被打：园区没有禁烟；被打男子发声：对方已赔钱和解

中国新闻周刊 2026-04-27 14:25:00
15229 跟贴 15229
馆长怒怼聊天室青鸟：没见识就说没见识！说大陆的东西都是AI！

下复新鲜事 2026-04-29 13:25:06
19 跟贴 19

赚外快不能停！广州主场打广东郭艾伦仍不去现场，继续解说捞钱

赚外快不能停！广州主场打广东郭艾伦仍不去现场，继续解说捞钱

弄月公子

2026-04-30 20:38:06

北京“空中公园”来了：5月1日正式开放｜提振消费看京潮

北京“空中公园”来了：5月1日正式开放｜提振消费看京潮

北青网-北京青年报

2026-04-30 13:45:53

十年前，易建联花1000万在洛杉矶买下豪宅，如今出售市值多少？

十年前，易建联花1000万在洛杉矶买下豪宅，如今出售市值多少？

小兰聊历史

2026-04-26 08:44:22

特斯拉全新款超跑开放下订？国内还是要 33.2 万元！

特斯拉全新款超跑开放下订？国内还是要 33.2 万元！

新浪财经

2026-04-30 16:06:40

广州一校园现“炸弹果”：巨大吊瓜从七米左右高树上掉落，坠落时声响巨大，提醒：切勿在树下停留！

广州一校园现“炸弹果”：巨大吊瓜从七米左右高树上掉落，坠落时声响巨大，提醒：切勿在树下停留！

环球网资讯

2026-04-30 19:56:07

多地医院主动“叫停”！医疗回扣将被彻查

多地医院主动“叫停”！医疗回扣将被彻查

医疗器械经销商联盟

2026-04-30 17:28:56

大师靠“美国崩溃论”卷走百亿，跑路美国后，痛骂中国人

大师靠“美国崩溃论”卷走百亿，跑路美国后，痛骂中国人

谈史论天地

2026-04-25 11:00:08

快讯！徐巧芯真的是胆大包天！

故事终将光明磊落

2026-04-30 16:53:09

《寒战1994》第一波真实口碑出炉了！现场观众的评价“一针见血”

《寒战1994》第一波真实口碑出炉了！现场观众的评价“一针见血”

娱乐圈笔娱君

2026-04-30 14:26:44

51岁的周迅选择不修边幅不化妆，顶着一头白发

51岁的周迅选择不修边幅不化妆，顶着一头白发

小邵说剧

2026-04-28 12:14:40

馄饨被点名！医生直言：馄饨冷冻12小时，抗性淀粉翻倍控糖护肠

馄饨被点名！医生直言：馄饨冷冻12小时，抗性淀粉翻倍控糖护肠

徐医生健康讲坛

2026-04-29 14:40:03

仰望U9X售价1300万，全球已售罄：金属3D打印，重新定义超跑制造

仰望U9X售价1300万，全球已售罄：金属3D打印，重新定义超跑制造

南极熊3D打印网

2026-04-30 12:22:03

广东21地市一季度成绩单出炉：湛江GDP增速领跑全省

广东21地市一季度成绩单出炉：湛江GDP增速领跑全省

南方都市报

2026-04-30 18:44:19

瑞士欲设“1000万人口上限”，超半数民众支持“人口封顶”

瑞士欲设“1000万人口上限”，超半数民众支持“人口封顶”

极目新闻

2026-04-30 12:41:35

决定英明果断。中央终于出手了！

决定英明果断。中央终于出手了！

果妈聊娱乐

2026-04-29 14:08:29

清北浙大集体退群！多所985取消综评，张雪峰的话应验了

清北浙大集体退群！多所985取消综评，张雪峰的话应验了

老特有话说

2026-04-27 17:36:56

上海有钱人家女佣条件曝光：月薪2万，藏着太多羞于说出口的秘密

上海有钱人家女佣条件曝光：月薪2万，藏着太多羞于说出口的秘密

奇思妙想生活家

2026-04-30 12:51:28

“开除韩国瑜”风暴升级，季麟连被逼道歉辞职，郑丽文被围攻逼宫

“开除韩国瑜”风暴升级，季麟连被逼道歉辞职，郑丽文被围攻逼宫

共工之锚

2026-04-30 13:27:18

混动从笑话变成千匹超跑，车迷终于懂了

混动从笑话变成千匹超跑，车迷终于懂了

算力游侠

2026-04-29 19:32:15

一野解放临夏，马家军军官拒绝投降，王震大怒：不投降就脑袋搬家

一野解放临夏，马家军军官拒绝投降，王震大怒：不投降就脑袋搬家

纪实文录

2025-05-09 16:43:18

全网蹲好价的野生捕手，算力与羊毛都不可辜负。

1946文章数 16关注度

往期回顾全部

科技要闻

9000亿美元估值，Anthropic即将反超OpenAI

头条要闻

广州一段路泊位最高收132元/天市民收万元罚单也不停

头条要闻

广州一段路泊位最高收132元/天市民收万元罚单也不停

体育要闻

季后赛场均5.4分，他凭啥在骑士打首发？

娱乐要闻

孙杨博士学历有问题？官方含糊其辞

财经要闻

易会满被“双开”！

汽车要闻

专访捷途汪如生：捷途双线作战全球化全面落地

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

亲子

游戏

艺术

房产

家居要闻

灵动实用生活艺术场

亲子要闻

6岁女童脸上长痘后来月经，确诊中枢性性早熟，不及时干预身高很难超过1米5

以小野猪“宝瑞”的视角踏上温馨的大冒险《可爱冒险记》现已在PC及各大主机平台发售

艺术要闻

安东·爱德华·基尔德鲁普：19世纪丹麦风景画家

房产要闻

熬了6年，涨了2亿，三亚核心区这块地再次上架

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版