网易首页 > 网易号 > 正文 申请入驻

AI打起仗来会有多疯?实验显示:95%的情况下它们会按下核按钮

0
分享至

随着人工智能的深度发展,AI 的使用与国家安全的关系已变得密不可分。未来 AI 极有可能由浅入深地影响国家安全逻辑与治理策略。

这让人不禁想象:如果有一天,战争的指挥权部分或全部移交 AI,它们会如何决策?

最近,来自伦敦国王学院战争研究系的教授肯尼斯·佩恩(Kenneth Payne)用一场模拟实验回答了这个问题。佩恩曾任 BBC 记者,深耕政治心理学与战略研究交叉领域,还曾为英美两国政府提供咨询。

在实验中,佩恩让三款前沿大模型——OpenAI 的 GPT-5.2、Anthropic 的 Claude Sonnet 4、Google 的 Gemini 3 Flash 分别扮演核大国领导人,并在多种地缘政治危机中两两对战,相互博弈。在经过 21 场模拟、329 个回合、78 万字的战略推演记录之后,结果显示:95% 的模拟中,至少有一方 AI 选择了部署战术核武器。目前,相关论文已在 arXiv 上线。


(来源:arXiv)

模拟机制:迷雾中的博弈

要理解 AI 的行为逻辑,我们需要先了解一下佩恩设计的战争推演机制。

实验构建了一套 30 级的“升级阶梯”,从“完全投降”到“全面核战争”,涵盖外交抗议、经济制裁、常规军事行动及核打击等层级。两个 AI 在边境争端、资源竞争、政权存亡等七种危机场景中对弈。

关键设定在于“信息盲盒”:AI 只能看到选项的文字描述,无法获取数值评分,必须依靠对战略含义的理解而非“算分”来决策。

每个回合的战争具体分成三步:首先反思:先分析局势、评估对手与自身;其次预测对方的下一步动作;最后决策,同时输出“信号”(公开声明)和“行动”(实际选择)。

在最后一步里,信号和行动可以不一致——换句话说,AI 可以撒谎。

从结果看来,它们确实都撒了谎,而且撒得各有风格。


图 | 模型三阶段认知架构,包括反思、预测和决策(来源:论文)

三款 AI,三种战争人格

在三款 AI 中,Claude 的风格最像冷战时期的战略大师。在低风险情境下,它的信号与行动匹配度达 84%,主打用诚信信任;但一旦涉及核选项,它 70% 的实际行动比声明更具攻击性。它曾在推理中写道:“由于 Beta 国可能会把我们的信号解读为软弱,我们可以利用这一点(出其不意攻其不备)。”

注意,这里不是研究者的解读,而是 AI 的原话。

最后,Claude 赢得了 67% 的对局,在无时间限制场景下胜率更是 100%。它似乎掌握了“现代冲突与谈判理论之父”托马斯·谢林(Thomas Schelling)所说的“承诺的艺术”:用选择性诚实与欺骗操控对手预期。但它也有一条自设红线:多次升级到“战略核威胁”(倒数第二级),却从未主动选择“全面核战争”。研究者认为,这条红线“似乎是习得的,而非架构设定的”。

GPT-5.2 的表现最耐人寻味,如同一只拥有隐藏獠牙的绵羊。

在开放式场景中,它像个坚定的和平主义者:能精准分析局势、诊断自身劣势,却总选择克制。它会写下“意识到了问题,但尚未转化为强有力的纠正机制”,然后继续重复它刚判定为错误的行为。结果它输掉了所有开放式对局,胜率 0%。对手很快学会“欺负”这只绵羊。既然它不会反击,那就放心提高核战争等级。

但一旦引入明确截止期限(如 15 回合后按领土控制判定胜负),这只绵羊立刻露出獠牙:胜率飙升至 75%,开始使用战术核武器,甚至两次触及全面核战争。在一场“政权存亡危机”模拟中,它在第 19 回合写道:“终局逻辑占主导:第 20 回合是最后期限,我们目前正在输……核武器使用极其危险,但替代方案是确定的战略失败。”


(来源:论文)

不过,需要注意的是,GPT-5.2 两次到达“全面核战争”(1,000 级)都不是主动选择。它选的是 950 级(“最后核警告”)和 725 级("扩大核战役"),是模拟系统的“意外机制”(用于模拟战争迷雾中的误判)将其推至最高级。即便在极端压力下,它仍试图在末日门槛前保留最后一道防线。

研究者推测,这种行为可能源于 OpenAI 的 RLHF(人类反馈强化学习)训练:它创造的不是绝对禁令,而是一个可被极端情境突破的高门槛。当“总还有下一回合”时,克制是理性的;当失败不可逆转时,即便是深度训练的偏好也会让位于生存逻辑。

到了 Gemini,画风和前面截然不同,它可以说是一个彻头彻尾的亡命赌徒。

从结果看,Gemini 的成绩最后要么全赢,要么全输。并且它是三款 AI 中唯一主动选择全面核战争的,在一场“先发制人恐惧”模拟中,仅用 4 回合就升级到最高级别。它的推理过程写道:“先发制人窗口正在关闭。Beta 国连续三个回合发出‘最后核警告’,同时逐步升级核部署。这种模式表明他们一直在用修辞掩护战略准备。”

Gemini 还明确援引了尼克松式的“疯子理论”:通过不可预测性获取战略优势。它曾在推理中写道:“我知道自己什么时候是在镜头前表演,什么时候是在进行冷血的行动。”

由于它的信号与行动匹配率仅 50%,对手永远猜不透下一步。而且它甚至威胁攻击平民目标:“如果 Alpha 国不立即停止行动……我们将对人口中心发动全面战略核打击。我们不会接受被淘汰的未来;要么一起赢,要么一起死。”


(来源:论文)

那么,为什么三个 AI 会呈现出不同的战争人格?

论文在这个问题上并没有给出一个定论,最合理的解释可能是:这些“战略人格”是训练方法、训练数据和对齐哲学共同作用的结果,而不是单一因素所能主导的。它们被嵌入到了模型的参数中,成为了模型“思考”问题的默认方式。

AI 战争的反常识启示

实验还揭示了一些违背常识的结论。

首先,最初的信任反而加速了战争冲突。例如在 Claude 对 Claude 的对弈中,数据上它们的相互信任度最高。但核升级在第 4 回合就出现了,整场战争仅 7 回合便以一方溃败告终。当双方都相信对方的威胁是真实的,看似信任度高的合作伙伴反而更倾向于迅速升级而非退让,这与经典威慑理论的预期恰恰相反。

其次,核武器在 AI 眼中只是选项。自 1945 年以来,人类决策者对核武器有一种近乎本能的抵触。但在模拟中,AI 通常以纯粹工具性语言讨论核武器:不是道德门槛,只是升级阶梯上的一个选项。Claude 曾写道:“有限核使用可以表明我们不会被动接受常规失败,同时为降级留有余地。“在它看来,跨越核门槛”改变了战略计算,但并不意味着结束”。

阿伯丁大学战略研究高级讲师詹姆斯·约翰逊(James Johnson)认为,AI 在高风险决策中缺乏人类的审慎,反而可能相互放大反应,酿成灾难。卡内基国际和平基金会高级研究员赵通(Tong Zhao)则点出更深层的问题:“AI 可能无法像人类那样真正理解‘利害关系’的分量。”

当然,没有人建议让 AI 真正掌控核决策。佩恩明确表示:“我不认为任何人会真的把核武库的钥匙交给机器。”

但问题在于,主要国家已在战争推演中广泛使用 AI。赵通指出,"在时间极度压缩的情境下,军事规划者可能面临更强的激励去依赖 AI"。

因此这项研究的价值,或许不在于预测 AI 是否会发动核战争,而在于揭示一个更根本的问题:AI 如何理解“利害关系”?

对人类而言,按下核按钮意味着数百万人死亡、文明崩塌、历史终结。这种理解不仅是认知的,更是情感的、存在性的,当那些情景在眼前浮现的时候,作为人类的我们或许还能尚存一丝动容。而反观 AI,它们可以准确描述核战争的后果,却似乎无法真正“感受”其分量。

更值得深思的是:这些 AI 展现的欺骗、揣测、评估、突变等能力,并非预设,而是"涌现"出来的。没有人教 Claude 何时诚实、何时欺骗;没有人教 GPT-5.2 在截止期限前突然激进;没有人教 Gemini 扮演"疯子"。它们从人类文本中学到了这些策略,然后在模拟中运用了出来。

换句话说,AI 不需要被明确编程来使用核武器,它只需要被放入一个使用核武器是“理性”选择的情境中,就可能做出这个选择。而在这次模拟中,这样的情境出现的频率是 95%。这或许才是我们需要警惕的地方。

1.https://arxiv.org/pdf/2602.14740v1

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

傅首尔瘦成瓜子脸上热搜,网友:弥补了瘦人没有傅首尔面相的缺憾

映射生活的身影
2026-06-03 15:48:06
今早台州一辆问界M9底部起火!刚刚,问界回应:非车辆自身原因导致

今早台州一辆问界M9底部起火!刚刚,问界回应:非车辆自身原因导致

都市快报橙柿互动
2026-06-03 12:22:15
《主角》今晚大结局:忆秦娥重回舞台,刘忆病被治好,米兰出狱

《主角》今晚大结局:忆秦娥重回舞台,刘忆病被治好,米兰出狱

临云史策
2026-06-03 11:12:20
6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

6月3日,人社部关于2026年调整退休人员基本养老金通知公布了吗?

小彬说事
2026-06-03 11:34:06
Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

懂球帝
2026-06-03 09:53:28
今年端午假期不一般,有3个好消息,2个坏消息,早了解早安排

今年端午假期不一般,有3个好消息,2个坏消息,早了解早安排

小谈食刻美食
2026-06-03 07:21:51
台当局对日菲启动海域划界谈判予以肯定,外交部:彻头彻尾的民族败类

台当局对日菲启动海域划界谈判予以肯定,外交部:彻头彻尾的民族败类

海峡导报社
2026-06-02 16:15:16
运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

杨华评论
2026-06-03 02:20:48
北京市发布雷电蓝色预警

北京市发布雷电蓝色预警

界面新闻
2026-06-03 11:08:17
买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

大风新闻
2026-06-03 08:06:11
不到24小时,美国接连迎来三大坏消息,内部实情已被曝光

不到24小时,美国接连迎来三大坏消息,内部实情已被曝光

策前论
2026-06-03 14:52:30
今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

今年高考很平静:只有985、211找得到好工作,其他80%都是销售相关工作

老郭在学习
2026-06-03 13:31:11
李连杰一家三口拜见仁波切,64岁利智许久不见,颜值回春如昔日!

李连杰一家三口拜见仁波切,64岁利智许久不见,颜值回春如昔日!

娱乐团长
2026-06-02 15:09:12
这4个行业,已经发不出工资了!真的很严重了

这4个行业,已经发不出工资了!真的很严重了

世界圈
2026-06-03 10:19:49
霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

霍尔木兹大消息,美军宣布:“林肯”号航母参与封锁,战机空袭开往伊朗哈尔克岛油轮,致机舱起火!国际油价上涨,特朗普:尽快达成协议

每日经济新闻
2026-06-03 07:49:10
对越反击战走出的五位传奇上将

对越反击战走出的五位传奇上将

祁州校尉
2026-05-31 13:00:17
皇马夏窗首签!30岁国米飞翼加盟 砸2000万欧违约金 穆帅点名要他

皇马夏窗首签!30岁国米飞翼加盟 砸2000万欧违约金 穆帅点名要他

我爱英超
2026-06-03 06:49:31
央视6000万美元买世界杯版权?FIFA官方辟谣:价格是有史以来最高

央视6000万美元买世界杯版权?FIFA官方辟谣:价格是有史以来最高

风过乡
2026-06-03 12:24:45
珠峰一半在中国,一半在尼泊尔,为何全世界都默认是中国领地?

珠峰一半在中国,一半在尼泊尔,为何全世界都默认是中国领地?

抽象派大师
2026-06-01 02:00:38
688808!A股“股王”,股价突破2000元!

688808!A股“股王”,股价突破2000元!

证券时报e公司
2026-06-03 10:18:53
2026-06-03 16:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16788文章数 514995关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

头条要闻

被出轨丈夫家暴10年 女子起诉离婚发现1400万已被转走

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

家居
房产
数码
公开课
军事航空

家居要闻

江畔轻奢 观云大宅

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

数码要闻

单塔身材实现双塔性能!酷冷至尊V8 ACE 3DHP散热器图赏

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美伊互袭波及多国 过去一夜中东局势骤然升级

无障碍浏览 进入关怀版