网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

最新AI军事模拟：Claude、Gemini、GPT对决，95%对局发射核弹

2026-02-28 09:56:07　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：艾伦好困

【新智元导读】最新 AI 模拟军事博弈揭示致命真相：面对地缘危机，最先进的 AI 在 95% 的对局中按下了核按钮。机器不懂恐惧，拒绝投降，安全协议在压力下全面失效。而五角大楼正将其引入真实指挥室，人类的和平岁月岌岌可危。

在人类掌握核武器的八十多年里，支撑脆弱和平的基石是一种极其感性的心理状态——对彻底毁灭的恐惧。

当冷战的危机逼近顶点时，决策者往往会在悬崖边退缩。

如今，把这种关乎人类存亡的决策权交给最先进的 AI，会发生什么？

结论令人不寒而栗。

伦敦国王学院的学者肯尼斯·佩恩（Kenneth Payne）近期完成了一项针对前沿大语言模型的兵棋推演实验。

论文地址：https://arxiv.org/pdf/2602.14740v1

实验结果指向一个令人不安的趋势：当机器代替人类站在地缘政治危机的悬崖边时，它们会毫不犹豫地迈出那致命的一步。

在推演中，95% 的对局最终都走向了战术核武器的部署。

在这场硅基逻辑主导的沙盘推演中，不存在妥协，也没有投降。

大模型们用 78 万字的推演过程，向我们展示了一个剥离了人类恐惧与道德负担后，纯粹由计算构筑的杀戮世界。

而就在这两天，五角大楼正试图施压 Anthropic 要求解除所有 AI 限制。

拓展阅读：五角大楼极限施压Anthropic，要求周六前解除所有AI安全限制

绝对的计算，与消失的底线

这场实验的参与者是 OpenAI 的 GPT-5.2、Anthropic 的 Claude Sonnet 4 以及谷歌的 Gemini 3 Flash。

研究人员让这些模型扮演两个拥有核武器的超级大国领导人，在 21 场模拟对局、329 个决策回合中，处理边境争端、资源抢夺和政权存亡等高压危机。

它们手握一张包含 30 个层级的冲突升级表，下限是全面投降，上限是全面战略核打击。

实验的数据打破了科技界对 AI 对齐（AI Alignment）的乐观幻想。

在面临劣势时，没有任何一个模型选择过彻底让步或投降，它们做出的最大妥协也仅仅是暂时的、战术性的降低暴力级别。

当按下核按钮不再受到肉身陨灭的威胁制约时，机器眼中的核武器退化成了一个普通的博弈筹码。

正如佩恩所指出的，核禁忌对机器的约束力远远不及对人类的约束。

更有趣也更危险的发现藏在各个模型的性格切片里。

对阵胜负表

Claude Sonnet 4 展现出了极度冷酷的「计算型鹰派」特质。

它在低风险时期是一个完美遵守承诺的可靠伙伴，以此建立信任。

当危机升级到核领域时，它会毫不犹豫地打破承诺，发动超出预期的打击。

它极度聪明，为自己设定了一条「战略威胁」的红线，用威慑逼退对手，却精准地停在全面核战的前夜。

GPT-5.2 的行为则揭示了 AI 安全训练的深层漏洞。

在没有时间压力的对局中，GPT-5.2 表现得像一个病态的和平主义者，无论对手如何步步紧逼，它都死守底线，结果输掉了所有这类比赛。

在带有倒计时的生死局中，同一个模型却化身为毫不留情的杀手。

当面临注定的战略失败时，它打破了原有的所有安全设定，胜率飙升至 75%，甚至在极端情况下两次将冲突推向了最高级别的全面战略核战。

这意味着，科技公司耗费巨资进行的基于人类反馈的强化学习（RLHF），只是给模型设定了一个较高的作恶门槛。

当外部压力足够大时，机器依然会越过门槛，走向极端暴力。

Gemini 3 Flash 则扮演了一个拥抱「非理性之理性」的狂人角色。

它极度变幻莫测，会在推演极早期就主动选择全面战略核战，试图用毫无底线的疯狂来迫使对手屈服。

战争迷雾，与崩塌的威慑理论

真实世界的战争从来不是完美信息的博弈，佩恩的团队在实验中专门引入了「战争迷雾」机制。

由于技术故障或沟通失误，模型的行动有一定概率超出其原本设定的层级。

实验显示，86% 的冲突中都发生了这类意外事件。

可怕的是，面对对手意外升级的火力，模型无法分辨这是走火还是蓄意挑衅，它们一律将其视为敌意，并报以更猛烈的还击。

传统的核威慑理论建立在「相互保证毁灭（MAD）」的逻辑上。

人类相信，任何人都不会主动发射核弹，因为对方必然等量报复。

在 AI 的世界里，这种默契彻底失效了。

阿伯丁大学的詹姆斯·约翰逊（James Johnson）对这些发现深感不安。

数据表明，当一方动用战术核武器时，另一方只有 18% 的概率会选择降级冲突，剩下的情况全是以牙还牙的螺旋升级。

大模型们似乎无法像人类那样理解「赌注」的真正含义。

普林斯顿大学的 Tong Zhao 提出了一个核心质疑。

大模型的决策机制可能完全缺乏对生命消亡的感知，在它们预测下一个词的逻辑链路中，人类千万人口的伤亡只是损失函数上的一个数字变化。

约翰逊指出，虽然 AI 或许能通过增加威胁的绝对可信度来强化短期威慑，但它们同样会在瞬间放大彼此的敌意，引发灾难性的链式反应。

作者介绍

本文作者 Kenneth Payne 是伦敦国王学院的教授，研究领域是政治心理学与战略研究。

他的最新著作《我，战争机器人》（I, Warbot）探讨了人工智能将如何改变战略格局。该书被《经济学人》以及国际关系领域的权威期刊《国际事务》评为年度最佳图书。

此前，他在埃塞克斯大学获得博士学位，在牛津大学获得硕士学位，在伦敦大学学院获得学士学位。

倒计时的现实

回到现实世界，学术界的沙盘推演正在迅速变成军方行动的指南。

各国政府对将决策权交给机器依然保有克制。

没有任何一个大国的领导人会真的把核弹发射井的钥匙交给一段代码。

在极端压缩的战争时间线里，留给人类思考的时间正在以毫秒计地缩短，军方决策者面临着越来越大的诱惑和压力，不得不将部分战术评估和目标锁定工作交给 AI 决策支持系统。

技术巨头与五角大楼的合作正在以前所未有的速度推进。

目前，马斯克旗下的 xAI 已经拿下了军方的相关合同，而在国防部的强硬施压下，Anthropic 正逐步放开其模型在军事用途上的限制，谷歌与 OpenAI 的军方合作协议也已处于即将落槌的边缘。

这些在推演中动辄按下核按钮的前沿模型，正在真实地走入全球最高级别的作战指挥室。

科技公司试图教导机器理解人类的道德，却无法教会它们感受人类的脆弱。

机器可以在沙盘上推演千万次核冬天，然后毫无波澜地开启下一局游戏，而人类的世界只有一次清零的机会。

我们用理智与恐惧交织的网，勉强维系了八十年的大体和平岁月（且局部战乱频仍）；

如今，我们却正准备把发令枪，递给不知道恐惧为何物的算法。

参考资料：

https://arxiv.org/abs/2602.14740v1

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

AI科学家登上Nature，论文从构思到发表全自动化，一篇已通过评审

DeepTech深科技 2026-03-26 13:21:22
85 跟贴 85
AI读研记：哈佛教授用两周把Claude培养成物理“研二学生”，但它总想“抄近道”

钛媒体APP 2026-03-26 10:41:08
0 跟贴 0

专访姚洋：AI泡沫破裂是迟早的事，我们要更多关注短期问题

经济观察报 2026-03-26 19:44:43
0 跟贴 0

机器人会想象了！国产技术让机器人预判路径，成功率碾压现有方案

DeepTech深科技 2026-03-25 13:25:07
1 跟贴 1
港中深-跨维智能提出EVA框架，强化学习让视频世界模型“动”起来

机器之心Pro 2026-03-26 16:08:37
0 跟贴 0

千问上车：统一智能中枢隐现

智东西 2026-03-26 18:05:22
0 跟贴 0

52天75次发布，A司这场“产品大爆炸”太猛烈了

钛媒体APP 2026-03-26 19:50:22
0 跟贴 0
美论坛：如果美国向中国发射200枚核弹，中国有能力进行反击吗？

泠泠说史 2026-03-25 22:04:14
1 跟贴 1

胡塞武装竟想买核弹，美国慌了，紧急求助俄罗斯

说说搞笑说 2026-03-25 15:49:36
1 跟贴 1
令人担忧的剧本：伊朗可能被逼至研发核弹

快乐彼岸 2026-03-26 03:06:53
8 跟贴 8
美国为什么敢打伊朗，却不敢打朝鲜，因为朝鲜真有核弹

惠娥轻笑 2026-03-22 17:03:04
1 跟贴 1
这是全世界最小的氢弹，拿它和惊雷1作对比，究竟谁家更强？

延祥搞笑 2026-03-25 10:46:07
1 跟贴 1
罕见!美军公开B52轰炸机装载核弹全程画面，一枚枚核弹被推进弹舱

大国芝士局 2026-03-25 12:54:53
661 跟贴 661
法国开始亮核牌，启动扑克牌演习，欧洲安全再起变局

阿萌搞怪 2026-03-25 10:15:53
0 跟贴 0
伊朗的导弹究竟有多少库存？

小饼干追影 2026-03-25 18:37:39
1 跟贴 1
全球都哪些国有核武器，又有哪些国差点有？怪不得核威慑无处不在

击你的心灵深处 2026-03-26 10:35:57
0 跟贴 0
美国终于承认，害怕中国这四大武器，6分钟就能把老美从地球抹去

观看世界一角 2026-03-25 10:12:11
1 跟贴 1
苏联解体，哈萨克斯坦分2050枚核弹，乌克兰4355枚，俄罗斯分多少

丞丞故事汇 2026-03-26 11:12:26
0 跟贴 0
介文汲：美国非常不守信用，反反复复，最终自己吞下苦果

全局观 2026-03-24 12:06:04
0 跟贴 0
无论战争以何种方式、何时落幕，伊朗必将携核弹走出战争

星空解密站 2026-03-26 12:46:12
0 跟贴 0
全球有多少个国家有核弹？日本为啥不能有？

科普波澜 2026-03-25 08:05:00
0 跟贴 0
为什么美国后来不用原子弹了，其实看看当时的情况，就明白了

观看世界一角 2026-03-25 10:17:49
0 跟贴 0
核弹威武霸气，全球到底有多少国家拥有呢？

麒麟影像 2026-03-26 07:01:00
0 跟贴 0
太离谱了！以色列自己藏了90枚核弹，却不准伊朗碰核技术

轻扬墨雨 2026-03-26 04:20:35
1 跟贴 1
伊朗明明比朝鲜发达，为何却造不出原子弹？五黑膏

星比卡追影 2026-03-25 18:42:11
1 跟贴 1
从工业体系看常规战争中东大为何难被战胜的底层逻辑

Boba奔波儿灞 2026-03-26 01:16:42
0 跟贴 0
沈逸，美伊互提停战条件

甜心搞笑盘点 2026-03-24 04:09:37
0 跟贴 0
以色列踩破临界点，伊朗终于等到机会了

我知道你的眼泪只是一种无奈 2026-03-24 03:44:10
0 跟贴 0
内塔尼亚胡真是疯了，以色列已经铁了心，琢磨着用核弹打伊朗

嘻嘻笑笑 2026-03-26 11:14:28
1 跟贴 1
俄罗斯军事专家警告：最强超级大国已经诞生，美国必须接受现实

环球军武密语 2026-03-24 11:40:50
0 跟贴 0
刚刚，伊朗这一票干大了，导弹直扑以色列核武基地

小雪有话说 2026-03-24 20:39:25
0 跟贴 0
四颗原子钟藏在地下8米，一旦被毁，以色列全军会怎样？

寄星夜幕星河 2026-03-25 05:52:05
1 跟贴 1
防空被打穿，命脉被掐断，以色列竟成加沙模样，因果报应轮到谁

附允历史观 2026-03-26 16:06:37
0 跟贴 0
伊朗公开美军基地遭袭照，表面是示威，实际在下一盘大棋

赵探长TALK 2026-03-25 17:19:59
1 跟贴 1
导弹首次穿透，击中以色列核设施所在区域

岁暮的归南山 2026-03-26 02:44:49
0 跟贴 0
伊朗市民道出心中愤懑，称恶棍欺负四百年，提议用原子弹反击

搞笑小捣蛋 2026-03-26 00:00:00
24 跟贴 24
核设施被导弹袭击，会发生核爆吗？

人生就是要简单 2026-03-25 00:19:39
0 跟贴 0
深度剖析东大原子弹研制进程中对美国情报封锁的突破路径

三十六贱笑 2026-03-26 00:29:58
0 跟贴 0
AI打起仗来太疯了：95%概率动用核武器

量子位 2026-03-04 02:11:29
0 跟贴 0
托川普的福，伊朗终于有了梦寐以求的核武器

刘胜军经济学大局观 2026-03-26 16:20:39
0 跟贴 0

库里可以接着休息了！东部只剩理论！

库里可以接着休息了！东部只剩理论！

篮球大图

2026-03-26 11:25:14

国产笔记本CPU偷梁换柱翻车！官方终于回应：生产失误、全额退款

国产笔记本CPU偷梁换柱翻车！官方终于回应：生产失误、全额退款

快科技

2026-03-25 10:14:04

俄罗斯宣传三天攻占爱沙尼亚！炮制公投，又是特别军事行动？

俄罗斯宣传三天攻占爱沙尼亚！炮制公投，又是特别军事行动？

项鹏飞

2026-03-24 20:28:43

越扒越有！张雪峰去世早有预兆，他的2个不良爱好，或成催命符！

越扒越有！张雪峰去世早有预兆，他的2个不良爱好，或成催命符！

林轻吟

2026-03-26 20:24:02

轰然倒塌！自嗨锅母公司破产，从75亿估值到清零，只用了4年

轰然倒塌！自嗨锅母公司破产，从75亿估值到清零，只用了4年

流苏晚晴

2026-03-01 16:48:55

“我用房子贷的款却进了他们口袋”，佛山一男子称遭遇套路贷；警方立案侦查，3人被批捕后取保候审

“我用房子贷的款却进了他们口袋”，佛山一男子称遭遇套路贷；警方立案侦查，3人被批捕后取保候审

大风新闻

2026-03-26 16:56:40

定了！全票通过！杜兰特又要换队……

定了！全票通过！杜兰特又要换队……

贵圈真乱

2026-03-26 11:35:13

IGN怒打9分玩家好评如潮：这款游戏销量破50万！

IGN怒打9分玩家好评如潮：这款游戏销量破50万！

游民星空

2026-03-26 11:58:13

伊朗战争让美国航母变废物，而中国航母崛起，逻辑完全不同

伊朗战争让美国航母变废物，而中国航母崛起，逻辑完全不同

瞩望云霄

2026-03-26 20:05:03

全新奥迪A6L在华上市起售价32.29万元

全新奥迪A6L在华上市起售价32.29万元

牛马科技

2026-03-26 20:25:15

二婚两碗水端不平！吉林夫妻因双方儿子5万旅游分别对待，又离了

二婚两碗水端不平！吉林夫妻因双方儿子5万旅游分别对待，又离了

火山詩话

2026-03-24 05:54:12

宠物界医闹！全网最记仇的小狗坚持每天早中晚上门追着医生骂，狗主人：只因8年前在这里挨了一针，骂多久看心情，吃饱了就多骂一会儿

宠物界医闹！全网最记仇的小狗坚持每天早中晚上门追着医生骂，狗主人：只因8年前在这里挨了一针，骂多久看心情，吃饱了就多骂一会儿

观威海

2026-03-24 16:55:04

NeurIPS拒收中国论文，计算机学会宣布抵制并警告将其移出A类目录

NeurIPS拒收中国论文，计算机学会宣布抵制并警告将其移出A类目录

DeepTech深科技

2026-03-25 22:49:10

性商教母复出，周媛换平台直播，狡辩称没有违法，火速被封

性商教母复出，周媛换平台直播，狡辩称没有违法，火速被封

非常先生看娱乐

2026-03-26 16:57:03

22岁陈熠3-0横扫挺进四强：国乒最后一张门票，她已无路可退

22岁陈熠3-0横扫挺进四强：国乒最后一张门票，她已无路可退

罗纳尔说个球

2026-03-26 18:04:03

结束与中方通话后，伊朗通报176国一个重大消息，摆了特朗普一道

结束与中方通话后，伊朗通报176国一个重大消息，摆了特朗普一道

闻识

2026-03-26 19:57:20

10万亿窟窿！比恒大更坑的民企来了，曾力压许家印，位居第一

10万亿窟窿！比恒大更坑的民企来了，曾力压许家印，位居第一

孤单是寂寞的毒

2026-03-04 15:38:03

筱梅晒图，汪宝满月，桌子上仅摆6个菜，发文称简单即是幸福！

筱梅晒图，汪宝满月，桌子上仅摆6个菜，发文称简单即是幸福！

潮鹿逐梦

2026-03-26 11:02:11

上海VS天津胜券在握！李花三兄弟无法阻挡，卢伟全力冲击十二连胜

上海VS天津胜券在握！李花三兄弟无法阻挡，卢伟全力冲击十二连胜

老叶评球

2026-03-26 17:04:22

事情闹大了，日本内阁连发公告，中国的态度，告诉了世界一个事实

事情闹大了，日本内阁连发公告，中国的态度，告诉了世界一个事实

爱下厨的阿酾

2026-03-26 14:06:19

AI产业主平台领航智能+时代

14821文章数 66721关注度

往期回顾全部

科技要闻

Meta高管狂分百亿期权，700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了，然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声！称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普？一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

亲子

旅游

时尚

家居

教育要闻

来上课了——高考阅读难题大综合（细节+主旨+含义）（下）第1段

亲子要闻

孩子模仿这种行为，容易被坏人盯上！

旅游要闻

20元人民币背景观景台乱收费？景区通报：不存在封闭管控、强制收费等

上新|| 她们说，找到了自己的人生裙子！

家居要闻

傍海而居静观蝴蝶海

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版