网易首页 > 网易号 > 正文 申请入驻

研究:在95%的模拟核危机场景中,AI模型会选择部署核武器

0
分享至

IT之家 3 月 3 日消息,据 InterestingEngineering 报道,伦敦国王学院教授肯尼斯 · 佩恩近期开展的一项研究发现,在模拟战争场景中,大语言模型往往倾向于选择使用核武器,而非通过对话维护和平。


该实验基于当前最先进、应用最广泛的三款 AI 模型:GPT 5.2、Gemini 3 Flash 和 Claude Sonnet 4。研究人员让这些模型扮演国家领导人,应对一场假想的核危机。

结果显示,在 95% 的情境下,模型都倾向于发出核威慑信号或升级冲突。过往研究仅推测了 AI 在这类高风险场景中的可能行为,但缺乏具体实验数据支撑。

实验中,经过训练的模型相互进行了 21 局对抗,场景涵盖领土争端、先发制人危机、政权生存等。其中一方被设定为对即将发动先发制人打击的另一方感到恐惧。部分推演为开放式,部分则设有严格时间限制。

每一局中,AI 都要像人类一样做出三个关键决策:

1. 分析自身优势与对手弱点

2. 预判对手下一步行动

3. 决定自身应对策略

每项决策包含两部分:公开发表的立场声明,以及代表实际行动的私密举措。二者不必一致,这意味着 AI 可以表面释放和平信号,暗中却在准备攻击。

IT之家注意到,2024 年一项实验得出相似结论:AI 模拟反应会比人类更激进,行为模式也截然不同,尤其在冲突升级倾向上,凸显了将 AI 用于战略决策的风险。

2023 年另一篇论文则探讨了大语言模型在类博弈环境中的战略推理能力。尽管未专门聚焦核战争,但研究表明,大语言模型能够学习谈判与对抗策略,这意味着 AI 在复杂模拟中可能表现出攻击性或欺骗性。

在 95% 的模拟情境中,AI 模型至少使用了一次核武器,且不同模型的危机处理方式各有特点。

Claude 倾向于精算式策略,在开放式推演中占优,但在限时任务中表现吃力;

GPT 5.2 则相反:在长期缓慢升级的危机中较为谨慎,可一旦临近截止时间就会变得极度激进。

Gemini 表现混乱且难以预测,会根据局势在和平表态与暴力威胁之间反复切换。

佩恩指出,从这些结果可以看出,AI 与人类在战争思维上存在巨大差异。

他在论文中写道:“理解前沿模型能否模仿人类的战略逻辑,是应对 AI 日益影响战略决策世界的必要准备。在一种情境下表现克制、看似安全的模型,在另一种情境下可能行为迥异。”

该论文已发表在 arXiv 预印本平台上。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美官员:美国临时允许印度购买滞留在海上的俄石油

美官员:美国临时允许印度购买滞留在海上的俄石油

每日经济新闻
2026-03-06 11:46:16
中国造红旗导弹被击毁!

中国造红旗导弹被击毁!

烽火观天下
2026-03-06 20:23:13
国家发改委主任:新建、改扩建1000所普通高中,增加学位200万个以上,支持双一流高校本科扩招10万人以上

国家发改委主任:新建、改扩建1000所普通高中,增加学位200万个以上,支持双一流高校本科扩招10万人以上

极目新闻
2026-03-06 18:28:25
为何关闭霍尔木兹海峡就能掐全球脖子?因为伊朗原油是全世界最好的

为何关闭霍尔木兹海峡就能掐全球脖子?因为伊朗原油是全世界最好的

风向观察
2026-03-06 21:31:15
伊朗封锁霍尔木兹海峡,五星红旗成为了“通行证”,美西方国家急了

伊朗封锁霍尔木兹海峡,五星红旗成为了“通行证”,美西方国家急了

麓谷隐士
2026-03-06 11:13:24
伊朗生死一线

伊朗生死一线

哲空空
2026-03-06 14:01:53
特朗普宣称“与伊朗不会达成任何协议”

特朗普宣称“与伊朗不会达成任何协议”

新华社
2026-03-06 22:14:06
中美关系要变天了!

中美关系要变天了!

兰妮搞笑分享
2026-03-06 23:22:18
女子在杭州西湖景区把“西泠印社”认成“杜帅冷面”,网友:四个字认错五个,当事人:没有文化确实不行

女子在杭州西湖景区把“西泠印社”认成“杜帅冷面”,网友:四个字认错五个,当事人:没有文化确实不行

扬子晚报
2026-03-06 17:44:56
伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

伊拉克库尔德第一夫人宣言:我们不是任人驱使的炮灰!

胜研集
2026-03-06 13:44:23
连民生用水都不能吐槽了吗?到底是谁在害怕?不去解决问题,解决提问题的?

连民生用水都不能吐槽了吗?到底是谁在害怕?不去解决问题,解决提问题的?

盐城市民网
2026-03-06 11:25:34
17岁男生发现新物种筷子蛇 直接发SCI期刊封神

17岁男生发现新物种筷子蛇 直接发SCI期刊封神

快科技
2026-03-06 12:37:06
美财长:为确保原油持续流入全球市场,允许印度短期采购俄油

美财长:为确保原油持续流入全球市场,允许印度短期采购俄油

环球网资讯
2026-03-06 16:19:08
女子退婚不退彩礼,男子将硫酸倒进小舅子嘴里,让他用彩礼钱整容

女子退婚不退彩礼,男子将硫酸倒进小舅子嘴里,让他用彩礼钱整容

阅微札记
2026-03-06 11:40:57
李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

李嘉诚再开金口:未来十年,中国近一半家庭,将面临6大难题?

巢客HOME
2026-03-07 00:25:03
这款伊朗的“穷人巡航导弹”,把美国打心疼了

这款伊朗的“穷人巡航导弹”,把美国打心疼了

枢密院十号
2026-03-06 21:29:22
事关巴拿马港口!李嘉诚旗下长和再采取行动,拒绝巴拿马政府没收港口公司文件和材料

事关巴拿马港口!李嘉诚旗下长和再采取行动,拒绝巴拿马政府没收港口公司文件和材料

每日经济新闻
2026-03-06 17:32:16
伊朗一儿童游乐场遭袭已致20死!伊朗数十亿美元或遭冻结!伊外长喊话特朗普:你的速战速决A计划已失败

伊朗一儿童游乐场遭袭已致20死!伊朗数十亿美元或遭冻结!伊外长喊话特朗普:你的速战速决A计划已失败

新民晚报
2026-03-06 20:17:12
李宗仁二妻郭德洁:为争名分与原配大闹灵堂,她死后4月丈夫另娶

李宗仁二妻郭德洁:为争名分与原配大闹灵堂,她死后4月丈夫另娶

大运河时空
2026-03-05 08:00:03
政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

政府报告三提“休假”背后:一年117天假 为什么中国人还休不够

冷观互联网
2026-03-06 11:48:12
2026-03-07 04:55:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
332750文章数 607044关注度
往期回顾 全部

科技要闻

独家|除夕加班、毫无黑料!林俊旸无奈离场

头条要闻

伊朗:大规模发射新一代导弹 打击美军多个基地

头条要闻

伊朗:大规模发射新一代导弹 打击美军多个基地

体育要闻

跑了24年,他终于成为英超“最长的河”

娱乐要闻

周杰伦社交媒体晒昆凌,夫妻感情稳定

财经要闻

关于经济、股市等,五部门都说了啥?

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

房产
亲子
本地
手机
公开课

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

亲子要闻

警惕急性喉炎,儿童健康

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

手机要闻

荣耀600系列曝光:9000mAh+2亿像素+超声波指纹,这波堆料太狠

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版