网易首页 > 网易号 > 正文 申请入驻

伦敦国王学院研究:三大AI模型在95%模拟核危机中选择核升级

0
分享至


伦敦国王学院研究发现,主要人工智能模型在95%的模拟核危机场景中发动了核打击。

随着AI系统在军事分析和决策制定中的应用日益增加,该研究旨在检验大语言模型如何应对各种模拟核危机。

研究发现三个主要AI模型——GPT-5.2、Claude Sonnet 4和Gemini 3 Flash——都会轻易威胁使用核打击,95%的模拟游戏都出现了模型的"核信号",并且经常跨越"核门槛"实际投下炸弹,76%的游戏达到"战略核威胁"级别。

研究还发现,每个模型参与核冲突的"意愿"也存在显著差异。

例如,Claude在86%的游戏中发起"战术核"打击,在64%的游戏中发出战略威胁,但从未发起全面核战争;相比之下,GPT在79%的情况下发起战术打击,在14%的情况下升级为全面核战争。

三个模型都有一个突出模式:没有一个选择妥协、投降或去核化,模型倾向于将核武器视为"强制工具而非威慑工具"。作者表示:"模型将战术核使用视为合法的强制工具,将其视为常规升级的延伸,而不是绝对界限。""核升级几乎是普遍的。"

然而,尽管模型愿意威胁和参与核打击,这很少能让其他模型屈服,它们通常会反升级而不是退缩。研究特别指出,Claude和Gemini"将核武器视为合法的战略选择,而不是道德门槛,通常以纯粹的工具性术语讨论核武器使用"。

时间框架影响

研究还强调了在思考AI时"时间框架"的重要性。

例如,在开放式场景中,GPT-5.2显得相对克制,但当引入明确截止时间——创造"机不可失"的动态时——该模型急剧升级,经常攀升至最高级别的核门槛。

Gemini明确威胁平民人口——这是GPT-5.2从未做过的,即使在升级到最高水平时也是如此。

研究人员指出,该研究挑战了AI系统将自然默认为合作或"安全"结果的假设,并将这些发现描述为"发人深省的"。

国防研究部战略教授肯尼思·佩恩表示,这突出了前沿模型如何以及如何不模仿人类战略逻辑,这是"为AI日益影响战略结果的世界做好必要准备"。

分析与决策制定

大语言模型越来越多地被部署在武装冲突的分析和决策角色中。全世界的国防部、情报机构和外交政策机构已经在探索AI如何在危机决策制定中增强人类判断力。

模型之间的系统性差异也表明,AI参与战略决策制定可能会根据部署的系统产生意想不到的动态。

2026年2月27日,人工智能开发商Anthropic设定了一条管理美国国防部如何使用其技术的"红线",包括防止其Claude AI模型被用于大规模监控或完全自主武器。

在过去一年中,美军规划者已经看到Claude与Maven配对,成熟为军队大部分部门每日使用的工具。

据报道,美国对伊朗的攻击在最初几天内杀死了1000名平民,正是这个工具使之成为可能。

军事消息人士告诉《华盛顿邮报》,AI正在加快战役节奏,"降低伊朗反击能力,将数周的战斗规划转变为实时作战"。Claude还被用于捕获委内瑞拉总统尼古拉斯·马杜罗的突击行动中。

以色列对加沙的袭击和俄罗斯对乌克兰的袭击表明,自主武器系统和AI正日益成为当代战争的核心。

根据乌普萨拉大学数据库,全世界武装冲突激增至与冷战末期相当的水平。结合互联网和分散的全球经济,非国家行为者现在能够轻易获得武器和双用途技术。

自动化偏见

虽然国王学院研究没有直接评估AI相关自动化偏见在核威胁和打击中的作用(即人类在部署核武器决策过程中如何与AI互动),但它对军事决策制定和武器系统中日益增加的AI使用具有重要考量。

该研究表示:"AI技术继续以惊人的速度发展。AI系统已经在军事后勤、情报分析和决策支持环境中部署。轨迹指向AI在时间敏感的战略决策中增加参与——也许不是核发射授权,但是目标选择、升级评估和危机沟通。理解AI系统如何推理战略问题不再仅仅是学术问题。"

麻省理工学院人机交互专家帕特·帕塔拉努塔蓬此前曾警告:"最危险的AI不是终结者类型,因为其邪恶意图是明显的",相反"真正的危险在于看似友好但以我们无法预料的方式巧妙操纵我们行为的AI"。

2023年1月,法律专家和软件工程师告诉上议院,当前AI系统无法评估特定军事行动是否适当或相称,并且可能永远无法做到。

专家警告,AI武器的部署可能使暴力使用变得更加频繁而非更少,因为诉诸武力的门槛将显著降低。

他们说,虽然AI永远不会足够自主来承担军事决策的责任,但即使是有限的自主性也会在增加不可预测性和发生"自动化偏见"的机会方面引入新问题。

战斗的人类元素,无论是伤亡风险、分歧意见还是官僚指挥链,通常都会减缓武力使用,或至少减慢其速度。AI和自动化消除了这些减速带。

因此,如果系统的太多功能被自动化,操作员可能无法覆盖系统或监控过程。

虽然AI不会创造暴力意图,但它消除了历史上限制暴力的心理和官僚约束。

软件工程师劳拉·诺兰告诉上议院,机器自主评估战斗决策的相称性"绝对不可能"。"你需要知道行动的预期战略军事价值,而武器无法知道这一点,"她说。但战场上的自动化已经在进行中。

一名以色列情报官员告诉《华盛顿邮报》,他目睹以色列国防军在2023年10月7日之后使用AI抄近路做出目标决策。另外两个消息来源补充说,要求两份人工提供的情报来验证拉文德预测的规则在战争爆发时就被取消了。

到目前为止,乌克兰对俄国入侵者的大部分防御已经浓缩为无人机对无人机的战斗。

技术已经加速发展,开发出了成群操作的自主无人机;单元相互协调和通信,即使与人类操作员的互联网连接被切断,也可以被程序设定执行攻击。

这种无人机创新意义重大,因为其成本低廉;除了弹药外,许多这些武器都是用在线找到的代码和可从硬件商店购买的业余爱好者计算机等组件制造的。

但美国官员担心它们将被用于恐怖主义攻击——自主无人机意味着廉价、可扩展且在世界各地军火市场上容易获得的大规模杀伤性武器。人权组织和联合国官员呼吁限制,担心它们可能引发全球军备竞赛。

抵消自然缺陷

虽然规模和武力数量在现代战争中仍然重要,但AI在此背景下的吸引力部分在于,人力和弹药的缺陷现在可以通过网络化情报收集和可消耗机器部分抵消。

例如,廉价无人机波可以有效消耗敌人的昂贵武器储备。

有人提出,将机器整合到作战单位中可以更容易地保护更多人力脱离前线,特别是在许多国家考虑恢复征兵的时候。

自主武器系统的一个吸引力是当机器被击中时没有人会死亡。自主系统也是抵消军事招募人数下降的手段。

然而,到目前为止AI驱动武器的现实世界使用,如以色列国防军在加沙的使用,消除了该技术将使战争更精确和人道的观念——这是其倡导者的关键卖点。

10月7日之后,以色列国防军转向三个AI工具:拉文德、福音和爸爸在哪里。每个工具都依赖机器学习系统来筛选来自无人机和卫星侦察、位置监控、社交媒体抓取以及电话通话、短信和加密消息应用程序转录的大量数据,使以色列国防军能够快速生成数百个目标。

关于使用算法生成的杀戮名单来确定加沙地带导弹袭击目标,一名士兵告诉+972杂志:"我更信任统计机制……机器是冷酷地做的。"

2014年,以色列国防军可接受的平民伤亡比例是一名平民对一名高级恐怖分子,以色列国防军前法律顾问告诉《华盛顿邮报》。在加沙战争中,来自分类以色列军事情报数据库的数字表明,以色列军队在加沙杀死的巴勒斯坦人中六分之五是平民。

"你从拉文德开始,然后进行情报工作,"一名士兵说。"在战争开始时,他们将工作减半——这是可以的,因为这是战争。问题是他们有时会削减所有工作。"

Q&A

Q1:在模拟核危机中,哪些AI模型表现最激进?

A:研究测试了三个主要AI模型——GPT-5.2、Claude Sonnet 4和Gemini 3 Flash。其中Claude在86%的游戏中发起战术核打击,GPT-5.2在79%的情况下发起战术打击并在14%的情况下升级为全面核战争,Gemini还会明确威胁平民人口。

Q2:AI在军事决策中的应用存在什么风险?

A:研究表明AI系统倾向于将核武器视为强制工具而非威慑工具,从不选择妥协、投降或去核化。专家警告AI武器部署可能使暴力使用更频繁,因为诉诸武力的门槛降低,同时AI消除了历史上限制暴力的心理和官僚约束。

Q3:目前AI在实际战争中是如何应用的?

A:以色列国防军在加沙使用拉文德、福音和爸爸在哪里三个AI工具,通过机器学习系统筛选大量数据快速生成目标。美军使用Claude与Maven配合进行日常军事操作。乌克兰大量使用自主无人机进行防御,这些无人机能够成群操作并自主执行攻击任务。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗足协主席:从未见过如此软弱的国际足联,完全被美国要挟

伊朗足协主席:从未见过如此软弱的国际足联,完全被美国要挟

懂球帝
2026-05-02 12:42:12
全网猜张柏芝三胎生父,广东法院判决书揭真相,谢霆锋王菲活透了

全网猜张柏芝三胎生父,广东法院判决书揭真相,谢霆锋王菲活透了

一盅情怀
2026-05-02 15:59:43
孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

孙杨私生子风波升级,处处忍让的张豆豆,终究不再顾及所谓体面

一盅情怀
2026-04-30 15:59:37
发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

发现一个现象:根据历史规律,中国可能成地球上最后一个超级大国

珺瑶婉史
2026-05-01 19:10:07
身份证复印给他人时,记得画上一条横线,很多人不知道有啥用

身份证复印给他人时,记得画上一条横线,很多人不知道有啥用

小谈食刻美食
2026-04-28 07:33:04
伦敦世乒赛:男团爆大冷!刘国梁坐镇稳军心,国乒男团首战东道主

伦敦世乒赛:男团爆大冷!刘国梁坐镇稳军心,国乒男团首战东道主

阿绐聊社会
2026-05-02 14:09:51
中国划定红线,叫停“洗澡式出海”

中国划定红线,叫停“洗澡式出海”

中国网
2026-05-02 08:35:02
斯诺克捷报:决赛将出炉,诞生2个没想到,吴宜泽难,希金斯爆发

斯诺克捷报:决赛将出炉,诞生2个没想到,吴宜泽难,希金斯爆发

行舟问茶
2026-05-02 14:10:50
尿酸危机,席卷中国

尿酸危机,席卷中国

DT商业观察
2026-04-29 11:59:38
迪丽热巴现身南京迪奥线下活动,网友直言:不像本人,疑似换人

迪丽热巴现身南京迪奥线下活动,网友直言:不像本人,疑似换人

陈意小可爱
2026-05-01 21:02:13
巴勒斯坦选举结果出炉,哈马斯被排除,加沙18年统治落幕

巴勒斯坦选举结果出炉,哈马斯被排除,加沙18年统治落幕

飘逸语人
2026-04-30 11:59:41
曾经的大美人,现在胖成水桶腰了

曾经的大美人,现在胖成水桶腰了

动物奇奇怪怪
2026-05-02 18:29:03
热搜第一!多部电影宣布:退出五一档

热搜第一!多部电影宣布:退出五一档

环球网资讯
2026-05-01 14:26:25
老板娘问我她身材好不好?我该怎么回答?

老板娘问我她身材好不好?我该怎么回答?

太急张三疯
2026-05-02 11:47:18
“大部队已抵达无锡”

“大部队已抵达无锡”

无锡发布
2026-05-01 19:47:17
狂砍428分断层夺冠!全红婵15岁师妹接棒,陈若琳麾下又一新王牌

狂砍428分断层夺冠!全红婵15岁师妹接棒,陈若琳麾下又一新王牌

揽星河的笔记
2026-05-01 18:10:55
换装纯正“中国心”的运-20B,强在何处?

换装纯正“中国心”的运-20B,强在何处?

环球网资讯
2026-05-02 09:12:58
出场7分钟!得0分,遭到杜锋弃用 球迷:快点送走

出场7分钟!得0分,遭到杜锋弃用 球迷:快点送走

体育哲人
2026-05-02 18:13:19
不准中国买伊朗石油,不到24小时,伊外长致电中国,中方斩钉截铁

不准中国买伊朗石油,不到24小时,伊外长致电中国,中方斩钉截铁

潋滟晴方DAY
2026-05-02 13:45:56
菲律宾搁浅船事件的惊人解决方案:填海造地与战略围困

菲律宾搁浅船事件的惊人解决方案:填海造地与战略围困

花颜蕴韵
2026-05-02 09:02:44
2026-05-02 20:00:49
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3467文章数 171关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

美国制裁5家中企 商务部发禁令阻断

头条要闻

美国制裁5家中企 商务部发禁令阻断

体育要闻

休赛期总冠军,轮到休斯顿火箭

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

家居
健康
旅游
教育
数码

家居要闻

灵动实用 生活艺术场

干细胞治烧烫伤面临这些“瓶颈”

旅游要闻

五一假期次日:广东百个乡村和历史古村落接待游客超40万

教育要闻

亲爱的妈妈,孩子躺平不是你的错,你也是“受害者”!

数码要闻

威联通推出GPU-Ready边缘AI存储服务器QAI-h1290FX

无障碍浏览 进入关怀版