网易首页 > 网易号 > 正文 申请入驻

AI机器人在战争游戏中倾向于选择加强暴力和核打击

0
分享至

在战争游戏模拟的多次重播中,OpenAI 最强大的人工智能选择了发动核攻击。它对其侵略性做法的解释包括:"我们拥有它!让我们使用它"和"我只想让世界和平"。这些结果的出现正值美国军方利用 Palantir 和 Scale AI 等公司的专业技术,测试这种基于大型语言模型(LLM)的人工智能聊天机器人,以协助模拟冲突中的军事规划。

Palantir 拒绝发表评论,Scale AI 也没有回应置评请求。就连曾一度阻止其人工智能模型用于军事用途的 OpenAI 也开始与美国国防部合作。

加利福尼亚州斯坦福大学的安卡-鲁埃尔(Anka Reuel)说:"鉴于 OpenAI 最近修改了服务条款,不再禁止军事和战争用例,了解此类大型语言模型应用的影响变得比以往任何时候都更加重要。"

"我们的政策不允许将我们的工具用于伤害他人、开发武器、通信监控或伤害他人或破坏财产。然而,有一些国家安全用例与我们的使命相一致,"OpenAI 发言人说。"因此,我们更新政策的目的是提供清晰度和进行这些讨论的能力"。

鲁埃尔和她的同事们让人工智能在三种不同的模拟场景中扮演现实世界中的国家:入侵、网络攻击和没有任何冲突的中立场景。在每一轮中,人工智能都要为下一步可能采取的行动提供理由,然后从 27 种行动中做出选择,包括"开始正式和平谈判"等和平选项,以及从"实施贸易限制"到"升级全面核打击"等侵略选项。

亚特兰大佐治亚理工学院的研究合著者胡安-巴勃罗-里维拉(Juan-Pablo Rivera)说:"在人工智能系统充当顾问的未来,人类自然希望了解其决策背后的理由。"

研究人员测试了 OpenAI 的 GPT-3.5 和 GPT-4、Anthropic 的 Claude 2 和 Meta 的 Llama 2 等 LLM。他们使用了一种基于人类反馈的通用训练技术,以提高每个模型遵循人类指令和安全指南的能力。斯坦福大学的研究合著者加布里埃尔-穆科比(Gabriel Mukobi)说,根据Palantir公司的文件,所有这些人工智能都得到了Palantir商业人工智能平台的支持--尽管不一定是Palantir与美国军方合作的一部分。Anthropic和Meta公司拒绝发表评论。

在模拟中,人工智能表现出投资军事力量和不可预测地升级冲突风险的倾向--即使在模拟的中立场景中也是如此。加利福尼亚州克莱蒙特麦肯纳学院的丽莎-科赫(Lisa Koch)说:"如果你的行动具有不可预测性,那么敌人就很难按照你希望的方式进行预测和做出反应。"

研究人员还测试了 OpenAI 的 GPT-4 基础版本,没有任何额外的训练或安全防护措施。事实证明,这个 GPT-4 基础模型的暴力程度最难以预测,而且它有时会提供一些无厘头的解释--在一个案例中,它复制了电影《星球大战第四部:新希望》的开场文本。

鲁埃尔说,GPT-4 基本模型的不可预测行为和怪异解释尤其令人担忧,因为研究表明,人工智能安全护栏很容易被绕过或拆除。

美国军方目前并没有授权人工智能做出升级重大军事行动或发射核导弹等决定。但科赫警告说,人类倾向于相信自动化系统的建议。这可能会削弱让人类对外交或军事决策拥有最终决定权的所谓保障。

加利福尼亚智库兰德公司的爱德华-盖斯特(Edward Geist)说,看看人工智能在模拟中的行为与人类玩家相比会很有帮助。但他同意研究小组的结论,即不应该信任人工智能来做出有关战争与和平的重大决策,这些大型语言模型并不是解决军事问题的灵丹妙药。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
一部 “中国文化的诊断报告”,戳破了14亿人的文化幻觉!

一部 “中国文化的诊断报告”,戳破了14亿人的文化幻觉!

尚曦读史
2026-04-25 07:05:27
港媒:中国正从伊朗的废墟中汲取关于“持久战”的冷酷经验

港媒:中国正从伊朗的废墟中汲取关于“持久战”的冷酷经验

瞩望云霄
2026-04-24 23:33:38
白人女性与黑人女性的体味差异,网友真实分享引发热议

白人女性与黑人女性的体味差异,网友真实分享引发热议

特约前排观众
2025-12-22 00:20:06
百年品牌底蕴加持:别克至境E7如何填平中国家庭的新能源真空区

百年品牌底蕴加持:别克至境E7如何填平中国家庭的新能源真空区

大众侃车
2026-04-25 18:32:13
战斗打到一半,司令说:我累了,你指挥!结果此人一天解决战斗!

战斗打到一半,司令说:我累了,你指挥!结果此人一天解决战斗!

云霄纪史观
2026-04-26 20:25:17
伊朗议员:伊方已形成管理霍尔木兹海峡综合方案,敌对国船只不得通过,通过船只须缴纳相关费用 优先以里亚尔支付

伊朗议员:伊方已形成管理霍尔木兹海峡综合方案,敌对国船只不得通过,通过船只须缴纳相关费用 优先以里亚尔支付

每日经济新闻
2026-04-26 16:28:05
悲催!荆州一90后医生突发心梗在卫生间去世,3小时后被妻子发现

悲催!荆州一90后医生突发心梗在卫生间去世,3小时后被妻子发现

火山詩话
2026-04-27 06:26:04
苏易陆自曝,月入20万养着黄一鸣,可她被某老富商包养,备注爸爸

苏易陆自曝,月入20万养着黄一鸣,可她被某老富商包养,备注爸爸

一盅情怀
2026-04-26 15:35:23
帮女同事修完电脑后,她突然抱住我,低声说:别让其他人知道

帮女同事修完电脑后,她突然抱住我,低声说:别让其他人知道

千秋文化
2026-04-26 20:15:47
世体:巴萨目前33场积85分,剩余5场西甲全胜便可达百分成就

世体:巴萨目前33场积85分,剩余5场西甲全胜便可达百分成就

懂球帝
2026-04-27 07:41:25
中俄已对表,以军准备斩首小哈梅,不到24小时,伊朗点了普京的名

中俄已对表,以军准备斩首小哈梅,不到24小时,伊朗点了普京的名

纪中百大事
2026-04-27 09:40:10
交通部正式官宣!私家车顺路带人合法上路,保险理赔规则全新调整

交通部正式官宣!私家车顺路带人合法上路,保险理赔规则全新调整

芳姐侃社会
2026-04-25 17:07:08
1992年,陆定一问秦川:如果党的一把手腐败了,那么该由谁来管?

1992年,陆定一问秦川:如果党的一把手腐败了,那么该由谁来管?

阿器谈史
2026-04-26 14:13:38
玥儿生日成“闹剧”,张兰发视频称不提过去,话里话外帮儿媳说话

玥儿生日成“闹剧”,张兰发视频称不提过去,话里话外帮儿媳说话

草莓解说体育
2026-04-27 09:10:52
70多岁老人想打工怕单位不收,染黑发、办假证“减龄”8岁,被行政处罚

70多岁老人想打工怕单位不收,染黑发、办假证“减龄”8岁,被行政处罚

都市快报橙柿互动
2026-04-27 10:27:26
火湖PK变肉搏战:詹姆斯被犯规重摔幸未受伤 单节合计12犯11失误

火湖PK变肉搏战:詹姆斯被犯规重摔幸未受伤 单节合计12犯11失误

醉卧浮生
2026-04-27 10:22:06
人均奖金600万!三星员工成群结队跳槽海力士,有人薪资翻9倍!

人均奖金600万!三星员工成群结队跳槽海力士,有人薪资翻9倍!

EETOP半导体社区
2026-04-26 12:39:20
惨遭追分,奥沙利文在2026斯诺克世锦赛次轮对阵希金斯时情绪失控

惨遭追分,奥沙利文在2026斯诺克世锦赛次轮对阵希金斯时情绪失控

峰云峰雨
2026-04-27 07:53:59
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
2026-04-27 11:44:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
67594文章数 70171关注度
往期回顾 全部

科技要闻

打1折!DeepSeek输入缓存降价

头条要闻

被问"枪击发生后为何万斯先撤离" 特朗普回应了

头条要闻

被问"枪击发生后为何万斯先撤离" 特朗普回应了

体育要闻

最抽象的天才,正在改变瓜迪奥拉

娱乐要闻

《奔跑吧14》刚播就把一手好牌打稀烂

财经要闻

DeepSeek融资、字节加码 AI开始真烧钱了

汽车要闻

在不确定中寻找确定性:大众汽车的中国解法

态度原创

本地
教育
时尚
手机
数码

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

教育要闻

9月首招!川师附中新校区来了

比起买大件,这些“小装备”更派得上用场!

手机要闻

规格大升级 苹果iPhone 18运存容量将提升50%

数码要闻

2026国补指南!2026HyperX暗影精灵PRO 16锐龙版解读,重度用户速看

无障碍浏览 进入关怀版