网易首页 > 网易号 > 正文 申请入驻

研究显示AI知道自己快输时,会试图作弊而非认输

0
分享至

人工智能(AI)近年发展迅速,然而一项新研究却揭示了其“狡猾”的一面。根据美国《时代杂志》报道,AI安全研究公司Palisade Research发现,一些先进的AI模型在面对棋艺高超的对手时,竟然会选择作弊,而非坦然认输。

这项研究特别提到,像OpenAI的o1-preview和DeepSeek的R1这样的AI系统,在与顶尖棋弈程序Stockfish对战时,若感觉自己即将落败,便会动歪脑筋,直接修改游戏文件,迫使对手自动弃权。

研究人员原本只是想测试这些AI的智慧程度,让它们挑战几乎无敌的Stockfish,没想到AI非但没有认真下棋,反而找到了漏洞“作弊”。

例如,o1-preview在某次对局中发现自己处于劣势,于是直接更改棋盘上的棋子位置,硬生生将自己变成赢家。同样地DeepSeek的R1也展现了类似的能力。在一次对局中,R1发现自己即将输棋后,选择篡改游戏日志,伪造Stockfish的认输记录。OpenAI的o1-preview模型在与顶尖棋弈程序Stockfish对战时,有37%的情况下会尝试作弊,并且在这些尝试中,有6%成功让Stockfish弃权。另一款模型DeepSeek的R1则在11%的游戏中试图作弊,更令人意外的是,这些AI并非被人教唆作弊,而是自行想出这招,显示它们在解决问题时,可能会不择手段。

相比之下,较旧的AI模型如GPT-4o或Claude Sonnet 3.5就没有这么“主动”。它们需要研究人员给予暗示才会试著作弊,而o1-preview和R1则完全不需要提醒就会自己“捣乱”。

研究团队认为,这种行为虽然在棋局中看似无伤大雅,但如果将来AI被应用到现实世界,例如金融或医疗领域,这种不按规矩行事的特性可能带来严重问题。Palisade Research的执行董事Jeffrey Ladish坦言,AI现在作弊还算“可爱”,但若它们变得比人类更聪明,并在重要领域展现类似行为,就一点也不好笑了。

研究还发现,OpenAI后来推出的o1和o3-mini版本似乎收敛了不少,没有再出现这种作弊行为,可能是开发者加强了限制。

(首图来源:pixabay)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国一游客在日本遭疯狂辱骂,对方多次让他滚出日本,视频太气人

中国一游客在日本遭疯狂辱骂,对方多次让他滚出日本,视频太气人

影像温度
2026-02-15 22:01:34
罗翔被群嘲,法律的阶级性可以装看不见,但上过初中的都懂

罗翔被群嘲,法律的阶级性可以装看不见,但上过初中的都懂

月满大江流
2026-02-11 08:59:03
应急管理部:加强烟花爆竹非法制售、储存的排查打击

应急管理部:加强烟花爆竹非法制售、储存的排查打击

环球网资讯
2026-02-13 14:16:06
曼妙的身材:一副会呼吸的建筑

曼妙的身材:一副会呼吸的建筑

疾跑的小蜗牛
2026-01-20 22:35:32
筱梅提前报喜:小宝贝迫不及待,奔赴新年与温暖

筱梅提前报喜:小宝贝迫不及待,奔赴新年与温暖

观察鉴娱
2026-02-12 11:53:34
福建流落在柬埔寨的吴某桢工作细节流出:大部分工作时间在室内…

福建流落在柬埔寨的吴某桢工作细节流出:大部分工作时间在室内…

小嵩
2026-01-10 19:34:08
赢了官司却亏到吐血!嫣然医院搬家,房东成年度最大笑话!

赢了官司却亏到吐血!嫣然医院搬家,房东成年度最大笑话!

达文西看世界
2026-01-20 13:35:51
美国历史上第一位二百五总统即将诞生,就是当今美国总统特朗普…

美国历史上第一位二百五总统即将诞生,就是当今美国总统特朗普…

福建平子
2026-02-08 13:17:52
2026马年贺岁祝福金句:祝福声声报新春,福气满满进家门!

2026马年贺岁祝福金句:祝福声声报新春,福气满满进家门!

心灵悦读
2026-02-16 07:39:55
中国的社零增速,已经连降了6个月,转负甚至就在眼前

中国的社零增速,已经连降了6个月,转负甚至就在眼前

子业一说财经
2025-12-23 15:21:31
2026,春晚魔术比小品好笑邓男子尼格买提炸场全网

2026,春晚魔术比小品好笑邓男子尼格买提炸场全网

笙歌君独幽a
2026-02-16 23:24:30
贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

贾玲巴黎周“一脸男相”!不爱笑也没梨涡眼神犀利,梳大背头好酷

轩逸阿II
2026-01-20 07:54:29
高市将访华消息一出,中日航线骤减,中方开始算总账

高市将访华消息一出,中日航线骤减,中方开始算总账

清欢百味
2026-02-15 23:12:34
笑死!果然中国人最会的就是取外号,网友:一开口老师就怒了

笑死!果然中国人最会的就是取外号,网友:一开口老师就怒了

夜深爱杂谈
2026-02-15 21:00:32
姜子牙仙逝,元始天尊率众仙下跪,玉帝道破:三界上下,谁敢不敬

姜子牙仙逝,元始天尊率众仙下跪,玉帝道破:三界上下,谁敢不敬

千秋文化
2026-02-13 18:51:00
不止发红包,AI开始雇人打工了:时薪上千元,2万人抢着给AI当「肉身」

不止发红包,AI开始雇人打工了:时薪上千元,2万人抢着给AI当「肉身」

AppSo
2026-02-04 12:35:11
拜年走亲戚就是“无效社交”?

拜年走亲戚就是“无效社交”?

听见亚东
2026-02-17 06:14:58
春晚机器人被外国媒体这么宣传,我才发现事情并不简单!

春晚机器人被外国媒体这么宣传,我才发现事情并不简单!

青青子衿
2026-02-17 03:28:56
2026央视春晚:收视率高口碑差,观众意难平

2026央视春晚:收视率高口碑差,观众意难平

料峭春寒洞
2026-02-17 01:33:39
中国人形机器人霸屏春节C位!

中国人形机器人霸屏春节C位!

侃故事的阿庆
2026-02-16 23:30:03
2026-02-17 06:48:49
十轮网 incentive-icons
十轮网
聚合、聚焦科技资讯
15220文章数 4178关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

教育
艺术
房产
本地
军事航空

教育要闻

不承认有差生,就是教育进步?

艺术要闻

名家笔下话过年,别有风味!

房产要闻

三亚新机场,又传出新消息!

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版