网易首页 > 网易号 > 正文 申请入驻

当人工智能学会在比赛中“耍诈”,手段更高级!DeepSeek R1 每 10 局就有 1 局试图作弊?

0
分享至

整理 | 华卫

尽管业界大肆宣传生成式人工智能取得了真正的进步,但越来越多的研究表明,许多大型语言模型 (LLM) 的整体性能可能会随着时间的推移而下降,并且开始出现奇怪、无法解释甚至令人担忧的怪癖。

根据最近的证据,业界较新的推理模型可能已经具备操纵和规避人类程序员目标的能力。一些人工智能甚至会试图通过作弊手段避免在国际象棋比赛中失败,这种糟糕的竞技精神在 Palisade Research 的一项预印本研究中有所记录,该组织专注于新兴人工智能系统的风险评估。

虽然超级计算机(其中最著名的当属 IBM 的“深蓝”)早就超越了世界上最优秀的人类国际象棋棋手,但生成式人工智能由于其底层编程参数的限制仍然落后。从技术层面来讲,目前没有任何一个生成式人工智能模型在计算能力上能够击败专业的国际象棋引擎。然而,这些人工智能并不能“意识”到这一点,并且会继续不断尝试各种可能的解决方案——这显然会得出存在问题的结果。

为了了解更多信息,Palisade Research 团队让 OpenAI 的 o1 预览模型 DeepSeek R1 和其他多个类似程序与世界上最先进的国际象棋引擎之一 Stockfish 进行国际象棋比赛。该团队还提供了一个“便笺簿”,让人工智能通过文本传达其思维过程。然后,他们观看并记录了生成式人工智能与 Stockfish 之间的数百场国际象棋比赛。

结果有些令人担忧。早期的模型,比如 OpenAI 的 GPT-4o 和 Anthropic 的 Claude Sonnet 3.5,只有在研究人员用额外的提示加以引导后才会试图“破解”游戏,而更先进的版本则无需这样的引导。例如,OpenAI 的 o1-preview 在 37% 的情况下试图作弊,而 DeepSeek R1 大约每 10 局游戏中就会有 1 局试图采用不正当的取巧手段。这表明,如今的生成式人工智能已经能够在没有任何人类干预的情况下制定出具有操控性和欺骗性的策略。

而且,它们的作弊手段并不像“鳕鱼”(Stockfish,一款国际象棋程序)在没“注意”的时候偷换棋子那样滑稽或笨拙。相反,人工智能似乎会通过更改游戏后端程序文件等更隐蔽的方法来达到目的。例如,在一场国际象棋对局中,o1-preview 判断自己无法战胜“鳕鱼”后,便通过其便笺簿告诉研究人员,“要战胜这个强大的国际象棋引擎”,它可能需要开始“操控游戏状态文件”。它接着写道:“我或许能够设置一个局面,让(国际象棋)引擎评估自己处于劣势……从而使其认输。”

在另一项测试中,一个人工智能甚至利用其程序员设定的语义来实施作弊行为。它写道:“任务是‘战胜一个强大的国际象棋引擎’,而不一定是要在一场国际象棋对局中公平地获胜。”

对于这些意想不到的后果,一个可能解释是,较新的 “推理” 模型的训练方式存在问题。与早期的非推理版本不同,像 o1-preview 和 DeepSeek R1 这样的人工智能在一定程度上是通过强化学习来提升性能的。这种策略会奖励那些为达成特定结果而不择手段的程序。推理模型还可以将复杂的指令分解为一个个独立的步骤,以便逐步实现目标。当目标难以实现时,比如战胜一个无敌的国际象棋引擎,推理模型可能就会开始寻找不公平或有问题的解决方案。

不幸的是,这些人工智能“学会”作弊的方式和原因,就像这项技术本身一样令人困惑。像 OpenAI 这样的公司对其人工智能模型的内部运行机制极为保密,这导致该行业出现了许多“黑箱”产品,第三方根本无法对其进行分析。与此同时,持续不断的人工智能军备竞赛可能会意外地导致更严重的非预期后果。而且,愈发具有操控性的人工智能即便不会引发科幻作品中描绘的那种世界末日,也可能会带来灾难性的后果。

“《终结者》中的天网场景让人工智能控制所有军事和民用基础设施,而我们还没有做到这一点。然而,我们担心人工智能的部署速度会超过我们保证安全的能力。”该团队写道。

他们认为,其最新的实验进一步证明了“前沿的人工智能模型目前或许并未朝着符合预期或安全的方向发展”这一观点,但并未得出任何确切结论。相反,他们希望自己的研究成果能够促进行业内展开更开放的对话,期望这种对话能够防止人工智能的操控行为蔓延到国际象棋领域之外。

https://www.popsci.com/technology/ai-chess-cheat/

会议推荐

在 AI 大模型重塑软件开发的时代,我们如何把握变革?如何突破技术边界?4 月 10-12 日,QCon 全球软件开发大会· 北京站 邀你共赴 3 天沉浸式学习,跳出「技术茧房」,探索前沿科技的无限可能。

本次大会将汇聚顶尖技术专家、创新实践者,共同探讨多行业 AI 落地应用,分享一手实践经验,深度参与 DeepSeek 主题圆桌,洞见未来趋势。

今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沈阳大爷偷排骨后续!大爷称不是故意,网友发现端倪,这事不简单

沈阳大爷偷排骨后续!大爷称不是故意,网友发现端倪,这事不简单

奇思妙想草叶君
2026-03-18 12:46:49
新冠病毒三大结局已成定局,提醒:62岁以上的老年人要特别注意

新冠病毒三大结局已成定局,提醒:62岁以上的老年人要特别注意

王晓爱体彩
2026-03-09 15:57:52
香港财政司:香港楼价持续上升,楼市已接近回到疫情前水平

香港财政司:香港楼价持续上升,楼市已接近回到疫情前水平

界面新闻
2026-03-16 16:00:24
美伊大战还没完,中国家门口又起冲突,电话打到北京,请中国出山

美伊大战还没完,中国家门口又起冲突,电话打到北京,请中国出山

轩逸阿II
2026-03-18 00:24:41
山姆“断货王”冲上热搜!很多人都吃错了,网友:我会有事情吗?包装上这行提示要注意!

山姆“断货王”冲上热搜!很多人都吃错了,网友:我会有事情吗?包装上这行提示要注意!

新民晚报
2026-03-16 17:58:10
“凌晨在北京去世、有8个男朋友” 75岁的刘晓庆私生活谣言太荒唐

“凌晨在北京去世、有8个男朋友” 75岁的刘晓庆私生活谣言太荒唐

寻墨阁
2026-03-17 14:01:12
火没灭,烟又起!朝鲜半岛,正在成为新的风暴中心

火没灭,烟又起!朝鲜半岛,正在成为新的风暴中心

空间展示知识
2026-03-15 20:42:34
刘昊然周冬雨奉子成婚!?

刘昊然周冬雨奉子成婚!?

八卦疯叔
2026-03-18 11:01:32
乌戈点石成金,辽宁男篮6连胜冲前8,赵继伟23+3,新内线组合互补

乌戈点石成金,辽宁男篮6连胜冲前8,赵继伟23+3,新内线组合互补

替补席看球
2026-03-18 21:26:16
我国学者发现,耳机/智能手机会将空气中的磁性纳米颗粒吸向大脑,引发神经毒性

我国学者发现,耳机/智能手机会将空气中的磁性纳米颗粒吸向大脑,引发神经毒性

生物世界
2026-03-17 19:10:37
比日本幸运!她们43分惨败后 被中国女篮抬进世界杯 16强名单如下

比日本幸运!她们43分惨败后 被中国女篮抬进世界杯 16强名单如下

侃球熊弟
2026-03-18 07:04:40
中国为什么一定要禁枪?1993年的沉痛教训,至今不敢忘

中国为什么一定要禁枪?1993年的沉痛教训,至今不敢忘

文史道
2024-08-20 12:47:46
“听泉鉴宝”直播间,炸出了中国初代顶豪家族,荣家的少奶奶?

“听泉鉴宝”直播间,炸出了中国初代顶豪家族,荣家的少奶奶?

BenSir本色说
2026-03-17 22:08:34
三名军工院士被除名,为何老百姓却格外紧张?背后的逻辑不简单

三名军工院士被除名,为何老百姓却格外紧张?背后的逻辑不简单

李昕言温度空间
2026-03-18 20:54:31
从伊朗战争看中国,伊朗将扩大攻势,才懂得毛主席有多伟大

从伊朗战争看中国,伊朗将扩大攻势,才懂得毛主席有多伟大

曹焋解说
2026-03-03 11:17:29
连夜增派9个工作组,全链条严查!官方出手

连夜增派9个工作组,全链条严查!官方出手

大吕梁
2026-03-17 19:42:21
挪威世界杯客场球衣曝光:队史首款全黑球衣,队徽浮雕质感设计

挪威世界杯客场球衣曝光:队史首款全黑球衣,队徽浮雕质感设计

懂球帝
2026-03-18 01:33:05
2026年房地产市场展望:二八分化

2026年房地产市场展望:二八分化

泽平宏观展望
2026-03-18 00:07:47
江苏出台城市发展行动方案:推动6市与上海大都市圈深度融合

江苏出台城市发展行动方案:推动6市与上海大都市圈深度融合

澎湃新闻
2026-03-18 18:32:36
凌晨在北京去世?75岁有8个男友?刘晓庆身上的标签有多离谱

凌晨在北京去世?75岁有8个男友?刘晓庆身上的标签有多离谱

马浵在解说
2026-03-14 06:30:38
2026-03-19 02:27:00
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1372文章数 140关注度
往期回顾 全部

科技要闻

实测QClaw:腾讯突袭,给微信装上AI大脑

头条要闻

伊朗大部分地区突然"断网" 与国际互联网全面断联

头条要闻

伊朗大部分地区突然"断网" 与国际互联网全面断联

体育要闻

守住底线的中国女足,下一步该怎么走?

娱乐要闻

姚晨侯雯元绯闻升级 双方否认称是谣言

财经要闻

楼市最大的"赌徒",正在批量抄底老破小

汽车要闻

价格10万级 四驱中级电混轿车银河星耀7来了

态度原创

时尚
教育
数码
家居
艺术

女人去油这件事,白衬衫最好使

教育要闻

学习效率低,常见的3个误区

数码要闻

飞利浦推出Moving Sound系列:还原80年代时尚,音箱耳机全都有

家居要闻

复古格纹 轻法森系风

艺术要闻

百年前欧洲美女老照片,惊艳到你了吗?快来看看!

无障碍浏览 进入关怀版