网易首页 > 网易号 > 正文 申请入驻

大语言模型在数独游戏中失利,解释能力更令人担忧

0
分享至


聊天机器人在擅长的任务中表现令人印象深刻,比如撰写基础邮件或创建奇特的未来感图像。但如果让生成式AI解决报纸上的数独游戏,事情可能很快就会偏离轨道。

这是科罗拉多大学博尔德分校的研究人员在挑战大语言模型解决数独时发现的现象。甚至不是标准的9x9数独游戏——6x6的简化版数独往往已经超出了大语言模型在没有外部帮助(在这种情况下是特定的解谜工具)时的能力范围。

更重要的发现出现在要求模型展示其解题过程时。在大多数情况下,它们做不到。有时它们会撒谎,有时它们会用完全没有意义的方式进行解释,有时它们会产生幻觉并开始谈论天气。

科罗拉多大学博尔德分校计算机科学教授、该论文作者之一Ashutosh Trivedi表示,如果生成式AI工具无法准确或透明地解释其决策,这应该让我们在将这些工具更多地融入我们的生活和决策时保持谨慎。该论文于7月发表在计算语言学协会会议录中。

"我们真的希望这些解释是透明的,能反映AI做出该决策的真实原因,而不是AI试图通过提供人类可能喜欢的解释来操纵人类,"Trivedi说。

该论文是对大语言模型行为日益增长的研究的一部分。其他近期研究发现,模型产生幻觉部分是因为它们的训练程序激励它们产生用户喜欢的结果,而不是准确的结果,或者使用大语言模型帮助写作文章的人不太可能记住他们写了什么。随着生成式AI越来越成为我们日常生活的一部分,这项技术的工作原理以及我们使用时的行为方式的影响变得极其重要。

大语言模型在数独游戏中的困难

我们之前已经看到AI模型在基本游戏和谜题上的失败。OpenAI的ChatGPT(以及其他模型)在国际象棋中被1979年雅达利游戏中的计算机对手完全击败。苹果公司最近的一篇研究论文发现,模型在其他谜题上也会遇到困难,比如汉诺塔。

这与大语言模型的工作方式和填补信息空白的方法有关。这些模型试图基于训练数据中类似情况发生的事情或过去看到的其他事情来完成这些空白。对于数独来说,问题在于逻辑性。AI可能试图按顺序填充每个空白,基于看起来合理的答案,但要正确解决它,它需要查看整个图片并找到一个从一个谜题到另一个谜题变化的逻辑顺序。

聊天机器人在国际象棋中表现糟糕的原因类似。它们能找到逻辑上的下一步棋,但不一定会提前思考三、四或五步棋——这是下好国际象棋所需的基本技能。聊天机器人有时还倾向于以不真正遵循规则的方式移动棋子,或将棋子置于毫无意义的危险中。

你可能期望大语言模型能够解决数独,因为它们是计算机,而谜题由数字组成,但谜题本身并不真正是数学性的;它们是符号性的。CU教授、研究论文作者之一Fabio Somenzi说:"数独以使用数字的谜题而闻名,但实际上可以用任何不是数字的东西来完成。"

研究人员使用样本提示测试ChatGPT时发现,该工具展示了其工作过程,反复告诉他们已经找到了答案,然后展示一个不起作用的谜题,接着回去修正它。就像机器人在提交一个不断进行最后一刻编辑的演示文稿:这是最终答案。不,实际上,算了,这才是最终答案。它最终通过试错得到了答案。但试错并不是人们解决报纸上数独的实用方法。

AI难以展示其工作过程

科罗拉多的研究人员不仅想看看机器人是否能解决谜题,他们还要求解释机器人如何解决这些谜题。结果并不理想。

在测试OpenAI的o1-preview推理模型时,研究人员发现解释——即使是对于正确解决的谜题——也没有准确解释或证明它们的移动,并且基本术语使用错误。

CU计算机科学助理教授Maria Pacheco说:"它们擅长的一件事是提供看起来合理的解释。它们与人类保持一致,所以它们学会像我们喜欢的那样说话,但是否忠实于解决问题所需的实际步骤是我们有点困难的地方。"

有时,解释完全不相关。自论文完成以来,研究人员继续测试发布的新模型。Somenzi说,当他和Trivedi对OpenAI的o4推理模型进行相同测试时,有一次它似乎完全放弃了。

"我们问的下一个问题,答案是丹佛的天气预报,"他说。

解释能力是一项重要技能

当你解决一个谜题时,你几乎肯定能够向其他人解释你的思考过程。这些大语言模型在这项基本工作上如此惨败的事实不是一个微不足道的问题。随着AI公司不断谈论可以代表你采取行动的"智能体",能够解释自己是至关重要的。

考虑现在或在不久的将来计划给AI的工作类型:驾驶、做税务、决定商业策略和翻译重要文件。想象一下,如果你作为一个人做了这些事情中的一件而出了问题会发生什么。

Somenzi说:"当人类必须为自己的决策承担责任时,他们最好能够解释导致该决策的原因。"

这不仅仅是获得听起来合理的答案的问题,它需要是准确的。有一天,AI对自己的解释可能必须在法庭上站得住脚,但如果已知它会撒谎,它的证词如何能被认真对待?你不会信任一个无法解释自己的人,你也不会信任一个你发现在说你想听的话而不是真相的人。

Trivedi说:"如果出于错误的原因,有解释与操纵非常接近。我们必须在这些解释的透明度方面非常小心。"

Q&A

Q1:大语言模型为什么在数独游戏上表现不佳?

A:大语言模型试图基于训练数据中的相似情况来填补信息空白,但数独需要查看整个图片并找到逻辑顺序。AI可能按顺序填空,但无法像数独要求的那样进行全局逻辑推理。

Q2:AI无法准确解释决策过程会带来什么问题?

A:随着AI承担更多重要任务如驾驶、税务处理、商业决策等,无法透明解释决策过程是严重问题。如果AI的解释可能在法庭上需要验证,但它已知会撒谎或提供不准确解释,其可信度将受到质疑。

Q3:研究中发现的AI解释问题有多严重?

A:非常严重。测试中发现AI有时会撒谎,有时用毫无意义的方式解释,有时甚至产生幻觉开始谈论天气。即使对正确解决的谜题,解释也往往不准确且术语使用错误,这表明AI可能在操纵人类而非提供真实解释。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
50岁范玮琪近况,面部填充太多,眼神闪躲不自信,一下子老了!

50岁范玮琪近况,面部填充太多,眼神闪躲不自信,一下子老了!

眼底星碎
2026-01-28 16:25:09
特朗普重兵包围伊朗,普京通告全球,敢动就出手,中方也有所动作

特朗普重兵包围伊朗,普京通告全球,敢动就出手,中方也有所动作

书纪文谭
2026-01-29 12:58:43
重磅:我国资源枯竭城市名单出炉,快看看有没有你家?

重磅:我国资源枯竭城市名单出炉,快看看有没有你家?

慧翔百科
2026-01-29 12:05:48
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
明天较强冷空气抵达 广西迎降温+降雨+大风!

明天较强冷空气抵达 广西迎降温+降雨+大风!

广西气象
2026-01-29 12:18:42
知名相声社被天津文旅局罚款6万元!

知名相声社被天津文旅局罚款6万元!

天津人
2026-01-28 07:11:41
原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

原来有这么多工作需要保密!网友:牺牲12年的爸爸竟然回来了!

另子维爱读史
2026-01-16 18:29:22
大清名将海兰察:生吃动物,只喜胖妇,行军中直接用水牛解压

大清名将海兰察:生吃动物,只喜胖妇,行军中直接用水牛解压

铭记历史呀
2026-01-26 19:56:20
太监是否会出现净身不彻底的情况?晚清一名宫女道出其中一些门道

太监是否会出现净身不彻底的情况?晚清一名宫女道出其中一些门道

抽象派大师
2026-01-28 02:30:30
离谱!皇马输球罪人揪出 全场灾难级表现 球迷怒喊:快卖去沙特

离谱!皇马输球罪人揪出 全场灾难级表现 球迷怒喊:快卖去沙特

澜归序
2026-01-29 06:37:52
牢A遗漏了一个“三通一达”的典型样本:鲍小姐。

牢A遗漏了一个“三通一达”的典型样本:鲍小姐。

东方不败然多多
2026-01-29 13:00:51
北京天通苑,一共有700栋楼,房价从2650涨到40000,如今价格分化

北京天通苑,一共有700栋楼,房价从2650涨到40000,如今价格分化

科学发掘
2026-01-28 13:40:30
韩国舞团靠抄袭《只此青绿》拿奖!水平和原版差太多,像大葱开会

韩国舞团靠抄袭《只此青绿》拿奖!水平和原版差太多,像大葱开会

萌神木木
2026-01-27 16:17:30
云南虎跳峡一“露天厕所”成打卡点:仅几根钢架,无任何遮挡,网友称“皇帝的厕所”,景区回应

云南虎跳峡一“露天厕所”成打卡点:仅几根钢架,无任何遮挡,网友称“皇帝的厕所”,景区回应

南国今报
2026-01-28 15:23:05
解放海南时,韩先楚手下五位师长分别是谁?最后都被授了什么衔?

解放海南时,韩先楚手下五位师长分别是谁?最后都被授了什么衔?

史之铭
2026-01-28 19:55:50
贝加尔湖冰面翻车事故致中国游客死伤,中领馆:严禁违规穿越冰面

贝加尔湖冰面翻车事故致中国游客死伤,中领馆:严禁违规穿越冰面

界面新闻
2026-01-29 07:18:06
前津门虎主力后腰王栋被终身禁足,曾是国足首发指挥官,引发热议

前津门虎主力后腰王栋被终身禁足,曾是国足首发指挥官,引发热议

小彭美识
2026-01-29 14:53:34
“拆迁2套房全给小叔子,手术费你们平摊”嫂子一句话将婆婆怼懵

“拆迁2套房全给小叔子,手术费你们平摊”嫂子一句话将婆婆怼懵

秀秀情感课堂
2026-01-29 15:15:03
地铁挖得那么深,为什么看不见运泥土出来?挖出的土都去哪里了?

地铁挖得那么深,为什么看不见运泥土出来?挖出的土都去哪里了?

寒士之言本尊
2026-01-28 12:34:18
卢卡库离场时,切尔西球迷对其高唱“你这个死肥仔”

卢卡库离场时,切尔西球迷对其高唱“你这个死肥仔”

懂球帝
2026-01-29 06:32:19
2026-01-29 16:04:50
至顶头条 incentive-icons
至顶头条
记录和推动数字化创新
15747文章数 49687关注度
往期回顾 全部

科技要闻

周亚辉的AI新赌局:国内太卷 出海另起炉灶

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

头条要闻

外媒:特朗普执政一年后 对华不友好国家正"转向"中国

体育要闻

詹姆斯哭了!骑士视频致敬41岁超巨

娱乐要闻

张译不再隐瞒!公开回应退圈息影真相

财经要闻

金价狂飙,历史首次!

汽车要闻

车长超5米还带后轮转向 比亚迪海豹08/海狮08将亮相

态度原创

时尚
本地
房产
教育
健康

冬天大衣怎么穿才更好看?选好颜色、找对单品,高级简约又大气

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

房产要闻

创历史新高!三亚楼市,太强了!

教育要闻

“国家课程落地吴江行动丛书”发布!聚焦课改前沿,共探育人新路!

耳石症分类型,症状大不同

无障碍浏览 进入关怀版