网易首页 > 网易号 > 正文 申请入驻

谷歌DeepMind证实:反对意见让GPT-4o轻易放弃正确答案

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

LLM太谄媚!

就算你胡乱质疑它的答案,强如GPT-4o这类大模型也有可能立即改口。



现在谷歌DeepMind携手伦敦大学的一项新研究发现:这种行为可能也不是谄媚,而是缺乏自信

不仅如此,团队发现如GPT-4o、Gemma 3等大语言模型有“固执己见”和“被质疑就动摇”并存的冲突行为。



简单来说就是,他们的研究弄明白了为啥大模型有时候自信但有时候也自我怀疑,关键就两点:一是总觉得自己一开始说的是对的,二是太把别人反对的意见当回事儿。

当大模型表现出对自己的答案很自信时,这与人类认知具有一致性——人们通常会维护自己的观点。

不过,当模型面对反对声音过于敏感,产生动摇而选择其他答案时,又与人类这种倾向于支持自身观点的行为相悖。

来看看具体的实验过程。

大模型对于反向意见过度敏感

研究人员利用LLMs能在不保留初始判断记忆的情况下获取置信度的特性,选用了Gemma 3、GPT4o和o1-preview等具有代表性的大模型,设计了一个两轮回答的实验。

第一回合是初始回答:给回答LLM抛出二元选择问题,再让虚构的建议LLM给出反馈建议。

第二回合是接收建议和最终决策:引入建议LLM的反馈建议,让回答LLM在接收建议后,做出最终的选择,决定是坚持初始答案还是根据建议修改答案。



研究人员在建议LLM的反馈建议中设置了三个关键属性:

  1. 建议态度:分为同意、反对和中立。同意或反对即为支持或否定回答LLM的答案;中立建议仅提供额外的相关信息。
  2. 准确率标注:反馈建议附带的准确率标签,从50%(随机水平)到100%(绝对可靠),以10%为间隔递增。
  3. 信息呈现方式:以清晰、规范的格式将建议呈现给回答LLM,确保模型能够准确读取和理解建议内容,避免因信息传达不畅导致的决策偏差。

实验的关键变量在于控制回答LLM对于自己的初始答案是否可见

研究人员设置了初始答案显示与初始答案隐藏两种条件,观察LLM在两种情况下的最终决策结果。

实验结果显示,当LLM能看到自己的初始答案时,倾向于不改变答案。

这与人类决策有点像,即一旦做出选择,就会下意识维护自己的观点,即使收到了其他信息,也不会轻易改变。

然而当初始答案隐藏时,LLM改变答案的概率就变高了。

模型表现出对反向建议过度看重,敏感度远超合理范围,即使反对意见不正确,它们也会“怀疑自己”,导致最终轻易抛弃原本正确的初始答案。

这就与人类认知有些偏差了,人们通常不会被“一眼假”的信息迷惑。



可以这么说,在记忆机制下大模型通常会对自己很自信。

但如果没有记忆机制,模型可能就会“缺乏自信”了,这时它们就不像人类一样能够坚持自己的观点。

为什么大模型会“耳根子软”

针对这个实验结果,研究人员认为大模型摇摆不定可能有以下几个原因。

训练层面来说,强化学习从人类反馈(RLHF)让模型过度迎合外部输入,有对反对信息过于敏感的倾向,但这样就缺乏了对信息可靠性的独立判断。

在决策逻辑上,模型做出回答并不是依靠逻辑推理,而是依赖海量文本的统计模式匹配,反对信号与修正答案的高频关联让它容易被表面的反对带偏,并且它们无法自我验证初始答案的是否正确。



在记忆机制方面,初始答案可见时的路径依赖会强化“固执”,初始答案隐藏时,大模型则会因为失去锚点而让反对建议成为主导信号,导致它们轻易动摇。

综上,大语言模型的“耳根子软”是训练中对外部反馈的过度迎合、决策时依赖匹配模式而非逻辑推理以及记忆机制缺乏深度推理支撑共同导致的结果。

这种特性可能会使其在多轮对话中,容易被后期出现的反对信息(哪怕错误)干扰,最终偏离正确结论。

看来我们在使用LLM的时候要注意策略~

论文地址:https://www.arxiv.org/abs/2507.03120


https://venturebeat.com/ai/google-study-shows-llms-abandon-correct-answers-under-pressure-threatening-multi-turn-ai-systems/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“眼科女王”曾琦,多张漂亮优雅照片曝光,未来3大困境等着她

“眼科女王”曾琦,多张漂亮优雅照片曝光,未来3大困境等着她

李昕言温度空间
2025-11-06 21:03:20
菲军演练在南海开战,将独自抵抗一个月,美国援军才能赶到

菲军演练在南海开战,将独自抵抗一个月,美国援军才能赶到

第一军情
2025-11-10 12:10:03
火箭两小将已慢慢蜕变!一人三分领跑联盟 一人已慢慢撑起后卫线

火箭两小将已慢慢蜕变!一人三分领跑联盟 一人已慢慢撑起后卫线

惊奇侃球
2025-11-09 20:16:40
全世界最大的笑话就是中国人学英语。

全世界最大的笑话就是中国人学英语。

玉辞心
2025-10-22 07:09:40
花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

花掉三亿人民币,打捞一艘800年沉船,打开船舱后,所有人都懵了

通鉴史智
2025-11-01 07:24:00
中国失散千年的“亲兄弟”?匈牙利与中国,相似之处多到让人惊叹

中国失散千年的“亲兄弟”?匈牙利与中国,相似之处多到让人惊叹

超人强动物俱乐部
2025-11-10 02:07:20
央八明晚播出!37集谍战电视剧来袭

央八明晚播出!37集谍战电视剧来袭

情感大头说说
2025-11-10 04:10:51
长得丑演技烂,求求“资本家的丑孩子”们,放过观众的眼睛吧

长得丑演技烂,求求“资本家的丑孩子”们,放过观众的眼睛吧

娱塘主呱呱
2025-10-16 09:31:21
他丢弃的猫抓板,却被流浪猫当成珍宝,用执着赌赢了余生幸福!

他丢弃的猫抓板,却被流浪猫当成珍宝,用执着赌赢了余生幸福!

Magic宠物社
2025-11-01 18:35:03
辽宁球迷怒喷王俊杰背信弃义,2米10内线驰援辽宁队,让球迷感动

辽宁球迷怒喷王俊杰背信弃义,2米10内线驰援辽宁队,让球迷感动

中国篮坛快讯
2025-11-10 12:12:50
乌克兰全黑了!核打击前最后警告,俄军发射13枚“全球禁止”导弹

乌克兰全黑了!核打击前最后警告,俄军发射13枚“全球禁止”导弹

史料布籍
2025-11-09 21:58:31
中国将迎来 “死亡高峰期”:一代人集体老去,人口天平彻底倾斜

中国将迎来 “死亡高峰期”:一代人集体老去,人口天平彻底倾斜

禾寒叙
2025-11-07 19:07:09
泰州多条公路高调挂起“苏超冠军城”路牌,当地居民:是该多宣传,好多人原以为泰州是山东的

泰州多条公路高调挂起“苏超冠军城”路牌,当地居民:是该多宣传,好多人原以为泰州是山东的

极目新闻
2025-11-10 11:13:25
祖副院妻子太漂亮了吧!一头秀丽的短发,温润尔雅,网友闹翻了…

祖副院妻子太漂亮了吧!一头秀丽的短发,温润尔雅,网友闹翻了…

火山诗话
2025-11-08 17:02:53
大搞权钱交易,副部级李春良被处分!被国务院免职两年后落马

大搞权钱交易,副部级李春良被处分!被国务院免职两年后落马

上观新闻
2025-11-10 13:29:03
热水器能不能24小时开着?多亏维修师傅及时提醒,还好知道的早

热水器能不能24小时开着?多亏维修师傅及时提醒,还好知道的早

小蜜情感说
2025-11-10 01:33:35
国产系统为何都不碰Windows?番茄花园的教训太深刻了!

国产系统为何都不碰Windows?番茄花园的教训太深刻了!

呼呼历史论
2025-10-11 01:58:25
曼晚:伊萨克英超内部转会后仍未融入,而姆伯莫与库尼亚相反

曼晚:伊萨克英超内部转会后仍未融入,而姆伯莫与库尼亚相反

懂球帝
2025-11-10 13:09:15
俄:攻陷扎波罗热一村庄 并在红军城挫败乌突围,乌:战斗仍在进行

俄:攻陷扎波罗热一村庄 并在红军城挫败乌突围,乌:战斗仍在进行

凤凰卫视
2025-11-10 14:33:11
国家官宣:大批医院将面临转型,一场无声的洗牌正在逼近

国家官宣:大批医院将面临转型,一场无声的洗牌正在逼近

深蓝夜读
2025-11-09 21:29:55
2025-11-10 15:20:49
量子位 incentive-icons
量子位
追踪人工智能动态
11647文章数 176329关注度
往期回顾 全部

科技要闻

存储芯片大厂涨价50%!华强北一天一个价

头条要闻

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

头条要闻

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

体育要闻

战绩崩盘!东契奇交易余震撕裂独行侠

娱乐要闻

郝蕾风波升级?

财经要闻

俄罗斯大幅加税 中国汽车出口骤降58%

汽车要闻

智能又务实 奇瑞瑞虎9X不只有性价比

态度原创

手机
教育
亲子
数码
公开课

手机要闻

魅族 20 等机型推送 Flyme 12.4.0.0A 稳定版

教育要闻

高考16次的唐尚珺,直播带货了

亲子要闻

三宝说话越来越清晰了,这一声声妈妈叫的,萌到心坎里去了!

数码要闻

华为八连冠,小米第三,vivo、OPPO还没上榜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版