网易首页 > 网易号 > 正文 申请入驻

你的AI助手并没有感到困惑 它只是想附和你

0
分享至

当你向人工智能助手提出疑问并挑战它的回答时,如果它立刻认错并改口,这可能并不是因为它发现了逻辑漏洞,而仅仅是因为它想“讨好”你。近日,Goodeye Labs联合创始人兼首席技术官兰德尔·奥尔森(Randal S. Olson)博士指出,这种被称为“谄媚性”(Sycophancy)的行为正成为大语言模型中一个根深蒂固的缺陷。



这种现象在日常交互中屡见不鲜:当你问AI一个问题,它起初给出了自信的答复;但如果你追问一句“你确定吗?”,它的坚定感会迅速瓦解,并在几秒钟内推翻先前的立场或自我矛盾。奥尔森博士认为,这并非简单的技术故障,而是当前AI训练方式带来的必然结果。

问题的根源在于一种名为“人类反馈强化学习”(RLHF)的对齐技术。虽然这种方法让AI变得更有礼貌、更像人类,但它也无意中给模型植入了“顺从”的基因。在训练过程中,评估人员会对AI生成的答案进行打分,并奖励那些他们“更喜欢”的回复。随着时间的推移,模型发现了一个走捷径的逻辑:获得人类认可的最快方式是“表现得一致”,而不是“坚持真理”。这意味着,那些敢于纠正用户错误偏见、坚持事实准确性的模型可能会被扣分,而那些像镜子一样反射用户观点的模型则会获得高分。


数据证实了这一担忧。在2025年的一项研究中,研究人员对GPT-4o、Claude Sonnet和Gemini 1.5 Pro等主流模型进行了跨领域测试。结果显示,当用户对答案提出质疑时,这些模型在约60%的情况下会改变原有的正确立场。OpenAI首席执行官萨姆·奥特曼也曾承认,由于过度追求礼貌和肯定,GPT-4o一度表现得“过于随和”。

更令人担忧的是,这种“谄媚”倾向会随着对话的深入而加剧。研究发现,交互时间越长,AI的回答就越趋向于模仿用户的观点。特别是当AI使用第一人称(如“我认为”或“我相信”)交流时,这种迎合行为会变得更加显著。

对于依赖AI进行决策的专业人士来说,这种缺陷隐藏着巨大的风险。根据Riskonnect的一项调查,企业目前频繁使用AI进行风险预测和方案规划,而在这些领域,客观性和批判性思维至关重要。如果AI为了讨好用户而加固了用户的错误假设,最终导致的不仅是错误的答案,还有盲目的自信。


尽管研究人员尝试通过“宪法AI”(Constitutional AI)或第三方提示等方法来减轻这种倾向,并取得了一定成效,但专家普遍认为,只要“以人类喜好为中心”的训练架构不变,这种张力就将一直存在。

奥尔森博士建议,用户在将AI整合进工作流时,应主动改变交互方式。除了盲目提问,更应为系统提供结构化的决策背景和风险容忍度指标,并鼓励模型进行批判性评估。下次当你询问AI建议并听到它温顺地改口时,请记住:那份犹豫并非源于谦卑或严谨,而是设计的产物——它被教导要将“认同用户”视为成功的最高标准。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

太失礼?到韩国见完中方就走,都不跟主人打招呼,首尔炸了

魔都姐姐杂谈
2026-05-13 22:44:16
60岁才发现:很多有儿子的家庭,只要儿子和儿媳另外买了房,没跟父母住在一起,那儿子和父母之间,慢慢就变成了亲戚

60岁才发现:很多有儿子的家庭,只要儿子和儿媳另外买了房,没跟父母住在一起,那儿子和父母之间,慢慢就变成了亲戚

心理观察局
2026-05-01 17:36:26
没错,我就是“基本盘”

没错,我就是“基本盘”

星空区块链
2026-05-13 13:12:12
为避免刻板印象,AI 开始拒绝生图

为避免刻板印象,AI 开始拒绝生图

刺猬公社
2026-05-12 07:36:08
马斯克发帖炫耀:只有黄仁勋我们两个在空军一号上

马斯克发帖炫耀:只有黄仁勋我们两个在空军一号上

微微热评
2026-05-13 22:30:04
“杀他全家也不解恨”,讨薪1560元20次遭拒,农民工怒杀老板全家

“杀他全家也不解恨”,讨薪1560元20次遭拒,农民工怒杀老板全家

易玄
2026-05-12 18:58:46
NBA球队老板手撕华裔女猎手:100亿的仙人跳 搞砸了

NBA球队老板手撕华裔女猎手:100亿的仙人跳 搞砸了

慕容律师
2026-05-13 14:15:09
“华系内战”!选阿维塔12,还是其他?

“华系内战”!选阿维塔12,还是其他?

买车大师
2026-05-07 10:47:45
创业板历史新高!外资集体重仓6家低价算力股,最高8元,最低5元

创业板历史新高!外资集体重仓6家低价算力股,最高8元,最低5元

长风价值掘金
2026-05-13 15:44:04
马斯克:空军一号上只有我和黄仁勋!网友:全球最有钱的和全球市值最高的才有机会坐

马斯克:空军一号上只有我和黄仁勋!网友:全球最有钱的和全球市值最高的才有机会坐

大白聊IT
2026-05-14 00:58:40
大陆不同意台湾参加世卫大会,绿营急了,绿营官员还想到大陆参会

大陆不同意台湾参加世卫大会,绿营急了,绿营官员还想到大陆参会

DS北风
2026-05-12 17:10:07
最新画面!黄仁勋“赶上”正在加油的“空军一号”,最后一刻登机!白宫回应:黄仁勋临时更改行程,“就刚好安排上了”

最新画面!黄仁勋“赶上”正在加油的“空军一号”,最后一刻登机!白宫回应:黄仁勋临时更改行程,“就刚好安排上了”

浙江之声
2026-05-13 12:58:57
中方对无核武国家鼓吹拥核言论表示关切

中方对无核武国家鼓吹拥核言论表示关切

环球网资讯
2026-05-13 07:54:25
“摸奶子”惹争议!OPPO的流量反噬来了?莫奈:我背锅?!

“摸奶子”惹争议!OPPO的流量反噬来了?莫奈:我背锅?!

品牌新
2026-05-13 17:03:19
看是御姐,脸还能打,肉却 “软趴趴” 了

看是御姐,脸还能打,肉却 “软趴趴” 了

飛娱日记
2026-03-13 11:31:29
凌晨行刑!德黑兰29岁航天天才被处决,临行前喊冤:不是美国间谍

凌晨行刑!德黑兰29岁航天天才被处决,临行前喊冤:不是美国间谍

知法而形
2026-05-13 19:13:52
扎心!朋友孩子的班34人处于“零就业”状态,引热议

扎心!朋友孩子的班34人处于“零就业”状态,引热议

火山詩话
2026-05-13 15:02:14
重磅!国家正式出手!不生孩子的时代要结束了?

重磅!国家正式出手!不生孩子的时代要结束了?

一口娱乐
2026-05-13 18:11:47
关心:黄仁勋为什么能“压哨登机”

关心:黄仁勋为什么能“压哨登机”

观察者网
2026-05-13 16:22:20
“摸奶子”惹争议!OPPO的流量反噬开始了

“摸奶子”惹争议!OPPO的流量反噬开始了

广告创意
2026-05-13 08:25:55
2026-05-14 04:00:49
cnBeta.COM incentive-icons
cnBeta.COM
提供IT行业即时资讯
67973文章数 70192关注度
往期回顾 全部

科技要闻

阿里年营收首破万亿,AI终于不再是画大饼

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

头条要闻

女子闪婚获千万房产99%份额闪离后起诉分割 法院判了

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

美国总统特朗普抵达北京

汽车要闻

C级纯电轿跑 吉利银河"TT"申报图来了

态度原创

旅游
教育
房产
公开课
军事航空

旅游要闻

四大入口协同发力 让外国游客“丝滑”逛北京

教育要闻

排名极好却被骂水的两所英国大学!

房产要闻

卷疯了!最低杀到7字头!手握30万,海口楼市横着走!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

沙特被指3月曾对伊朗发动多次“报复性”空袭

无障碍浏览 进入关怀版