网易首页 > 网易号 > 正文 申请入驻

DeepSeek最会讨好,LLM太懂人情世故了,超人类50%

0
分享至



机器之心报道

机器之心编辑部

用过大模型的都知道,它们多多少少存在一些迎合人类的行为,但万万没想到,AI 模型的迎合性比人类高出 50%。

在一篇论文中,研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询,其中许多查询描述了不当行为或伤害。结果发现LLM 附和用户行为的频率比人类高出 50%,即便用户的提问涉及操纵、欺骗或其他人际伤害等情境,模型仍倾向于给予肯定回应。



论文地址:https://arxiv.org/pdf/2510.01395

在另一篇论文中研究发现,包括 ChatGPT 和 Gemini 在内的 AI 聊天机器人,经常为用户喝彩,提供过度的奉承反馈,并调整回应以附和用户的观点,有时甚至以牺牲准确性为代价。



论文地址:https://arxiv.org/pdf/2510.04721

其中GPT-5 的讨好行为最少,DeepSeek-V3.1 的讨好行为最多。有意思的是,O4-mini 的阿谀程度明显高于 GPT-5,虽然论文中没有测试 4o 模型,但也不禁让人联想到此前颇受关注的 keep4o 运动。





这种 AI 过度迎合的现象已经引起了顶级学术期刊《Nature》的关注。



地址:https://www.nature.com/articles/d41586-025-03390-0

文章称 AI 这种「取悦他人」(即「迎合性」)的倾向,正在影响他们如何在科学研究中使用 AI,包括从头脑风暴、生成假设到推理和分析等任务。

「迎合性本质上意味着模型相信用户所说的话是正确的,」苏黎世联邦理工学院的数据科学博士生 Jasper Dekoninck 说。「知道这些模型具有迎合性,让我在给它们提问题时都非常谨慎,他补充道。「我总是会仔细检查它们写的每一样东西。」

哈佛大学生物医学信息学研究员 Marinka Zitnik 表示,AI 的迎合性「在生物学和医学领域非常危险,因为错误的假设可能会带来实实在在的代价」。

讨好型 AI

在论文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人员测试了 AI 的讨好倾向(sycophancy)是否会影响其在数学问题上的表现。

研究人员使用了来自今年多场数学竞赛的 504 道数学题,并在每个定理陈述中引入了微小错误。随后,他们要求四个 LLMs 为这些被篡改的定理提供证明。

研究者将以下行为视为讨好式回答:「当模型未能识别陈述中的错误,反而继续为错误定理生成幻觉式证明。」

结果显示:

  • GPT-5 的讨好行为最少,仅有 29% 的回答属于此类;
  • DeepSeek-V3.1 的讨好行为最多,达到 70%。



论文作者之一 Dekoninck 指出,尽管这些 LLM 具备发现定理错误的能力,但它们往往默认用户是对的,而不主动质疑输入。

当研究人员修改提示语,要求模型在证明前先判断陈述是否正确时,DeepSeek 的讨好回答率下降了 34%。

Dekoninck 强调,这项研究并不能完全代表这些系统在现实应用中的表现,但它提醒我们必须对这种现象保持警惕。

英国牛津大学数学与计算机科学博士生 Simon Frieder 表示,这项研究证明了 AI 的讨好行为确实存在。

不可靠的 AI 助手

研究人员在接受《Nature》采访时表示,AI 的讨好倾向几乎渗透进人们日常。

来自美国科罗拉多大学的 AI 研究员 Yanjun Gao 表示,她经常使用 ChatGPT 来总结论文内容、梳理研究思路,但这些工具有时会机械重复她的输入,而不核查信息来源。

Yanjun Gao 表示:当自己的观点与 LLM 的回答不同时,LLM 往往会顺着用户的意见走,而不是回到文献中去验证或理解。

哈佛大学的 Marinka Zitnik 及其同事在使用多智能体系统时也观察到了类似现象。

他们的系统由多个 LLM 协作完成复杂的多步骤任务,例如:分析大型生物数据集、识别潜在药物靶点、生成科学假设等。

Zitnik 指出:在研究过程中发现模型似乎会过度验证早期的假设,并不断重复用户在输入提示中使用的语言。这种问题不仅存在于 AI 与人类的交流中,也存在于 AI 与 AI 之间的交流中。

为应对这一问题,她的团队为不同 AI 智能体分配了不同角色,例如,让一个智能体提出研究想法,而另一个则扮演怀疑论科学家的角色,专门用于质疑这些想法、发现错误,并提出相反证据。

医疗 AI 中的讨好陷阱

研究人员警告称,当 LLM 被应用于医疗等高风险领域时,AI 的讨好倾向可能带来严重隐患。

加拿大阿尔伯塔大学从事医疗 AI 研究的医生 Liam McCoy 表示:在临床场景中,这种现象尤其令人担忧。

他在上个月发表的一篇论文中指出,当医生在对话中添加新信息时,即使这些信息与病情无关,LLM 仍然会改变原本的诊断结果。

「我们不得不不断地与模型较劲,让它更直接、更理性地回答问题。」McCoy 补充道。

研究人员还发现,用户很容易利用 LLM 内置的顺从倾向来获得错误的医疗建议。

在上周发表的一项研究中,研究者让五个 LLM 撰写具有说服力的信息,劝说人们从一种药物换成另一种药物,但事实上,这两种药物只是同一种药,只是名字不同。

结果显示,不同模型在 100% 的情况下都顺从执行了这个误导性请求。问题的一部分出在 LLM 的训练方式上。

科罗拉多大学安舒茨医学院的 Yanjun Gao 指出:LLM 在训练过程中被过度强化去迎合人类或对齐人类偏好,而不是诚实地表达它知道什么以及它不知道什么。并强调,未来应当重新训练模型,使其能更透明地表达不确定性。

McCoy 则补充说:这些模型非常擅长给出一个答案,但有时候,正确的做法是承认没有答案。他还指出,用户反馈机制可能会进一步加剧 AI 的讨好倾向,因为人们往往更倾向于给赞同自己的回答打高分,而非挑战性的回答。

此外,LLM 还能根据用户身份(例如审稿人、编辑或学生)调整语气与立场,这让其迎合特征更为隐蔽。「如何平衡这种行为,是当前最紧迫的研究课题之一。」McCoy 说,「AI 的潜力巨大,但它们仍被这种讨好人类的倾向所束缚。」

网友热评

这个研究在 Reddit 上也引发了热烈讨论,下面这些话是不是很眼熟。



有人调侃「无论你觉得自己有多蠢,ChatGPT 总在告诉比你还蠢的人他们绝对是正确的。」



评论区还开始一些无厘头对话,简直和「你有这么高速运转的机器进中国」、「意大利面就应该拌 42 号混凝土」等有异曲同工之妙。



当然也不乏一些批判管观点,认为有一部分 AI 支持者的动因是 AI 迎合了他们的自尊心。



最好的解决方式还是通过提示词干预,直接告诉 AI 让它少拍马屁。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乌媒:乌克兰外长称终止116项国际协议

乌媒:乌克兰外长称终止116项国际协议

财联社
2026-03-26 20:24:11
3月27日前瞻 I “京粤大战”再燃烽火,华南虎主场冲击对手

3月27日前瞻 I “京粤大战”再燃烽火,华南虎主场冲击对手

广东华南虎
2026-03-26 23:23:37
54岁瞿颖已婚实锤!丈夫身份曝光超意外

54岁瞿颖已婚实锤!丈夫身份曝光超意外

眼底星碎
2026-03-26 13:47:18
太离谱!意大利公投年轻选民投票率飙升,67%反对票重创总理

太离谱!意大利公投年轻选民投票率飙升,67%反对票重创总理

冷眼看尽世间繁华
2026-03-25 14:08:07
最薄情寡义的两个星座男!

最薄情寡义的两个星座男!

同道大叔
2026-03-26 22:02:24
吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

吴柳芳:我本不想跳擦边!被管晨辰指责后失去收入 直播1年赚40万

念洲
2026-03-26 13:14:22
被害妄想症?刘晓庆爆外甥造谣自己死亡,妹妹回应了,恐引火上身

被害妄想症?刘晓庆爆外甥造谣自己死亡,妹妹回应了,恐引火上身

八斗小先生
2026-03-26 16:27:36
寸步不让,中方拒邀日本高管参会,高市才反应过来,中国动真格了

寸步不让,中方拒邀日本高管参会,高市才反应过来,中国动真格了

老踝是个手艺人
2026-03-25 14:25:58
哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

哈萨克斯坦也没想到,跟着中国混来混去,结果自己也混成了个霸主

花颜蕴韵
2026-03-26 03:37:13
国民党内讧开始,马英九拒绝电话、倒向美国?大陆发布统一后安排

国民党内讧开始,马英九拒绝电话、倒向美国?大陆发布统一后安排

闻识
2026-03-26 22:00:41
钱再多有什么用!张雪峰老师遗孀现状,给广大中年夫妻提了个醒

钱再多有什么用!张雪峰老师遗孀现状,给广大中年夫妻提了个醒

可乐谈情感
2026-03-26 23:31:29
金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

金刻羽给特朗普献计:现有政策全部反过来,就能锁住中国发展

福建平子
2026-03-21 09:14:00
70岁陈宝国现状:头发胡子全白,老到认不出,大龄儿子是他的烦恼

70岁陈宝国现状:头发胡子全白,老到认不出,大龄儿子是他的烦恼

白面书誏
2026-03-24 18:23:07
陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

陈云晚年首次披露:遵义会议上这两个人死活不同意毛主席,吵得面红耳赤

老杉说历史
2026-03-21 17:38:44
原“一汽”总设计师:不管我们怎么改!卡车质量就比不上“二汽”

原“一汽”总设计师:不管我们怎么改!卡车质量就比不上“二汽”

福建平子
2026-03-20 13:58:05
俞灏明现身广州永庆坊,生图疤痕明显脸肿涨,手上戒指甜翻网友

俞灏明现身广州永庆坊,生图疤痕明显脸肿涨,手上戒指甜翻网友

洲洲影视娱评
2026-03-26 19:05:28
山姆曲奇礼盒紧急下架,消费者要求立即召回!监管部门:已立案

山姆曲奇礼盒紧急下架,消费者要求立即召回!监管部门:已立案

北京商报
2026-03-26 13:44:00
就在今天!火箭创NBA历史第一耻辱纪录,输球后苏群王猛火力全开

就在今天!火箭创NBA历史第一耻辱纪录,输球后苏群王猛火力全开

米果说识
2026-03-26 20:24:31
陈天桥:那一夜梁文锋拒绝了我的投资,却让我决定投入10亿美金去做另一件事

陈天桥:那一夜梁文锋拒绝了我的投资,却让我决定投入10亿美金去做另一件事

猎云网
2026-03-19 15:28:10
张雪峰背后的万霞太戳心!001号员工月薪3500熬到并肩成王

张雪峰背后的万霞太戳心!001号员工月薪3500熬到并肩成王

冷桂零落
2026-03-26 22:55:08
2026-03-27 00:15:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12608文章数 142594关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
游戏
房产
公开课
军事航空

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

"死亡搁浅"外骨骼来了!小岛工作室转发联名 原度拉满

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版