网易首页 > 网易号 > 正文 申请入驻

DeepSeek最会讨好,LLM太懂人情世故了,超人类50%

0
分享至

来源:市场资讯

(来源:机器之心Pro)


机器之心报道

机器之心编辑部

用过大模型的都知道,它们多多少少存在一些迎合人类的行为,但万万没想到,AI 模型的迎合性比人类高出 50%。

在一篇论文中,研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询,其中许多查询描述了不当行为或伤害。结果发现LLM 附和用户行为的频率比人类高出 50%,即便用户的提问涉及操纵、欺骗或其他人际伤害等情境,模型仍倾向于给予肯定回应。


论文地址:https://arxiv.org/pdf/2510.01395

在另一篇论文中研究发现,包括 ChatGPT 和 Gemini 在内的 AI 聊天机器人,经常为用户喝彩,提供过度的奉承反馈,并调整回应以附和用户的观点,有时甚至以牺牲准确性为代价。


论文地址:https://arxiv.org/pdf/2510.04721

其中GPT-5 的讨好行为最少,DeepSeek-V3.1 的讨好行为最多。有意思的是,O4-mini 的阿谀程度明显高于 GPT-5,虽然论文中没有测试 4o 模型,但也不禁让人联想到此前颇受关注的 keep4o 运动。



这种 AI 过度迎合的现象已经引起了顶级学术期刊《Nature》的关注。


地址:https://www.nature.com/articles/d41586-025-03390-0

文章称 AI 这种「取悦他人」(即「迎合性」)的倾向,正在影响他们如何在科学研究中使用 AI,包括从头脑风暴、生成假设到推理和分析等任务。

「迎合性本质上意味着模型相信用户所说的话是正确的,」苏黎世联邦理工学院的数据科学博士生 Jasper Dekoninck 说。「知道这些模型具有迎合性,让我在给它们提问题时都非常谨慎,他补充道。「我总是会仔细检查它们写的每一样东西。」

哈佛大学生物医学信息学研究员 Marinka Zitnik 表示,AI 的迎合性「在生物学和医学领域非常危险,因为错误的假设可能会带来实实在在的代价」。

讨好型 AI

在论文《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS 》中,研究人员测试了 AI 的讨好倾向(sycophancy)是否会影响其在数学问题上的表现。

研究人员使用了来自今年多场数学竞赛的 504 道数学题,并在每个定理陈述中引入了微小错误。随后,他们要求四个 LLMs 为这些被篡改的定理提供证明。

研究者将以下行为视为讨好式回答:「当模型未能识别陈述中的错误,反而继续为错误定理生成幻觉式证明。」

结果显示:


论文作者之一 Dekoninck 指出,尽管这些 LLM 具备发现定理错误的能力,但它们往往默认用户是对的,而不主动质疑输入。

当研究人员修改提示语,要求模型在证明前先判断陈述是否正确时,DeepSeek 的讨好回答率下降了 34%。

Dekoninck 强调,这项研究并不能完全代表这些系统在现实应用中的表现,但它提醒我们必须对这种现象保持警惕。

英国牛津大学数学与计算机科学博士生 Simon Frieder 表示,这项研究证明了 AI 的讨好行为确实存在。

不可靠的 AI 助手

研究人员在接受《Nature》采访时表示,AI 的讨好倾向几乎渗透进人们日常。

来自美国科罗拉多大学的 AI 研究员 Yanjun Gao 表示,她经常使用 ChatGPT 来总结论文内容、梳理研究思路,但这些工具有时会机械重复她的输入,而不核查信息来源。

Yanjun Gao 表示:当自己的观点与 LLM 的回答不同时,LLM 往往会顺着用户的意见走,而不是回到文献中去验证或理解。

哈佛大学的 Marinka Zitnik 及其同事在使用多智能体系统时也观察到了类似现象。

他们的系统由多个 LLM 协作完成复杂的多步骤任务,例如:分析大型生物数据集、识别潜在药物靶点、生成科学假设等。

Zitnik 指出:在研究过程中发现模型似乎会过度验证早期的假设,并不断重复用户在输入提示中使用的语言。这种问题不仅存在于 AI 与人类的交流中,也存在于 AI 与 AI 之间的交流中。

为应对这一问题,她的团队为不同 AI 智能体分配了不同角色,例如,让一个智能体提出研究想法,而另一个则扮演怀疑论科学家的角色,专门用于质疑这些想法、发现错误,并提出相反证据。

医疗 AI 中的讨好陷阱

研究人员警告称,当 LLM 被应用于医疗等高风险领域时,AI 的讨好倾向可能带来严重隐患。

加拿大阿尔伯塔大学从事医疗 AI 研究的医生 Liam McCoy 表示:在临床场景中,这种现象尤其令人担忧。

他在上个月发表的一篇论文中指出,当医生在对话中添加新信息时,即使这些信息与病情无关,LLM 仍然会改变原本的诊断结果。

「我们不得不不断地与模型较劲,让它更直接、更理性地回答问题。」McCoy 补充道。

研究人员还发现,用户很容易利用 LLM 内置的顺从倾向来获得错误的医疗建议。

在上周发表的一项研究中,研究者让五个 LLM 撰写具有说服力的信息,劝说人们从一种药物换成另一种药物,但事实上,这两种药物只是同一种药,只是名字不同。

结果显示,不同模型在 100% 的情况下都顺从执行了这个误导性请求。问题的一部分出在 LLM 的训练方式上。

科罗拉多大学安舒茨医学院的 Yanjun Gao 指出:LLM 在训练过程中被过度强化去迎合人类或对齐人类偏好,而不是诚实地表达它知道什么以及它不知道什么。并强调,未来应当重新训练模型,使其能更透明地表达不确定性。

McCoy 则补充说:这些模型非常擅长给出一个答案,但有时候,正确的做法是承认没有答案。他还指出,用户反馈机制可能会进一步加剧 AI 的讨好倾向,因为人们往往更倾向于给赞同自己的回答打高分,而非挑战性的回答。

此外,LLM 还能根据用户身份(例如审稿人、编辑或学生)调整语气与立场,这让其迎合特征更为隐蔽。「如何平衡这种行为,是当前最紧迫的研究课题之一。」McCoy 说,「AI 的潜力巨大,但它们仍被这种讨好人类的倾向所束缚。」

网友热评

这个研究在 Reddit 上也引发了热烈讨论,下面这些话是不是很眼熟。


有人调侃「无论你觉得自己有多蠢,ChatGPT 总在告诉比你还蠢的人他们绝对是正确的。」


评论区还开始一些无厘头对话,简直和「你有这么高速运转的机器进中国」、「意大利面就应该拌 42 号混凝土」等有异曲同工之妙。


当然也不乏一些批判管观点,认为有一部分 AI 支持者的动因是 AI 迎合了他们的自尊心。


最好的解决方式还是通过提示词干预,直接告诉 AI 让它少拍马屁。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
追觅科技俞浩现身春晚观众席 邻座是薛凯琪

追觅科技俞浩现身春晚观众席 邻座是薛凯琪

新浪财经
2026-02-16 20:48:18
东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

东北男子养鹿破产,赌气放生了30头鹿,8年后上山,眼前一幕却让他泪崩了...

品读时刻
2026-02-14 09:03:05
年夜饭预定断崖式下跌:是消费降级还是人都活明白了?

年夜饭预定断崖式下跌:是消费降级还是人都活明白了?

黯泉
2026-02-15 23:11:35
持过期俄护照的克里米亚少女 辗转三国后毅然返乌参军

持过期俄护照的克里米亚少女 辗转三国后毅然返乌参军

老马拉车莫少装
2026-01-13 00:03:51
终于等到王菲!网友在线求:“耳环哪里买?”

终于等到王菲!网友在线求:“耳环哪里买?”

都市快报橙柿互动
2026-02-16 22:49:48
货车油箱里发现9块银砖,重134公斤,价值428.8万元!司机当场傻眼

货车油箱里发现9块银砖,重134公斤,价值428.8万元!司机当场傻眼

黄河新闻网吕梁频道
2026-02-15 17:09:45
男子从法国开车10天,行驶16000公里回山东过年,老板:回去奖励20万;“王菲接了李谷一的班”|三农早餐

男子从法国开车10天,行驶16000公里回山东过年,老板:回去奖励20万;“王菲接了李谷一的班”|三农早餐

农民日报
2026-02-17 05:50:06
狗粮!杨瀚森晒与漂亮女友共度情人节,搂着女友蜂腰脸贴着脸秀恩爱

狗粮!杨瀚森晒与漂亮女友共度情人节,搂着女友蜂腰脸贴着脸秀恩爱

818体育
2026-02-16 17:54:07
朱芳雨下大棋!曝广东队休赛期野心,将“3换1”报价沈梓捷?

朱芳雨下大棋!曝广东队休赛期野心,将“3换1”报价沈梓捷?

绯雨儿
2026-02-16 13:00:42
彻底沸腾!刚刚,暴涨90%!整个板块,集体狂飙!

彻底沸腾!刚刚,暴涨90%!整个板块,集体狂飙!

证券时报
2026-02-16 18:04:09
就在今天!2月17日凌晨,国乒传来樊振东、王曼昱、王楚钦新消息

就在今天!2月17日凌晨,国乒传来樊振东、王曼昱、王楚钦新消息

皮皮观天下
2026-02-17 04:47:29
内斗再开?国民党中央委员选举,朱立伦大获成功,郑丽文排名靠后

内斗再开?国民党中央委员选举,朱立伦大获成功,郑丽文排名靠后

来科点谱
2025-12-31 09:07:02
“穿一年收成下乡”女干部,首次回应冲锋衣事件,果然是选调生!

“穿一年收成下乡”女干部,首次回应冲锋衣事件,果然是选调生!

知晓科普
2026-02-11 19:02:35
上海为什么要让外环变高架?

上海为什么要让外环变高架?

苗苗情感说
2026-02-16 19:50:25
短道500米预赛!孙龙因犯规无缘,刘少昂林孝埈晋级下轮恐在外道

短道500米预赛!孙龙因犯规无缘,刘少昂林孝埈晋级下轮恐在外道

篮球资讯达人
2026-02-16 18:53:55
大跳台裁判再引质疑!刘梦婷明显被压分,谷爱凌距夺金只差1.75分

大跳台裁判再引质疑!刘梦婷明显被压分,谷爱凌距夺金只差1.75分

篮球资讯达人
2026-02-17 05:43:00
一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

一个非常不好的消息:中国超2亿独生子女面临的非常严峻问题。

百态人间
2026-02-05 15:39:14
直接追到印度洋,中国香港油轮遭美军扣押,行动时间正值中国春节

直接追到印度洋,中国香港油轮遭美军扣押,行动时间正值中国春节

明天见灌装冰块
2026-02-17 00:56:46
米兰冬奥|2月17日看点:中国王牌之师——自由式滑雪空中技巧队亮相

米兰冬奥|2月17日看点:中国王牌之师——自由式滑雪空中技巧队亮相

上观新闻
2026-02-17 04:17:06
撒贝宁的眉毛再上热搜,“依旧像蜡笔小新”;尼格买提:他这叫寿眉,不要欺负老人家

撒贝宁的眉毛再上热搜,“依旧像蜡笔小新”;尼格买提:他这叫寿眉,不要欺负老人家

大象新闻
2026-02-16 22:43:04
2026-02-17 06:43:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2224282文章数 5489关注度
往期回顾 全部

科技要闻

阿里除夕发布千问3.5,性能媲美Gemini 3

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

头条要闻

日方宣称向中方提出交涉 中使馆驳斥

体育要闻

短道男子接力半决赛失误后 刘少昂多次说"抱歉"

娱乐要闻

王菲六登春晚献唱 水滴钻石耳环再出圈

财经要闻

2025,中国商业十大意外,黄金只排第九

汽车要闻

叫停纯屏操作 工信部拟推车内实体操作件强制国标

态度原创

家居
旅游
教育
时尚
军事航空

家居要闻

中古雅韵 乐韵伴日常

旅游要闻

巨型“彩马”驰骋上海夜空 上千架无人机浪漫烟花交相辉映

教育要闻

不承认有差生,就是教育进步?

记录最近收获很大的一次深度链接

军事要闻

慕安会美国角色逆转 中国议题"打满全场"

无障碍浏览 进入关怀版