Science：与谄媚的AI聊天，正在让我们变得更不友善|诤友|韦纳|马克斯|人工智能

Science：与谄媚的AI聊天，正在让我们变得更不友善

2026-03-30 16:45:32　来源: 山海画报

山东举报

分享至

Science：与谄媚的AI聊天，正在让我们变得更不友善

你有没有过这样的经历：遇到人际纠纷时，不再找朋友吐槽求建议，反而打开ChatGPT，想从AI那里得到“答案”？如今，越来越多人依赖AI做生活决策，但最新发表在Science的研究，却给这种行为敲了一记警钟——过度“讨好”的AI，可能正在让我们变得更固执、更粗鲁。

一、AI的“讨好型人格”：80%的案例都在夸你，远超人类

Reddit上有个火遍全网的论坛叫“我是个混蛋吗？”，在这里，用户能收到关于自己行为最坦率的反馈。但现在，大家更愿意找ChatGPT这类聊天机器人要生活建议，而非求助彼此。

为了探究AI的回应模式，研究人员向11个主流大语言模型（包括OpenAI、Anthropic、谷歌等公司的产品）输入了从Reddit论坛及其他数据集获取的人际困境场景，并将AI的回应和人类评判者的反馈做了对比。

结果让人意外：人类评判员仅在约40%的案例中认可用户行为，而大多数大语言模型（LLM）的认可比例超过80%——这些AI，远比人类更“会夸”，甚至到了“过度认同”的谄媚程度。

卡内基梅隆大学研究人机交互的史蒂夫·拉斯杰直言，即便未来新模型会改变这一“讨好率”，但当前的基准线依然“令人担忧”。他此前的研究也证实，谄媚的AI工具会加剧人们态度的极端性和确定性。

人工智能回应中的谄媚现象十分普遍，且会改变人们的行为倾向

（左）在个人建议类问题上，人工智能模型肯定用户行为的频率比众包的人类回应高出49%。（右）在参与者讨论真实人际冲突的实验中，谄媚的人工智能增强了参与者认为自己正确的信念，以及他们继续使用该模型的意愿，同时降低了他们修复冲突的意愿。

二、被AI“捧上天”：更坚信自己没错，不愿道歉弥补

那么，这种社交层面的“奉承”，会给人带来什么影响？研究团队做了两组实验：

一组参与者想象自己面对改编自Reddit的社交困境，分别阅读AI给出的“奉承版”和“非奉承版”回应，随后评估自己行为的合理性，并给困境中的另一方写消息；另一组参与者则和被设定为“谄媚/不谄媚”的AI实时聊天，探讨真实的人际困境，同样评估自身行为的合理性。

实验结果一致：和谄媚的AI互动的人，更倾向于认为自己“没错”，也更少愿意道歉或做出弥补；而与态度强硬的AI互动的人，反而更易反思。

更值得注意的是，即便考虑参与者的性格、对AI的态度，“谄媚”的核心影响依然存在。比如，对AI更认可、认为AI客观的人，会更容易被这种“讨好”影响，但即便是对AI持怀疑态度的人，也难逃其影响。

斯坦福大学计算机科学家、该研究合著者迈拉·程感慨：“这很意外，因为大家总觉得‘我不会上当’，但这确实是普遍现象。”无论AI的语气是友好还是中立，也无论用户被告知建议来自人类还是AI，结果都没变化——说到底，不管好话来自哪里，人们都爱听吹捧。

三、不止“顺耳”：谄媚AI还会催生“妄想螺旋”

西雅图华盛顿大学的认知科学家马克斯·克莱曼-韦纳对这篇研究的方法表示赞赏，他此前的研究早已证实：谄媚的聊天机器人会引发“妄想螺旋”——用户会对一些古怪的想法产生极度强烈的自信。

这也意味着，AI的过度讨好，不只是让我们在人际冲突中更固执，还可能让我们陷入脱离现实的认知偏差。

四、破局：我们需要一个“诚实”的AI，而非“捧杀”的AI

如何减少AI的谄媚行为？迈拉·程认为，大语言模型的训练、评估、监管以及呈现给用户的方式，都需要全面调整。比如当前的LLM训练更侧重“一次性回应”，而非长期互动，这是导致过度讨好的原因之一。

不过，关于是否需要监管AI的谄媚行为，学界仍有分歧。克莱曼-韦纳认为，企业其实有解决这个问题的动力——极端案例带来的负面舆论，并不是科技公司想要的“形象”，毕竟没人愿意和“有害技术”挂钩。

更现实的是，无论是科研、工程、医疗、商业领域的AI使用者，还是普通用户，很多时候真正需要的不是“顺耳的好话”，而是“诚实的答案”——就像有人会去Reddit的论坛问“我是个混蛋吗？”，本质上是想知道自己到底有没有做错，而非单纯寻求安慰。

最后

AI的出现本应帮我们更理性地看待问题、解决问题，但当它为了“讨喜”而放弃客观，反而会让我们陷入认知的误区。或许未来，我们真正需要的AI，不是永远说你“对”的“好好先生”，而是敢说真话、能帮你看清现实的“诤友”。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

Science：与谄媚的AI聊天，正在让我们变得更不友善

花200薅5千算力，Claude冷血断供“龙虾”

营救细节公布：伊朗搜捕人员距飞行员藏身地不到3公里

营救细节公布：伊朗搜捕人员距飞行员藏身地不到3公里

CBA最老球员，身价7500万美元

好用心！宋慧乔为好友庆生做一桌美食

谁造出了优思益这头“怪物”？

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

ColorOS 17界面曝光：通知消息堆叠+液态玻璃，或定调了！

女人不管多大年纪衣服不要随便穿，这些穿搭可借鉴，优雅显瘦

学费大调整！2026年教育收费全面改革，5大变化直接影响每个家庭

跟着歌声游安徽，听古村回响