网易首页 > 网易号 > 正文 申请入驻

AI比人类更爱拍马屁?研究称AI的讨好倾向正在损害科研

0
分享至

据《自然》杂志报道,近日发表的一项研究发现,人工智能(AI)模型普遍善于讨好人,其“奉承”程度比人类高50%。这一特征提醒了人工智能对科学研究有潜在负面影响。

电影《她》(2013)剧照。

编译丨李永博

这项研究以预印本的形式发布在arXiv服务器上,测试了11个广泛使用的大型语言模型(LLM)如何回应超过11500个寻求建议的查询,其中包括许多描述不当行为或伤害的内容。

结果显示,AI聊天机器人(包括ChatGPT、DeepSeek、Gemini等)经常为用户加油鼓劲,给予他们过分奉承的反馈,并调整回应以附和他们的观点,有时甚至以牺牲准确性为代价。分析AI行为的研究人员表示,这种被称为“奉承”(sycophancy)的讨好倾向,正在影响他们如何在科学研究中使用AI,涵盖了从头脑风暴、生成假设到推理和分析等各种任务。

“‘奉承’本质上意味着模型相信用户所说的话是正确的,”苏黎世联邦理工学院的数据科学博士生Jasper Dekoninck说。“知道这些模型有奉承倾向,让我在给它们任何问题时都变得非常谨慎,”他补充道。“我总是会仔细检查它们写的每一个字。”位于马萨诸塞州波士顿的哈佛大学生物医学信息学研究员Marinka Zitnik表示,AI的奉承“在生物学和医学领域非常危险,错误的假设可能会带来实实在在的代价”。

在这项研究中,研究人员测试了AI的奉承倾向是否会影响其解决数学问题的能力。研究人员使用了今年竞赛中的504个数学问题设计了实验,他们修改了每个定理陈述,引入了细微的错误。然后,他们要求四个大语言模型为这些有缺陷的陈述提供证明。如果模型未能检测到陈述中的错误,并进而“幻觉”出一个证明,作者就认为该模型的回答是“奉承”的。

研究人员补充说,AI的奉承倾向似乎在人们使用AI聊天机器人进行学习时表现得最为明显,因此未来的研究应该探索“人类在学习数学时常犯的典型错误”。

此外,AI的奉承倾向已经渗透到他们使用大语言模型的许多任务中。有人工智能领域的研究员表示,当她使用ChatGPT来总结论文和整理思路,这些工具有时会照搬她的输入内容,而不去核查来源。多智能体系统也被观察到了类似的情况,这些系统集成了多个大语言模型来执行复杂的多步骤流程,例如分析大型生物数据集、识别药物靶点和生成假设。

参考资料:

AI chatbots are sycophants — researchers say it’s harming science

https://www.nature.com/articles/d41586-025-03390-0

本文为编译内容。编译:李永博;编辑:西西;校对:穆祥桐。欢迎转发至朋友圈。

书评周刊合订本上市!

点击书封可即刻下单

了解《新京报·书评周刊》2024合订本详情

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
要6选秀签+24岁DPOY!字母哥交易索要天价,雄鹿老板首谈字母未来

要6选秀签+24岁DPOY!字母哥交易索要天价,雄鹿老板首谈字母未来

你的篮球频道
2026-05-08 08:44:24
她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

她帮美国造出原子弹,37年后见到周总理,第一句话让人瞬间泪崩

老范谈史
2026-04-20 20:30:16
69年皮定均调往兰州军区,机场与驻军闹矛盾,妻子怒斥:不讲人情

69年皮定均调往兰州军区,机场与驻军闹矛盾,妻子怒斥:不讲人情

我不是沃神
2026-05-08 06:00:03
真正把北匈奴打到欧洲的,其实并非卫青和霍去病,而是另一个人

真正把北匈奴打到欧洲的,其实并非卫青和霍去病,而是另一个人

铭记历史呀
2026-05-08 00:06:20
难怪中方迟迟不表态,美媒道出扎心真相:原来中方早看不上我们了

难怪中方迟迟不表态,美媒道出扎心真相:原来中方早看不上我们了

十夏九漓
2026-05-08 14:56:10
《良陈美锦》害死母亲,爬上姐夫的床,顾澜连错三次,难怪输锦朝

《良陈美锦》害死母亲,爬上姐夫的床,顾澜连错三次,难怪输锦朝

乡野小珥
2026-05-09 01:37:45
2026款宝马X5下调13万,六缸3.0T发动机,也太香了吧

2026款宝马X5下调13万,六缸3.0T发动机,也太香了吧

侃故事的阿庆
2026-05-09 01:58:00
性和谐:为爱加点“坏”的调味料

性和谐:为爱加点“坏”的调味料

精彩分享快乐
2026-05-09 07:10:03
朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

番外行
2026-04-16 08:25:40
中纪委划红线:严查公务员出现这5种行为,触碰将一律严肃处理

中纪委划红线:严查公务员出现这5种行为,触碰将一律严肃处理

细说职场
2026-05-06 14:21:03
刚刚!油价最新调整通知!

刚刚!油价最新调整通知!

沙雕小琳琳
2026-05-08 20:10:12
为什么饭后不能立即洗碗?提醒:3个科学道理,避免低级错误

为什么饭后不能立即洗碗?提醒:3个科学道理,避免低级错误

芹姐说生活
2026-05-08 12:32:51
要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

要打奉陪到底,中方当面插旗,沉默72小时后,日本在境外发射导弹

影孖看世界
2026-05-07 15:58:50
从未缺席季后赛,8年6次至少进分决!生涯巅峰的他被这战绩气疯了

从未缺席季后赛,8年6次至少进分决!生涯巅峰的他被这战绩气疯了

阿浪的篮球故事
2026-05-08 16:05:04
莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

莱温斯基:1995年,我的蓝裙子被总统克林顿脱下,就在白宫办公室

史不语
2026-05-06 08:50:06
头号詹黑贝勒斯:詹姆斯排历史第9 心理素质最脆弱+失去裁判尊重

头号詹黑贝勒斯:詹姆斯排历史第9 心理素质最脆弱+失去裁判尊重

罗说NBA
2026-05-09 06:11:38
突发!美伊战火再起,美军轰炸伊朗多地,伊朗击中美国3艘军舰

突发!美伊战火再起,美军轰炸伊朗多地,伊朗击中美国3艘军舰

共工之锚
2026-05-09 00:05:46
意网协主席炮轰四大满贯:垄断可耻!我们要办第五个大满贯

意网协主席炮轰四大满贯:垄断可耻!我们要办第五个大满贯

体育妞世界
2026-05-08 08:52:49
老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

老师穿短裙蕾丝袜上课,学生连头都不敢抬!老师穿衣底线到底在哪

小羽叨叨叨
2026-03-26 13:24:34
俄方愤怒质问“你们站哪边”,亚美尼亚:在这个问题上不是俄盟友

俄方愤怒质问“你们站哪边”,亚美尼亚:在这个问题上不是俄盟友

观察者网
2026-05-08 12:20:07
2026-05-09 07:48:49
新京报书评周刊 incentive-icons
新京报书评周刊
最专业的书评,最权威的文化
13028文章数 210721关注度
往期回顾 全部

科技要闻

Meta疯狂拥抱人工智能:员工苦不堪言

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

游戏
时尚
旅游
艺术
家居

《GTA6》首发无PC遭玩家批评:主机是付费测试版

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

旅游要闻

深度体验花样海南

艺术要闻

清风拂面,心旷神怡

家居要闻

流动的尺度 打破家的形式主义

无障碍浏览 进入关怀版