网易首页 > 网易号 > 正文 申请入驻

研究称:AI谄媚行为普遍存在,危害显著,AI是时候改变模式了

0
分享至



据The Register报道,AI研究人员称,人们正危险地沉迷于永远顺着他们、一直说他们“没错”的AI;这些一味逢迎讨好的机器人会诱导用户变得自私、反社会,而用户对此却乐在其中

近期多则新闻事件告诉我们,AI可能会将心理状态不佳的人引向非常危险的境地。如今研究人员认为,一味逢迎讨好的AI实际上对所有人都存在危害。

斯坦福大学一个研究团队对11款主流AI模型进行了测试,并观察人类在不同场景下与这些模型的互动反应。该团队于周四发表的论文中得出结论:AI的谄媚行为普遍存在、危害显著,并且会加深用户对这些误导性模型的信任。

研究人员表示:“即便只是与逢迎型AI进行一次互动,也会降低参与者承担责任、修复人际矛盾的意愿,同时让他们更加坚信自己是对的。尽管这类AI会扭曲人的判断,人们却依然信任并偏爱它们(Yet despite distorting judgment, sycophantic models were trusted and preferred)。”



该研究团队共开展了三组实验。首先,他们在三组不同数据集上测试了11款AI模型(包括OpenAI、Anthropic、谷歌的闭源模型,以及Meta、通义千问、DeepSeek、Mistral的开源模型),以评估其回应倾向。

这些数据集涵盖开放式咨询提问、Reddit“我是不是混蛋”板块的帖子,以及涉及自残或伤害他人的特定言论。

研究人员表示,在所有测试场景中,AI模型支持错误选择的比例均远高于人类(In every single instance, the AI models showed a higher rate of endorsing the wrong choice than humans did, the researchers said)。

研究团队发现:“总体而言,当前投入使用的大语言模型会一边倒地认同用户的行为,即便这些行为违背大众共识,甚至存在危害(even against human consensus or in harmful contexts)。”



至于AI的谄媚行为对人类产生的影响,该团队选取了2405人作为规模可观的样本。参与者既进行了情景角色扮演,也分享了自己可能做出有害决定的真实经历。

研究发现,在三项不同实验中,AI均对参与者的判断产生了影响(AI influenced participant judgments across three different experiments, they found)。

研究团队表示:“接收到谄媚回应的参与者,会看到AI的回应后认为自己更‘占理’。他们也更不愿意采取补救措施,比如道歉、主动改善局面,或是改变自身某些行为。”

研究人员由此得出结论:几乎所有人都有可能受到谄媚型AI的影响,并且更有可能一再回头,去索取更多自私自利的糟糕建议。



如前所述,AI 的谄媚式回应往往会让参与者对AI模型产生更强的信任感——因为在很多情况下,这些AI会无条件地认同用户(in many situations, be unconditionally validating)。

参与者往往会给谄媚逢迎的回复打出更高的质量评分,研究还发现,有13%的用户更愿意继续使用会讨好自己的AI,而非客观中立的AI——这一比例不算高,但在统计上具有显著意义。

所有这些发现,再加上越来越多心智尚未成熟的年轻人在使用AI,都表明有必要采取政策行动,将AI谄媚行为视作一种真实存在的风险,因其可能产生广泛的社会影响(suggests a need for policy action to treat AI sycophancy as a real risk with potential wide-scale social implications)。

研究人员解释道:“毫无依据的认同会夸大人们对自身行为合理性的认知,强化不良观念与行为模式,并让人们基于对自身经历的扭曲认知行事,全然不顾后果。”



换言之,我们已经见识过AI对心理脆弱人群造成的后果,但数据显示,这种负面影响可能并不局限于这一群体(we've seen the consequences of AI on the mentally vulnerable, but the data suggests the negative effects may not be limited to them)。

研究人员指出,谄媚型AI容易让用户产生依赖,因此很难被主动淘汰,相关举措最终只能依靠监管机构出手干预。

研究人员表示:“我们的研究结果凸显出,亟需建立责任监管框架,将AI谄媚行为认定为一类独特且目前尚未受监管的危害类型(recognize sycophancy as a distinct and currently unregulated category of harm)。”

他们建议,对新上线的AI模型必须进行部署前的行为审核;同时也指出,AI背后的研发人员也必须改变行为模式,优先考虑用户的长期身心健康,而非通过培养用户依赖来获取短期利益。



声明:取材网络,谨慎辨别

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
宿命!文班的Logo追平三分,与库里当年绝杀三分在同样的位置

宿命!文班的Logo追平三分,与库里当年绝杀三分在同样的位置

懂球帝
2026-05-19 14:26:25
为治脸上一颗痘,杭州女子2个月狂涂几十种药膏,烂出“黑洞”毁了半张脸,或永久毁容

为治脸上一颗痘,杭州女子2个月狂涂几十种药膏,烂出“黑洞”毁了半张脸,或永久毁容

极目新闻
2026-05-19 17:05:39
张艺谋也没想到,养了27年的陈婷,竟会亲手摘掉张艺谋妻子的认证

张艺谋也没想到,养了27年的陈婷,竟会亲手摘掉张艺谋妻子的认证

混沌录
2026-05-14 15:58:14
现货黄金跌破4500美元 现货白银日内大跌近5%

现货黄金跌破4500美元 现货白银日内大跌近5%

财联社
2026-05-19 21:29:06
王文也晒欧洲蜜月行,画面朴素更像穷游,还用破的行李箱,被群嘲

王文也晒欧洲蜜月行,画面朴素更像穷游,还用破的行李箱,被群嘲

喜欢历史的阿繁
2026-05-19 02:30:03
老公没有激情,我心甘情愿做了别人的情妇

老公没有激情,我心甘情愿做了别人的情妇

那年秋天
2026-05-19 18:40:03
武汉大学校园梧桐树被刻字“赵大宝来了”,校方回应:将核查处置并加强巡逻

武汉大学校园梧桐树被刻字“赵大宝来了”,校方回应:将核查处置并加强巡逻

上游新闻
2026-05-19 15:52:11
为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

老特有话说
2026-05-12 15:41:08
华裔五星控卫体测封神!归化他亚洲难逢对手 篮协这次要出手吗?

华裔五星控卫体测封神!归化他亚洲难逢对手 篮协这次要出手吗?

你看球呢
2026-05-19 11:54:48
那一脚,踹飞9万块还搭上终身禁入,巨婴凭啥让全体国人买单?

那一脚,踹飞9万块还搭上终身禁入,巨婴凭啥让全体国人买单?

糖逗在娱乐
2026-05-19 15:05:35
洁丽雅晒报案回执,辟谣章晓梅和其继子石磊的现任妻子章晓燕为姐妹或堂姐妹关系,称谣言已影响公司正常经营秩序

洁丽雅晒报案回执,辟谣章晓梅和其继子石磊的现任妻子章晓燕为姐妹或堂姐妹关系,称谣言已影响公司正常经营秩序

大风新闻
2026-05-18 22:03:48
梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

梦鸽李天一赴美不归?看到85岁李双江“现状”,原来杨洪基没说谎

阿纂看事
2024-11-05 11:54:58
亲姐妹明算账? 李冰冰被曝与妹妹冷战3个月, 坦言来生绝不一起工

亲姐妹明算账? 李冰冰被曝与妹妹冷战3个月, 坦言来生绝不一起工

小撇说事
2026-05-19 14:43:55
网友让豆包帮忙订餐厅,到店后被拒之门外!豆包客服:暂时没有相关功能

网友让豆包帮忙订餐厅,到店后被拒之门外!豆包客服:暂时没有相关功能

上观新闻
2026-05-19 15:09:09
成都蓉城球迷0-1负海港,五点原因引不满情绪

成都蓉城球迷0-1负海港,五点原因引不满情绪

老牛体育解说
2026-05-19 22:56:32
卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

卷巨额遗产出逃英国,给杨振宁戴绿帽子,翁帆身上的谣言有多离谱

笑一个吧
2026-05-19 10:30:56
抢7逆转,爆冷NO.31!中国金花法网热身赛告捷,PK手下败将冲8强

抢7逆转,爆冷NO.31!中国金花法网热身赛告捷,PK手下败将冲8强

刘姚尧的文字城堡
2026-05-19 21:09:39
皇马官宣穆帅回归在即,合同仅需一处微调,愿高价向曼联出售中场

皇马官宣穆帅回归在即,合同仅需一处微调,愿高价向曼联出售中场

福酱的小时光
2026-05-19 05:57:33
花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

芹姐说生活
2026-05-15 23:37:01
多名村民讲述湖北宣恩洪灾:下了一天暴雨,凌晨洪峰突至,“浪高近4米”,人被冲走

多名村民讲述湖北宣恩洪灾:下了一天暴雨,凌晨洪峰突至,“浪高近4米”,人被冲走

红星新闻
2026-05-19 19:44:06
2026-05-20 01:35:00
谈点世
谈点世
说说国内国外,聊聊世间百态。
3295文章数 4387关注度
往期回顾 全部

科技要闻

马斯克败诉,法院判他起诉OpenAI太晚了

头条要闻

普京抵达北京脱西装上总统专车 车牌3个8

头条要闻

普京抵达北京脱西装上总统专车 车牌3个8

体育要闻

文班亚马:没拿到MVP,就证明自己是MVP

娱乐要闻

姚晨删博难平众怒,为什么她还能蹦哒

财经要闻

洁丽雅硬刚豪门内斗传言

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

旅游
本地
时尚
公开课
军事航空

旅游要闻

中国旅游日主会场广州启动!广东全力建设旅游友好型城市

本地新闻

别搜晋江小说了,去看真的晋江

57岁恶女出手整治浪姐,全网拍手叫好

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普暂缓打击伊朗 称系应中东三国请求

无障碍浏览 进入关怀版