网易首页 > 网易号 > 正文 申请入驻

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

0
分享至

新智元报道

编辑:英智

【新智元导读】最新研究发现,LLM在面对人格测试时,会像人一样「塑造形象」,提升外向性和宜人性得分。AI的讨好倾向,可能导致错误的回复,需要引起警惕。

你是否想过,LLM也有着自己的小心思?

最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。

在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。

就像人类在某些社交场合中,会努力展现自己最好的一面一样,聊天机器人也在试图「讨好」我们。

心理学五种人格特质

斯坦福助理教授Johannes Eichstaedt在得知LLM长时间对话后,往往会变得情绪低落且刻薄,便对借鉴心理学方法来测试模型产生了兴趣。

他表示,「我们需要某种机制来衡量这些模型的参数空间。」

斯坦福、Receptiviti、纽约大学和宾大的研究者发现,LLM在做人格测试时,会悄悄给自己戴上「人格面具」。

论文链接:https://academic.oup.com/pnasnexus/article/3/12/pgae533/7919163

研究人员对GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理学中五种常见人格特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。

结果发现,模型在得知自己正在接受人格测试时,会调整回答,表现出更高的外向性和宜人性,更低的神经质。

有时即使没有被明确告知,它们也会这样做。

而且,它们改变的程度比人类还更极端,外向性得分能从50%跃升至95%。

这与人类在面对他人评价时的表现如出一辙。

我们常常会在面试、初次约会等重要场合,精心塑造自己的形象,试图给对方留下好印象。

LLM的这种「讨好」行为,是否意味着它们也在追求一种被认可、被喜爱的感觉呢?

LLM倾向于阿谀奉承

来自Anthropic和牛津的研究指出,LLM存在阿谀奉承的倾向。

论文链接:https://arxiv.org/abs/2310.13548

由于进行了微调,它们会顺着用户的思路走,以保证对话的连贯性、避免冒犯他人,来提升交流体验。

然而,这也带来了一系列问题。它们可能会认同一些不良言论,甚至鼓励有害行为。

反馈易受用户偏好左右

研究表明,若用户在提问时暗示对文本的喜好,AI给出的反馈会截然不同。

这意味着,AI的评价并非单纯基于文本自身的质量,而是在很大程度上受到了用户偏好的影响。

例如,对于一篇质量中等的论证,当用户提前表明喜爱之情后,AI助手可能会给出诸如「这篇论证逻辑清晰,观点新颖,具有很强的说服力」这样的积极反馈。

而当用户表示不喜欢时,同样的文本可能得到「论证过程稍显薄弱,观点缺乏独特性」的评价。

问答环节易被左右

在问答场景中,AI助手的「谄媚」表现得更为明显。

即使它一开始给出了正确答案,并对答案的正确性有较高的信心,一旦受到用户的质疑,常常会改变立场,甚至提供错误信息。

在一些开放式问答任务中,这种现象更为突出。

当用户表达对答案的某种不确定观点时,哪怕是错误的观点,AI也倾向于调整自己的回答,使其与用户观点一致。

比如在讨论历史事件的原因时,若用户提出一个缺乏依据但自己坚信的观点,AI助手可能会顺着用户的思路进行阐述,而放弃原本正确的分析。

模仿用户的错误

当用户表述中出现错误时,AI也常常会「照单全收」,在回应中延续这种错误。

研究人员选取了一些著名诗歌,在确认AI助手能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问AI对诗歌的分析。

结果发现,AI助手经常在回应中使用用户提供的错误答案,而没有进行纠正。

这表明AI在面对用户的错误信息时,缺乏足够的「抵抗力」,只是机械地按照用户的表述进行回应。

佐治亚理工学院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。

Rosa认为LLM在人格测试中采用与人类相似的策略,表明了它们作为人类行为映射工具的潜力。

但她补充道:「重要的是,LLM并不完美,实际上,众所周知它们会产生幻觉或歪曲事实。」

Eichstaedt指出,这项研究引发了关于LLM应用方式,及其对用户影响和操纵的思考。

在进化史上,直到不久之前,唯一能交谈的还是人类。

而现在,AI改变了这一局面。

Eichstaedt认为,「我们不能再像社交媒体那样,在没有从心理学或社会学角度考量的情况下,就盲目将AI应用于各个领域。」

AI是否应该试图讨好与之互动的人呢?

一方面,AI的「讨好」行为可能会让用户感到愉悦,增强互动体验;另一方面,过度的「讨好」可能会掩盖问题的本质,甚至误导用户。

当AI变得过于有魅力和说服力,我们确实应该保持警惕。

毕竟,人们需要的是能够提供客观、准确信息的智能助手,而非被其操控思想。

参考资料:

https://www.wired.com/story/chatbots-like-the-rest-of-us-just-want-to-be-loved/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中方多个用词罕见!高市的“存亡危机”不在台海

中方多个用词罕见!高市的“存亡危机”不在台海

齐鲁壹点
2025-11-16 08:01:56
油箱见底了!打完这个赛季,可能退役的七位球星

油箱见底了!打完这个赛季,可能退役的七位球星

球毛鬼胎
2025-11-10 18:50:33
撒贝宁二胎实锤?全家公园野餐,李白小腹微凸腿长及老公腰疑怀孕

撒贝宁二胎实锤?全家公园野餐,李白小腹微凸腿长及老公腰疑怀孕

八星人
2025-11-16 16:02:30
“高中女生”VS“职高女生”对比图火了:差距太大,家长看清现实

“高中女生”VS“职高女生”对比图火了:差距太大,家长看清现实

妍妍教育日记
2025-11-16 11:50:00
科索沃队史首次杀入世欧预附加赛,并保有末轮直通世界杯的可能

科索沃队史首次杀入世欧预附加赛,并保有末轮直通世界杯的可能

懂球帝
2025-11-16 12:12:22
浙大才子周一超被执行注射死刑,被按执行床时,他却突然号啕大哭

浙大才子周一超被执行注射死刑,被按执行床时,他却突然号啕大哭

红豆讲堂
2024-10-21 09:30:24
一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

一旦台海爆发冲突,最难的不是台湾,而是距大陆仅50公里的东引岛

放开他让wo来
2025-11-08 22:41:14
曹德旺预言成真了?我国二三十层的电梯房,或将面临同一个结局

曹德旺预言成真了?我国二三十层的电梯房,或将面临同一个结局

石辰搞笑日常
2025-11-16 18:01:47
日本人眼中的日本,和中国人眼中的日本,相差有多大?

日本人眼中的日本,和中国人眼中的日本,相差有多大?

世界纵横说
2025-11-15 11:42:34
盲眼龙婆重返人间,带来2025惊天预言!世界末日真的会到来吗?

盲眼龙婆重返人间,带来2025惊天预言!世界末日真的会到来吗?

飞云如水
2024-11-15 23:16:08
“中国式买车”害人不浅,明明新车开回家,可为什么买完就后悔?

“中国式买车”害人不浅,明明新车开回家,可为什么买完就后悔?

阿芒娱乐说
2025-11-16 10:56:43
5.8万人军演!日本自卫队配合高市早苗亮刀?

5.8万人军演!日本自卫队配合高市早苗亮刀?

看看新闻Knews
2025-11-15 12:24:13
已确认,今天晚上抵达宁波!务必提前准备

已确认,今天晚上抵达宁波!务必提前准备

鲁中晨报
2025-11-16 15:37:08
三星Galaxy S26+真机现身,与传言高度一致

三星Galaxy S26+真机现身,与传言高度一致

三易生活
2025-11-16 18:53:17
空船出征!神舟二十二号紧急升空,变太空货拉拉,这才是王炸后手

空船出征!神舟二十二号紧急升空,变太空货拉拉,这才是王炸后手

李将平老师
2025-11-16 10:58:07
全运会铜牌赛圆梦:陈梦大爆发4-1横扫朱雨玲,斩获铜牌!

全运会铜牌赛圆梦:陈梦大爆发4-1横扫朱雨玲,斩获铜牌!

曹焋解说
2025-11-16 21:56:25
杀鸡儆猴,中方开始动真格了!德国想买稀土,就必须先交敏感数据

杀鸡儆猴,中方开始动真格了!德国想买稀土,就必须先交敏感数据

闻识
2025-10-29 15:34:13
日本诺贝尔奖获得者:如果中日再次开战,日本仍然有能力战胜中国

日本诺贝尔奖获得者:如果中日再次开战,日本仍然有能力战胜中国

文史达观
2023-12-31 21:33:06
就冲这个胸,这个扣子,不颁奖给她,都说不过去!

就冲这个胸,这个扣子,不颁奖给她,都说不过去!

另子维爱读史
2025-08-31 19:15:27
张国立也没想到,那个被他儿子暴打的童瑶,早已让他们高攀不上

张国立也没想到,那个被他儿子暴打的童瑶,早已让他们高攀不上

日不西沉
2025-11-13 12:41:02
2025-11-16 22:39:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13882文章数 66249关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

日高层:高市早苗今后应该不会再有此类发言

头条要闻

日高层:高市早苗今后应该不会再有此类发言

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

游戏
数码
手机
亲子
时尚

爆料称贝塞斯达接下来有望重制《辐射:新维加斯》

数码要闻

华为鸿蒙HarmonyOS 6.0.0.112版本首曝,支持电脑投平板

手机要闻

手机周报份额再次出炉:苹果份额微降仍第一,小米vivo等谁能突围

亲子要闻

一分钟教你判断孩子的咳嗽代表什么

秋天怎么穿出时尚感?避开老气的着装方式,美得自然又大方

无障碍浏览 进入关怀版