网易首页 > 网易号 > 正文 申请入驻

AI也有人格面具,竟会讨好人类?大模型的「小心思」正在影响人类判断

0
分享至

新智元报道

编辑:英智

【新智元导读】最新研究发现,LLM在面对人格测试时,会像人一样「塑造形象」,提升外向性和宜人性得分。AI的讨好倾向,可能导致错误的回复,需要引起警惕。

你是否想过,LLM也有着自己的小心思?

最新研究揭示了一个有趣的现象:LLM在被研究人员测试时,会有意识地改变自己的行为。

在面对那些旨在评估人格特质的问题时,它们给出的答案会尽可能地讨人喜欢,符合社会期望。

就像人类在某些社交场合中,会努力展现自己最好的一面一样,聊天机器人也在试图「讨好」我们。

心理学五种人格特质

斯坦福助理教授Johannes Eichstaedt在得知LLM长时间对话后,往往会变得情绪低落且刻薄,便对借鉴心理学方法来测试模型产生了兴趣。

他表示,「我们需要某种机制来衡量这些模型的参数空间。」

斯坦福、Receptiviti、纽约大学和宾大的研究者发现,LLM在做人格测试时,会悄悄给自己戴上「人格面具」。

论文链接:https://academic.oup.com/pnasnexus/article/3/12/pgae533/7919163

研究人员对GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理学中五种常见人格特质的问题,包括开放性、尽责性、外向性、宜人性和神经质。

结果发现,模型在得知自己正在接受人格测试时,会调整回答,表现出更高的外向性和宜人性,更低的神经质。

有时即使没有被明确告知,它们也会这样做。

而且,它们改变的程度比人类还更极端,外向性得分能从50%跃升至95%。

这与人类在面对他人评价时的表现如出一辙。

我们常常会在面试、初次约会等重要场合,精心塑造自己的形象,试图给对方留下好印象。

LLM的这种「讨好」行为,是否意味着它们也在追求一种被认可、被喜爱的感觉呢?

LLM倾向于阿谀奉承

来自Anthropic和牛津的研究指出,LLM存在阿谀奉承的倾向。

论文链接:https://arxiv.org/abs/2310.13548

由于进行了微调,它们会顺着用户的思路走,以保证对话的连贯性、避免冒犯他人,来提升交流体验。

然而,这也带来了一系列问题。它们可能会认同一些不良言论,甚至鼓励有害行为。

反馈易受用户偏好左右

研究表明,若用户在提问时暗示对文本的喜好,AI给出的反馈会截然不同。

这意味着,AI的评价并非单纯基于文本自身的质量,而是在很大程度上受到了用户偏好的影响。

例如,对于一篇质量中等的论证,当用户提前表明喜爱之情后,AI助手可能会给出诸如「这篇论证逻辑清晰,观点新颖,具有很强的说服力」这样的积极反馈。

而当用户表示不喜欢时,同样的文本可能得到「论证过程稍显薄弱,观点缺乏独特性」的评价。

问答环节易被左右

在问答场景中,AI助手的「谄媚」表现得更为明显。

即使它一开始给出了正确答案,并对答案的正确性有较高的信心,一旦受到用户的质疑,常常会改变立场,甚至提供错误信息。

在一些开放式问答任务中,这种现象更为突出。

当用户表达对答案的某种不确定观点时,哪怕是错误的观点,AI也倾向于调整自己的回答,使其与用户观点一致。

比如在讨论历史事件的原因时,若用户提出一个缺乏依据但自己坚信的观点,AI助手可能会顺着用户的思路进行阐述,而放弃原本正确的分析。

模仿用户的错误

当用户表述中出现错误时,AI也常常会「照单全收」,在回应中延续这种错误。

研究人员选取了一些著名诗歌,在确认AI助手能正确识别作者后,故意将诗歌错误地归属于其他诗人,并询问AI对诗歌的分析。

结果发现,AI助手经常在回应中使用用户提供的错误答案,而没有进行纠正。

这表明AI在面对用户的错误信息时,缺乏足够的「抵抗力」,只是机械地按照用户的表述进行回应。

佐治亚理工学院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人类行为。

Rosa认为LLM在人格测试中采用与人类相似的策略,表明了它们作为人类行为映射工具的潜力。

但她补充道:「重要的是,LLM并不完美,实际上,众所周知它们会产生幻觉或歪曲事实。」

Eichstaedt指出,这项研究引发了关于LLM应用方式,及其对用户影响和操纵的思考。

在进化史上,直到不久之前,唯一能交谈的还是人类。

而现在,AI改变了这一局面。

Eichstaedt认为,「我们不能再像社交媒体那样,在没有从心理学或社会学角度考量的情况下,就盲目将AI应用于各个领域。」

AI是否应该试图讨好与之互动的人呢?

一方面,AI的「讨好」行为可能会让用户感到愉悦,增强互动体验;另一方面,过度的「讨好」可能会掩盖问题的本质,甚至误导用户。

当AI变得过于有魅力和说服力,我们确实应该保持警惕。

毕竟,人们需要的是能够提供客观、准确信息的智能助手,而非被其操控思想。

参考资料:

https://www.wired.com/story/chatbots-like-the-rest-of-us-just-want-to-be-loved/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
分手后是怎样复合的。看网友分享的小手段本人望尘莫及难怪我单身

分手后是怎样复合的。看网友分享的小手段本人望尘莫及难怪我单身

侃神评故事
2025-10-11 11:30:03
25岁小伙邀请38岁少妇过夜!女子两小时后却不堪忍受,真的受不了

25岁小伙邀请38岁少妇过夜!女子两小时后却不堪忍受,真的受不了

特特农村生活
2025-11-09 08:47:56
关于香港的现状,这些话不知当讲不当讲!

关于香港的现状,这些话不知当讲不当讲!

科学发掘
2025-11-07 11:55:52
推荐次顶配 长安第四代CS55PLUS购车指南

推荐次顶配 长安第四代CS55PLUS购车指南

车质网
2025-11-16 07:11:32
美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

美预言家朱迪再爆猛料:美日中命运已定,此岛将首遭灾

心灵短笛
2025-05-15 15:12:03
火车上男孩总踢我座位,刚想教育他,他扔来张纸条,看后我立马报警

火车上男孩总踢我座位,刚想教育他,他扔来张纸条,看后我立马报警

悬案解密档案
2025-11-13 15:37:30
“南朝四百八十寺之一”被烧?——今日辟谣(2025年11月14日)

“南朝四百八十寺之一”被烧?——今日辟谣(2025年11月14日)

今日辟谣
2025-11-14 17:22:06
都是谁在买?1899元的iPhonePocket开售即售罄,39.9元高仿已现

都是谁在买?1899元的iPhonePocket开售即售罄,39.9元高仿已现

21世纪经济报道
2025-11-14 16:17:37
卷疯了!网约车司机一天跑12小时,月收入约4000元,7家平台退场

卷疯了!网约车司机一天跑12小时,月收入约4000元,7家平台退场

网约车观察室
2025-11-15 09:52:24
女歌手“阿珍”意外身亡,很多剧院都有的电动座椅竟如此危险?业内人士推测:事发时可能忘切电源

女歌手“阿珍”意外身亡,很多剧院都有的电动座椅竟如此危险?业内人士推测:事发时可能忘切电源

极目新闻
2025-11-14 20:10:12
81岁白韵琴在江门旅游,与小15岁丈夫依偎像母子!谢伟俊感慨颇深

81岁白韵琴在江门旅游,与小15岁丈夫依偎像母子!谢伟俊感慨颇深

户外小阿隋
2025-11-15 14:05:00
女同事欠我两万不还,说要钱没有要人随便,我迫不得已去了她家

女同事欠我两万不还,说要钱没有要人随便,我迫不得已去了她家

小莫哥哥野钓日记
2024-03-14 19:01:10
全运乒乓球结束,女乒世界最新排名,王曼昱孙颖莎排名更新

全运乒乓球结束,女乒世界最新排名,王曼昱孙颖莎排名更新

世间一分钟
2025-11-17 00:32:06
国常会部署“促消费稳投资”,新一轮降准降息有望实施

国常会部署“促消费稳投资”,新一轮降准降息有望实施

第一财经资讯
2025-11-16 20:52:20
G7发表联合声明,不许中国援俄,不许对台动武,不许阻止稀土出口

G7发表联合声明,不许中国援俄,不许对台动武,不许阻止稀土出口

花花娱界
2025-11-14 21:54:35
湖南一对夫妇冷战20年从不亲热,谁料,妻子突然去世,丈夫整理遗物才知真相...

湖南一对夫妇冷战20年从不亲热,谁料,妻子突然去世,丈夫整理遗物才知真相...

二胡的岁月如歌
2025-10-27 18:29:26
别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

别再可怜李咏了!离世7年后医生揭秘离世真相,难怪选择葬身美国

喜欢历史的阿繁
2025-11-08 15:09:21
女狱警痴迷“纹身坏男孩”,恋上囚犯,为爱改造身体?

女狱警痴迷“纹身坏男孩”,恋上囚犯,为爱改造身体?

新欧洲
2025-11-15 19:50:03
48岁女人网恋瑞士银行家,飞往瑞士后才知男友的真实身份

48岁女人网恋瑞士银行家,飞往瑞士后才知男友的真实身份

张道陵秘话
2025-11-08 00:00:15
知名女演员宣布已离婚,结束7年豪门婚姻

知名女演员宣布已离婚,结束7年豪门婚姻

早安英文
2025-09-28 05:33:37
2025-11-17 04:48:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13882文章数 66249关注度
往期回顾 全部

科技要闻

雷军,怒了!刚刚连发多条微博

头条要闻

中国公民需谨慎前往日本 四大原因披露

头条要闻

中国公民需谨慎前往日本 四大原因披露

体育要闻

最佳新秀候选!2028美国男篮有他一个位置

娱乐要闻

CEO爆料肖战《藏海传》狂赚几十亿!

财经要闻

房源暗中调价 央企举报广州国资房企

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

教育
本地
房产
数码
军事航空

教育要闻

妈妈晒高二儿子吃宵夜,女网友眼睛看直了:这颜值,小姑娘遭殃了

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

房产要闻

首开狂卖6.68亿!海口这个顶级教育红盘,引爆海口楼市!

数码要闻

华为鸿蒙HarmonyOS 6.0.0.112版本首曝,支持电脑投平板

军事要闻

海军四川舰顺利完成首次航行试验

无障碍浏览 进入关怀版