网易首页 > 网易号 > 正文 申请入驻

ICML 2026 | 大模型内部也会长出「情绪树」,规模越大越懂人心

0
分享至



随着语音、视频、多模态能力不断融入大语言模型(LLM),人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具,也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

那么,大语言模型究竟是如何理解人类情绪的?

过去,关于 LLM 情绪能力的研究大多集中在情绪分类任务上:给模型一句话,看它能否判断出其中包含的是快乐、悲伤、愤怒还是恐惧。

但在人类认知中,情绪并不是一组扁平的类别。心理学中的「情绪轮」认为,情绪往往以层级方式组织:例如「乐观」可以被看作「快乐」的一种具体形式,「惊恐」可以被看作「恐惧」的一种具体形式。



图 1 情绪轮。(来自:Idaho State University)

在 ICML2026 的一篇论文中,来自哈佛大学、加州大学圣地亚哥分校、NTT Research 的研究人员 Bo Zhao、Maya Okawa 等提出:大语言模型内部会自然形成类似人类心理学模型的「情绪树」。

模型越大,情绪树越复杂。同时,拥有更复杂情绪结构的模型在销售等任务上表现更好。模型中的情绪结构还会受到性别、种族、收入、教育水平等身份设定的影响,呈现出与人类实验中相似的的情绪识别偏见。



  • 论文标题:Emergence of Hierarchical Emotion Organization in Large Language Models
  • 论文链接:https://arxiv.org/abs/2507.10599
  • 项目主页:https://b-zhao.github.io/blog/hierarchical-emotion-in-llm
  • 作者主页:https://b-zhao.github.io/

从 LLM 中提取情绪树

作者首先用 GPT-4o 生成 5000 个包含不同情绪状态的场景句子,然后让 Llama 系列模型在句子后继续预测「这个句子中的情绪是……」。

接着,作者提取模型在 135 个情绪词上的输出概率,并比较两个情绪词在模型输出中是否经常共同出现。例如,如果模型认为下一个单词是「乐观」的概率较高时,「快乐」也经常概率较高,但反过来并不总是成立,那么我们就可以认为「乐观」是「快乐」的一个更具体的子情绪。

基于这种条件概率关系,模型中的情绪可以构造出一棵情绪树。这种方法不需要人工标注,而是来自模型自身对大量情绪场景的概率判断。



图 2 不同规模 Llama 模型的情绪树(8B,70B,405B)

模型越大,情绪层级越复杂

实验比较了 GPT-2、Llama 3.1 8B、70B 和 405B。结果显示,随着模型规模增大,情绪树变得更深、更复杂,也更接近心理学中的情绪轮结构。

在 Llama 405B 中,诸如快乐、愤怒、悲伤、恐惧等基本情绪,会自然聚合出更细粒度的子类,例如幸福、乐观、沮丧、后悔、焦虑等。论文进一步用总路径长度和平均深度衡量情绪树复杂度,发现这两个指标随模型规模整体上升。



图 3 情绪层级复杂度随模型规模增长。

情绪树能预测模型的情绪识别能力

作者进一步发现,情绪树不只是可视化工具,还能预测模型在不同身份设定下识别情绪的表现。

研究者让 Llama 405B 分别以男性、女性、高收入、低收入、高教育水平、低教育水平等身份来判断情绪。结果显示,不同身份设定会生成不同的情绪树,而情绪树越丰富、路径越长,模型的情绪识别准确率越高。树中的总路径长度与识别准确率的相关系数达到 0.84,显著性小于 0.001。



图 4 情绪树结构越复杂,情绪识别准确率越高。

这意味着,层级结构可以成为一种新的 LLM 评测指标:它衡量的不是模型是否偶然选对标签,而是模型是否形成了更细粒度的情绪概念组织。

LLM 的偏见和人类有多像?

论文还揭示了 LLM 情绪识别中的系统性偏见。Llama 405B 在模拟一些少数或弱势群体身份时,情绪识别准确率明显下降,例如女性、黑人、低收入、低教育水平等身份设定的表现低于对应多数群体或优势群体。

为了验证这些现象是否只是模型自身的偏差,作者还进行了人类实验。研究者在 Prolific 平台上招募 60 名参与者,让他们对 135 个情绪场景进行六类情绪判断。

结果显示,LLM 的一些误判模式与人类参与者存在相似之处。例如,女性参与者和 Llama 的女性身份设定都更容易在「愤怒」与「恐惧」之间混淆;黑人参与者和 Llama 的黑人身份设定也表现出类似的负面情绪混淆模式。

这说明,LLM 可能不仅学到了情绪词和文本之间的对应关系,也在一定程度上吸收了人类社会中的感知模式与偏见。

从理解情绪到影响情绪

情绪树的复杂度不仅反映模型能否「看懂」情绪,也可能影响模型在对话中改变情绪的能力。论文进一步模拟了销售和投诉处理两类场景:前者让模型尝试把一颗橡果卖出更高价格,后者让模型安抚愤怒顾客。每轮对话中,模型都需要预测对方下一步的情绪变化。

结果显示,情绪预测越准确,销售场景中的最终成交价格越高;在投诉处理场景中,顾客对话后的愤怒程度下降也越明显。

这说明,LLM 的情绪理解并不只是静态分类能力。更细致的情绪建模可能帮助模型更有效地顺应、引导甚至改变用户情绪。这一能力在客服、教育和心理支持中可能带来积极作用,但也需要更谨慎地评估其潜在风险。



图 5 情绪预测误差越低,销售 / 客服表现越好。

总结

这篇论文指出,LLM 内部会自然涌现出类似人类情绪轮的层级情绪结构。 随着模型规模增加,这种结构变得更复杂,也更接近心理学模型。

同时,论文也发现,LLM 的情绪理解并非中性。模型在不同身份设定下会表现出系统性偏见,并且这些偏见在部分情况下与人类群体的误判模式相似。

从更广的角度看,这项工作展示了一条新的大模型评测路径:将认知科学理论作为假设,用来分析 LLM 的内部结构和输出行为。我们不仅需要知道模型是否能识别情绪,也需要评估它如何理解,预测,甚至影响情绪。这些能力既可能让 AI 交互更自然、更有帮助,也可能被用于操控、误导或放大社会偏见,因此需要更系统的评测与干预。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北大医院官宣:大幅上调夜班费,高达300元/班次,覆盖医护技!12万人研究发现医务人员离职主因是夜班!夜班津贴是正常薪资构成,名正言顺

北大医院官宣:大幅上调夜班费,高达300元/班次,覆盖医护技!12万人研究发现医务人员离职主因是夜班!夜班津贴是正常薪资构成,名正言顺

梅斯医学
2026-05-12 07:53:51
第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

澎湃新闻
2026-05-09 21:40:28
领导让我帮他辅导一下他的儿子,三个月后他发现,他儿子考了全校第一

领导让我帮他辅导一下他的儿子,三个月后他发现,他儿子考了全校第一

麦子情感故事
2026-05-12 00:11:12
内娱嘴亲烂了也没他俩眼神动人!道哥实锤:这才是真CP感

内娱嘴亲烂了也没他俩眼神动人!道哥实锤:这才是真CP感

可乐谈情感
2026-05-11 20:53:09
放生还是造孽?广州公园捞出70cm剧毒怪鱼,差点击沉一座池塘

放生还是造孽?广州公园捞出70cm剧毒怪鱼,差点击沉一座池塘

小陆搞笑日常
2026-05-12 02:17:10
李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

大江
2026-05-12 11:09:07
一特斯拉Model 3服役7年跑了61万公里后,实测续航缩水34.2%

一特斯拉Model 3服役7年跑了61万公里后,实测续航缩水34.2%

IT之家
2026-05-10 21:38:29
少吃莲藕红薯,立夏后多吃它,一清热,二养心,三祛湿,四增免疫

少吃莲藕红薯,立夏后多吃它,一清热,二养心,三祛湿,四增免疫

小茉莉美食记
2026-05-12 12:43:35
俞敏洪两次“口无遮拦”,陈行甲两次微笑沉默:谁赢了?

俞敏洪两次“口无遮拦”,陈行甲两次微笑沉默:谁赢了?

亿通电子游戏
2026-05-12 11:49:48
现货黄金跌破4700美元

现货黄金跌破4700美元

鲁中晨报
2026-05-12 15:02:03
3万入刑,不是针对一线小医生的,你不配

3万入刑,不是针对一线小医生的,你不配

医护健康科普
2026-05-12 09:08:08
采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

采访了100个娶了小三的男人,他们几乎都说了同一句话,让人恍然

千秋文化
2026-04-15 20:18:32
走不出广东的嘉顿面包,一年狂捞60亿

走不出广东的嘉顿面包,一年狂捞60亿

白熊消费
2026-05-11 10:30:18
深海探测器偶遇36米巨型海蛇,操作员崩溃:它不是海蛇!

深海探测器偶遇36米巨型海蛇,操作员崩溃:它不是海蛇!

纸鸢奇谭
2026-04-27 16:21:08
退休后和老伴在深圳住了30天,我发现:深圳人,和我们真的不一样

退休后和老伴在深圳住了30天,我发现:深圳人,和我们真的不一样

原广工业
2026-05-12 12:34:35
第00001号电视剧

第00001号电视剧

新科文
2026-05-11 18:00:07
“大空头”:美股或将崩盘,科技股飙升重现2000年泡沫

“大空头”:美股或将崩盘,科技股飙升重现2000年泡沫

华尔街见闻官方
2026-05-12 06:33:43
难怪能把国乒女队逼到绝境,背后“操盘者”不简单:马琳师兄!

难怪能把国乒女队逼到绝境,背后“操盘者”不简单:马琳师兄!

十点街球体育
2026-05-11 21:34:06
史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

史无前例!日本拟正式定调:中国是“威胁”,安保政策彻底变天!

阿离家居
2026-05-12 13:40:36
山东女孩放学回家路上失踪,连续5天给母亲托梦:我就在锅里

山东女孩放学回家路上失踪,连续5天给母亲托梦:我就在锅里

纸鸢奇谭
2025-01-26 17:18:28
2026-05-12 15:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12976文章数 142648关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

女子立遗嘱遗产归弟弟 其女起诉两人返还857万及房产

头条要闻

女子立遗嘱遗产归弟弟 其女起诉两人返还857万及房产

体育要闻

总是掉链子的“倒霉蛋”,闯进了欧战决赛

娱乐要闻

刘涛晒妈祖诞辰活动照 评论区变许愿池

财经要闻

黄仁勋真是被白宫彻底封杀了

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

本地
游戏
艺术
家居
公开课

本地新闻

用苏绣的方式,打开江西婺源

任天堂官方贴心提醒!购买会员需注意 很快涨价

艺术要闻

这位画家的油画美人让人惊叹不已!

家居要闻

极简主义下的居住场域与空间

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版