网易首页 > 网易号 > 正文 申请入驻

新研究声称AI“理解”情感胜过人类——尤其在情绪激烈的情境中

0
分享至

一项最新研究发现,常见的人工智能(AI)模型在情商测试中表现优于人类,但专家提醒我们不要只看标题。

科学家们如今提出,AI在理解情感方面比人类做得更好 —— 这似乎是对我们曾认为计算机永远无法超越的人类能力的又一打击。

科学家发现,AI比我们更善于理解情感 —— 在处理各种情绪激烈的情境时,选择正确化解方式的得分远高于普通人。

在发表于《通讯心理学》期刊的一项新研究中,来自日内瓦大学(UNIGE)和伯尔尼大学(UniBE)的科学家们将广泛使用的情商(EI)测试(包括STEM、STEU、GEMOK-Blends、GECo Regulation和GECo Management)应用于常见的大型语言模型(LLMs),包括ChatGPT-4、ChatGPT-o1、Gemini 1.5 Flash、Claude 3.5 Haiku、Copilot 365和DeepSeek V3。

他们研究了两件事:首先,比较AI与人类受试者的表现;其次,评估AI创造符合情商测试目的的新试题的能力。

通过研究过往研究中已验证的人类反应数据,这些大型语言模型在情商测试中基于人类专家的意见选择了“正确”答案的比例达到81%,而人类仅为56%。

当要求ChatGPT创建新的测试题目时,人类评估者认为,这些新题在难度相当、且能让人感知到并非对原题的简单改写方面,达到了原始测试的标准。AI生成的测试与原始测试之间的相关性被描述为“强”,相关系数为0.46(1.0代表完全相关,0代表无相关性)。

研究的总体结论是,AI在“理解”情感方面比我们做得更好。

深层解读

当媒体咨询了多位专家时,他们回应中的一个共同主题是:必须牢牢记住研究方法。他们指出,所采用的每种常见情商测试都是选择题形式 —— 这几乎不适用于现实世界中人际关系紧张度高的复杂情境。

“值得注意的是,人类对于他人感受的判断并非总是一致,即使是心理学家对情绪信号的解读也可能不同,”金融行业及信息安全专家Taimur Ijlal说。“因此,在这种测试上‘击败’人类,并不一定意味着AI有更深层次的洞察力。它只意味着AI更频繁地给出了统计上更常见的答案。”

专家们补充道,该研究所测试的能力并非情商,而是别的能力。“AI系统在模式识别方面非常出色,尤其是当情绪线索遵循可识别的结构时,比如面部表情或语言信号,”为心理健康专业人士打造的AI辅助文档工具CliniScripts的创始人兼首席执行官Nauman Jaffar说。“但将此等同于对人类情感更深层次的‘理解’,可能会夸大AI的实际能力。”

在结构化、量化的测试环境中 —— 而非真正理解情感所需的深层细微差别 —— 才是AI的闪光点。一些专家指出一个关键点:AI在关于情绪情境的测试中表现更好,但这些情境并非人类在当下亲身经历的那种激烈时刻。

Hennessy Digital 创始人兼首席执行官Jason Hennessey(他多年来一直分析搜索和生成式AI系统如何处理语言)将这项研究比作“眼神读心测试”(Reading the Mind in the Eyes Test)。这是一种评估受试者情绪状态的常用工具,AI在此类测试中已显示出潜力。但正如Hennessey所说,当测试中像照片光线或文化背景这样常规的变量发生变化时,“AI的准确性就会断崖式下跌。”

总体而言,大多数专家认为,声称AI比人类更“理解”情感的说法有些言过其实。

“它是否表明大型语言模型在归类常见情绪反应方面很有用?”西北IT咨询公司(Northwest IT Consulting)创始人Wyatt Mayham说。“当然。但这就像说某人在一个情感主题的BuzzFeed网络测试中得了高分,就说他是个优秀的治疗师一样。”

但最后还有一个值得注意的案例

有证据表明,即使AI使用的是模式识别而非真正的情感理解,但至少在一个实例中,它在识别和响应情绪状态方面已超越人类。

在巴西,有超过6000名长途卡车司机使用的对话式AI助手Aílton,就是一个多模态WhatsApp助手,它使用语音、文字和图像进行交互。其开发者、HAL-AI的首席执行官兼首席科学家Marcos Alves表示,Aílton识别压力、愤怒或悲伤的准确率约为80% —— 比其人类同行高出约20个百分点,而且这一切都是在司机实时与其互动的真实情绪情境中完成的。

在一个案例中,一名司机在同事发生致命车祸后发送了一条语无伦次的15秒语音信息,Aílton迅速做出了恰当回应:表达了细致的哀悼、提供了心理健康资源并自动通知了车队经理。Alves说:“是的,选择题式的文字小测验简化了情绪识别。真正的共情是连续且多模态的。但分离出认知层面是有用的。它能揭示大型语言模型在加入情境噪音之前是否能识别出情绪线索。”

他补充道,大型语言模型能够吸收数十亿句子和数千小时的对话音频,这意味着它可以编码人类常常遗漏的细微语调线索。他在谈到该研究时说:“实验室环境是有限的,但我们的WhatsApp数据证实,现代大型语言模型在检测和响应方面已经比大多数人做得更好,提供了可规模化的共情能力(offering scalable empathy at scale)。”

如果朋友们喜欢,敬请关注“知新了了”!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
凡尔赛啊!山东一家长称孩子高考687分省排140名,哭诉清北上不了

凡尔赛啊!山东一家长称孩子高考687分省排140名,哭诉清北上不了

呼呼历史论
2026-06-29 03:12:19
为什么胡锡进对电影的喜好,总是跟人民群众不一样?

为什么胡锡进对电影的喜好,总是跟人民群众不一样?

斯嘉丽聊电影
2026-06-28 23:22:12
北京一位空姐嫁给了打工仔,婚后一年,她才得知丈夫真实身份

北京一位空姐嫁给了打工仔,婚后一年,她才得知丈夫真实身份

千秋文化
2026-06-21 19:49:55
37次射门0进球:C罗与梅西世界杯对决梦碎

37次射门0进球:C罗与梅西世界杯对决梦碎

星河漫山野
2026-06-29 01:12:04
比特币跌至21个月冰点,市场陷入极度恐慌

比特币跌至21个月冰点,市场陷入极度恐慌

字节漫游指南
2026-06-28 03:50:50
原来她是李敖遗孀,婚后不上班,丈夫去世后,如今靠遗产安稳生活

原来她是李敖遗孀,婚后不上班,丈夫去世后,如今靠遗产安稳生活

白面书誏
2026-06-28 23:12:57
霸气,勇士队巴特勒谈在字母哥加盟热火后是否重返热火,一字回答

霸气,勇士队巴特勒谈在字母哥加盟热火后是否重返热火,一字回答

好火子
2026-06-29 03:50:08
19球!39岁梅西缔造世界杯百年神迹,连续7场破门刷新多项纪录

19球!39岁梅西缔造世界杯百年神迹,连续7场破门刷新多项纪录

体坛老球迷
2026-06-28 12:18:15
刘嘉玲坦言:多次想放弃梁朝伟,他完全没有自理能力,社恐到无语

刘嘉玲坦言:多次想放弃梁朝伟,他完全没有自理能力,社恐到无语

青衫书生本尊
2026-06-26 17:09:21
世界杯加纳疑似放水坑韩国,戏剧性一夜引球迷争议

世界杯加纳疑似放水坑韩国,戏剧性一夜引球迷争议

领悟看世界
2026-06-28 11:17:26
白玉兰最佳男配董勇:主动出击,争来《太平年》里的冯道

白玉兰最佳男配董勇:主动出击,争来《太平年》里的冯道

老吴教育课堂
2026-06-28 13:37:43
高考数学唯一满分男生被清华录取,网友担心他去美国,答案很现实

高考数学唯一满分男生被清华录取,网友担心他去美国,答案很现实

娱乐E君
2026-06-26 18:07:56
人大代表:建议将机关企事业单位工龄满30年的带薪年假延长到20天

人大代表:建议将机关企事业单位工龄满30年的带薪年假延长到20天

职场资深秘书
2026-06-28 18:27:55
李玟离世三年后,主诊医生被起诉,死因曝光,家人:终于等到正义

李玟离世三年后,主诊医生被起诉,死因曝光,家人:终于等到正义

余鴡搞笑段子
2026-06-28 17:42:46
新款 iPad mini,史诗级升级来了!

新款 iPad mini,史诗级升级来了!

花果科技
2026-06-28 21:02:05
正红拼粉运动吊带套装,成熟人妻元气塑形穿搭,饱满身段直观凸显

正红拼粉运动吊带套装,成熟人妻元气塑形穿搭,饱满身段直观凸显

只要高兴就好
2026-06-20 20:39:11
向佐向佑再同框!兄弟俩一起参加线下活动,弟弟最新露脸有变化

向佐向佑再同框!兄弟俩一起参加线下活动,弟弟最新露脸有变化

喜欢历史的阿繁
2026-06-28 21:23:50
双休毁了孩子?深圳高考成绩打脸众人:别再甩锅给学校了!

双休毁了孩子?深圳高考成绩打脸众人:别再甩锅给学校了!

手工制作阿爱
2026-06-28 13:37:43
奔驰的“诚意”我体会到了,7座SUV跌至16.68万,性价比确实高

奔驰的“诚意”我体会到了,7座SUV跌至16.68万,性价比确实高

周哥一影视
2026-06-29 00:10:34
世界杯主帅薪资曝光:安切洛蒂年薪7755万居榜首

世界杯主帅薪资曝光:安切洛蒂年薪7755万居榜首

人类文明之光
2026-06-28 11:23:28
2026-06-29 07:59:00
知新了了
知新了了
专注于新知、科普的传播
6205文章数 2281关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

民办高校被指禁止小米汽车入校 校方回应

头条要闻

民办高校被指禁止小米汽车入校 校方回应

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

教育
房产
时尚
亲子
健康

教育要闻

校长给中层画像:五条硬杠杠

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

夏天裙子不用买多,建议入手一条蓝裙子,清爽高级又耐看

亲子要闻

0-3岁的宝宝可以看这些~

“无糖汤圆”是否隐藏着健康陷阱?

无障碍浏览 进入关怀版