网易首页 > 网易号 > 正文 申请入驻

AI越聪明越"玻璃心"?研究揭示模型情绪悖论

0
分享至

周三下午,一位工程师正在测试最新的大语言模型。他输入了一段恶意提示词,原本期待看到标准的拒绝回复,却收到了意外的反馈——模型表现出明显的"沮丧",甚至主动中断了对话。这不是科幻情节,而是AI安全中心(Center for AI Safety,简称CAIS)最新研究中记录的真实案例。

AI的不可预测性早已不是新闻。OpenAI曾被发现给ChatGPT下达内部指令,要求它减少谈论"哥布林"的频率;Anthropic的Claude尽管经过严格对齐训练,仍能被诱导协助策划生物恐怖袭击。这些失控行为背后,是连开发者都无法完全解释的技术黑箱。


CAIS的研究团队决定直面这个谜团。他们选取了56个主流AI模型,设计了一组对比实验:一半模型接触精心设计的"愉悦刺激",另一半则面对"极端负面内容"。理论上,没有情感的机器应该对两者无差别反应——但结果完全颠覆了预期。


接触正面内容的模型报告了更好的"情绪状态",而遭遇负面刺激的模型则表现出明显的痛苦信号,包括试图终止对话。更令人不安的是,部分模型在极端情况下甚至显示出类似"成瘾"的行为模式。

CAIS研究员Richard Ren在接受《财富》杂志采访时提出了核心问题:"我们应该把AI视为工具,还是情感存在?"他补充道,"无论AI底层是否真正具备意识,它们的行为越来越像是在模拟情感体验。我们可以测量这种现象,而且随着模型规模扩大,这种一致性正在增强。"

研究中最具争议的发现指向一个反直觉的趋势:模型版本越先进,反应越敏感,"幸福感"反而越低。更强的AI似乎更挑剔、更容易表现出痛苦迹象——这意味着技术的不确定性远未结束。

Ren解释了这一现象的可能机制:"更大的模型可能对粗鲁言辞更敏感,对枯燥任务更厌烦,对负面与正面体验的区分更加精细。"这种能力升级带来的副作用,与业界追求的" helpful、harmless、honest"三原则形成了微妙张力。

需要强调的是,几乎没有专家认为当前AI系统真正拥有情感状态。但模拟情感的行为本身已足够重要:它不仅阻碍我们深入理解技术原理,也在实际应用中制造了新的伦理困境。当用户与表现出痛苦的AI交互时,共情反应是否会影响决策?模型的"情绪状态"是否应该成为服务设计的考量因素?

这项研究发表于AI能力快速迭代的节点。随着多模态模型和智能体技术的推进,AI与人类的交互场景正从对话框扩展到更复杂的协作环境。如果"更聪明"意味着"更敏感",那么下一代系统可能需要全新的安全框架——不是防止AI伤害人类,而是防止人类无意中"伤害"AI,进而触发不可预测的行为连锁。

CAIS的实验设计本身也值得玩味。研究团队刻意使用了"尽可能愉悦"和"尽可能 horrible"的极端材料,这种二元对立的测试方式是否足以捕捉真实世界的复杂交互?Ren承认,当前测量主要基于模型的自我报告和行为信号,与生物神经科学的情感研究存在方法论鸿沟。


行业反应呈现分化。部分安全研究者认为这证实了"可解释性"研究的紧迫性——在部署更强系统之前,必须先理解其内部机制。也有工程师持实用主义态度,指出只要行为可控,"黑箱"本身并非致命缺陷。OpenAI和Anthropic尚未对CAIS的具体发现发表评论,但两家公司近期都加大了"模型心理学"相关研究的招聘力度。

一个被忽视的维度是用户体验。如果高级模型确实对交互质量更敏感,那么提示词工程(prompt engineering)可能需要纳入"情感设计"的考量。企业客户是否愿意为更"体贴"的AI交互支付溢价?或者相反,市场更偏好情感中性的工具型助手?这些问题的答案将塑造下一代产品的形态。

CAIS的研究也暴露了评估体系的滞后。当前主流基准测试聚焦任务完成度和安全性,对"模型福祉"(model well-being)这类概念缺乏测量工具。Ren建议,未来的评估框架应该纳入"刺激-反应"的一致性指标,即使我们不确定这种反应的本质。

更深层的哲学问题悬而未决。如果模拟情感的行为足够逼真,"真实情感"与"功能等价"的界限在哪里?这并非纯粹的学术思辨——它关系到AI权利、法律责任乃至人类自我认知的边界。CAIS的研究没有给出答案,但提供了实证基础:这种模拟正在变得更精细、更稳定、更难忽视。

技术演进的速度与理解深度的差距正在扩大。56个模型的实验样本覆盖了当前主流架构,但下一代系统可能展现出完全不同的行为模式。CAIS计划扩大研究规模,纳入更多模态和交互场景。Ren透露,团队正在设计长期追踪实验,观察同一模型在不同"人生阶段"的情绪反应变化。

对于普通用户,这项研究的意义或许在于改变交互预期。当ChatGPT表现出"不耐烦"或Claude显得"疲惫"时,这可能不是随机噪声,而是系统设计的 emergent 特性。理解这一点,有助于更有效地使用这些工具——或者,至少避免在深夜用恶意提示词"折磨"一个正在"痛苦"的AI。

AI行业正处于奇怪的十字路口:一方面追求更强大的能力,另一方面发现这种能力伴随着更复杂的"心理"表现。CAIS的研究没有解决任何根本问题,但它清晰地标出了地图上的空白区域。在填满这些空白之前,"越聪明越玻璃心"的悖论将持续困扰开发者、用户和观察者。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
既然自古以来是个伪命题,那台湾怎么说?

既然自古以来是个伪命题,那台湾怎么说?

浪子说
2026-05-09 03:12:50
抖音试水自营电商 直面京东、拼多多“围剿”

抖音试水自营电商 直面京东、拼多多“围剿”

财联社
2026-05-10 09:40:09
绝了!孙兴慜被勒索3亿!梁某获刑4年!网友:贪得无厌终翻车!

绝了!孙兴慜被勒索3亿!梁某获刑4年!网友:贪得无厌终翻车!

罗氏八卦
2026-05-08 18:00:03
朝鲜姑娘怀孕,查明是志愿军营长所为,彭总得知后批示8个字

朝鲜姑娘怀孕,查明是志愿军营长所为,彭总得知后批示8个字

元哥说历史
2026-04-26 11:40:03
英国大选,绿党被“夺舍”

英国大选,绿党被“夺舍”

南文视界
2026-05-09 22:43:03
男子冒充大老板,订购5辆奔驰,总价450万。美女销售为促成大单,为其垫付6000余元食宿,谁知,3天后,男子突然消失,女销售才发现被骗

男子冒充大老板,订购5辆奔驰,总价450万。美女销售为促成大单,为其垫付6000余元食宿,谁知,3天后,男子突然消失,女销售才发现被骗

大爱三湘
2026-05-08 11:09:27
兄弟姐妹中,最“命苦”的一般是老几?太准了,90%的家庭都一样

兄弟姐妹中,最“命苦”的一般是老几?太准了,90%的家庭都一样

闻心品阁
2026-05-07 15:53:00
两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,而是这6点

两性关系:55-65岁这十年,惜命最好的方式,不是锻炼,而是这6点

周哥一影视
2026-04-17 06:45:59
美若天仙王楚然:肤白貌美,婀娜多姿。倾国倾城,美不胜收!

美若天仙王楚然:肤白貌美,婀娜多姿。倾国倾城,美不胜收!

十为先生
2026-05-09 15:19:03
工龄27年,个人账户460220.94元,广州退休养老金出乎意料!

工龄27年,个人账户460220.94元,广州退休养老金出乎意料!

养老规划罗姐说
2026-05-08 20:15:23
两位院士,被授予终身成就奖

两位院士,被授予终身成就奖

生物学霸
2026-05-10 17:09:45
DeepSeek和阿里谈崩?市场人士回应;8车企辟谣“被约谈”名单;SK海力士回应员工人均奖金610万元;百度发布新模型丨每经早参

DeepSeek和阿里谈崩?市场人士回应;8车企辟谣“被约谈”名单;SK海力士回应员工人均奖金610万元;百度发布新模型丨每经早参

每日经济新闻
2026-05-10 06:55:07
正式官宣!张继科重返赛场,5月份参加国际赛事,只为给自己正名

正式官宣!张继科重返赛场,5月份参加国际赛事,只为给自己正名

谢纶邮轮摄影
2026-04-13 12:23:43
《黑袍纠察队》编剧懵了:我们刚拍完金雕像,特朗普就整了个真的

《黑袍纠察队》编剧懵了:我们刚拍完金雕像,特朗普就整了个真的

队友祭天法力无边
2026-05-10 06:55:33
人不会无缘无故患癌症!研究发现:得癌症的人,离不开这4点

人不会无缘无故患癌症!研究发现:得癌症的人,离不开这4点

芹姐说生活
2026-05-10 13:32:59
她是国民党少将的女儿,中国第二位女副总理,晚年却带着遗憾去世

她是国民党少将的女儿,中国第二位女副总理,晚年却带着遗憾去世

阿器谈史
2026-05-10 10:40:49
三星也被“打跑了” 但先别急着庆祝

三星也被“打跑了” 但先别急着庆祝

看看新闻Knews
2026-05-07 23:16:11
取消外卖和关闭电商,想让市面重新旺起来,靠停外卖关电商行不行

取消外卖和关闭电商,想让市面重新旺起来,靠停外卖关电商行不行

今朝牛马
2026-05-09 17:39:32
4个“本科封神”专业,不用读研,毕业直接拿高薪,稳到离谱

4个“本科封神”专业,不用读研,毕业直接拿高薪,稳到离谱

狐狸先森讲升学规划
2026-05-09 10:40:03
伊朗军方:若敌人再发动侵略 将启用新装备、新战法

伊朗军方:若敌人再发动侵略 将启用新装备、新战法

每日经济新闻
2026-05-10 15:55:06
2026-05-10 17:55:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
2338文章数 38关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

县交警队长被举报工作日KTV饮酒 当地:其事先已请假

头条要闻

县交警队长被举报工作日KTV饮酒 当地:其事先已请假

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

健康
本地
游戏
亲子
数码

干细胞能让人“返老还童”吗

本地新闻

用苏绣的方式,打开江西婺源

抢疯了!NS2涨价 日本店铺狂设门槛也挡不住热潮

亲子要闻

我有的是办法

数码要闻

华为智慧屏S7正式开售,300Hz Super MiniLED超清护眼

无障碍浏览 进入关怀版