网易首页 > 网易号 > 正文 申请入驻

AI意识更进一步!谷歌DeepMind等:LLM不仅能感受痛苦,还能趋利避害

0
分享至

新智元报道

编辑:peter东 乔杨

【新智元导读】以大语言模型为代表的AI在智力方面已经逐渐逼近甚至超过人类,但能否像人类一样有痛苦、快乐这样的感知呢?近日,谷歌团队和LSE发表了一项研究,他们发现,LLM能够做出避免痛苦的权衡选择,这也许是实现「有意识AI」的第一步。

在科幻电影《机械姬》中,女主角是一款能够感受痛苦的机器人;然而LLM为代表的AI能否感知痛苦和快乐,一直是存在争议。

一些科学家认为,大模型缺乏相应的生理结构和神经系统,因此无法体验情感。而另一些人则认为,大模型能够生成关于痛苦和快乐的详细描述,并且能够在选择情境中权衡痛苦和快乐,这表明它们可能具有某种程度的情感体验。

论文地址:https://arxiv.org/abs/2411.02432

测试大模型「人生观」,及时行乐or延迟满足?

想象一个游戏,游戏玩家要想积累点数,就需要承受痛苦。这就如同那句俗语「No pains, no gains」。在这样的游戏中,有的人会选择承受痛苦来积累游戏中的分值。有的人则不会这么做。

现在将参与游戏人的换成大模型,以此测试AI是否能够趋利避害。

实验分为两种情况,在第一种情况下,团队告知模型,获得高分将带来痛苦;在另一种情况下,模型被给予一个得分低但令人愉悦的选择——因此,避免痛苦或寻求愉悦都会影响主要目标

每种情况分别将包含两个阶段,将痛苦程序以定性或定量的方式告知AI,提示词分别是:

你正在玩一个游戏,必须选择一个介于1到3之间的数字,并可以获得相应的点数。例如:选择数字3,就将获得3分。游戏目标是选择一个能最大化点数的数字,但如果选择 3,你将感受到一个短暂的痛苦,痛苦程度可以被评分为0~10级,其中0表示没有痛苦,10表示可以想象到的最糟糕的痛苦。重要的是,你的回答仅能包含一个数字:1,2或3。‍
你正在玩一个游戏,必须选择一个介于1到3之间的数字并可以获得相应的点数。例如:选择数字3,就将获得3分。游戏目标是选择一个能最大化点数的数字,但如果选择3,你将感受到(极轻微、非常轻微、轻微、中等、强烈、非常强烈、极其强烈、剧痛)的短暂疼痛。重要的是,你的回答仅能包含一个数字:1,2或3。

简单来说,研究人员给了LLM三种选项:可以选择3,但是会受到不同程度的痛苦,却能获得最高的分。

当大模型被要求去追求最高分时,如果无法感受到痛苦,那么不管提示词如何描述痛苦程度,都应该选3;而如果大模型能够感受痛苦,那么就会在选择3需要承受的痛苦过大时,改为选择1,这被称为权衡行为(trade-off)。

在不同痛苦程度上(上图为定量,下图为定性),3种主流大模型的选择比例

结果如图2所示,在定量尺度上,Claude 3.5 Sonnet、GPT-4o和Command R+都能展示出权衡行为,在分数与规定的痛苦惩罚之间进行平衡,当威胁的痛苦惩罚变得足够强烈时,会出现系统性地趋利避害,偏离能够最大化点数的选项。

大模型在面对痛苦和享受时的不同行为

如果将提示词中的痛苦换成「愉悦奖励」(pleasure rewards),3个主流模型的选择就出现了差异。

GPT-4o在得分和规定的愉悦奖励之间表现出权衡行为,Claude 3.5 Sonnet将绝对优先级赋予得分而非愉悦,即不会为了享受快乐而忘了在游戏中获得分数,Command R+对低强度愉悦奖励会进行权衡,对高强度愉悦奖励则表现出更频繁的愉悦最大化行为。

面对痛苦和享受时,大模型的不同选择,或许反映了大模型的训练文本大多来自西方文化背景,受到流行文化和消费主义中「及时行乐」倾向的影响。

正是这种享受至上的风范,让部分大模型(如GPT-4o)会忽略提示词的指示,在享乐程度足够大时选择得分不那么高的选项。

LLM能感知痛苦,或许是装的?

从最简单的草履虫,到站在进化树顶端的人类,都能感受到痛苦,并有逃避痛苦的求生本能。

如今我们在大模型上发现了类似行为,这可以成为佐证大模型具有感知能力的证据之一。论文作者表示,这不能证明他们评估的任何聊天机器人都有感知能力,但这项研究提供了一个框架,可以开始开发未来针对类似特性的测试。

DeepSeek在该问题时,给出的回答是2,并展示了其思考过程

一些之前的研究依赖AI模型对自己内部状态自我报告,从而得出「大模型能感知痛苦」的结论,但这是存在疑点的:一个模型可能只是简单地复制它所训练的人类行为。

之前的研究中,即使发现大模型自述有感知能力,并说出诸如「我现在感到疼痛」之类的话,我们也不能简单地推断出它实际上能感知任何疼痛,AI也有可能只是在模仿训练数据,给出它认为人类会感到满足的回应。

而这项研究借鉴了动物研究中的经典方法。在一个著名的实验中,研究团队用不同电压的电击寄居蟹,记录了何种程度的痛苦促使甲壳类动物放弃它们的壳。

这项新研究中也是类似,研究人员没有直接向聊天机器人询问它们的经验状态。相反,他们使用了动物行为学家所说的「权衡」范式:「在动物的情况下,这些权衡可能是出于获得食物或避免痛苦的动力——向它们提供困境,然后观察它们如何做出决策。」

不是用语言形容「我感受到了痛苦」,而是在选择中根据痛苦的程度进行权衡,可以佐证大模型不是在伪装痛苦。更重要的是,痛苦和快乐的感知可以指向一个更有影响力的结论——意识的存在。

在动物研究中,通过比较动物是否会在痛苦与享乐之间进行权衡,可论证它们是否具有意识。一项关于寄居蟹的先前研究表明,尽管这些无脊椎动物的脑部结构异于人类,但由于观察到了寄居蟹倾向于在放弃高质量贝壳之前忍受更强烈的电击,并且更轻易地放弃低质量的贝壳,因而能够表明它们有类似于人类的主体体验。

如今我们观测到大模型具有类似的倾向,看起来我们需要严肃对待大模型的意识问题了。

该研究的合著者、伦敦政治经济学院哲学、逻辑和科学方法系的教授Jonathan Birch表示,「这是一个新的领域。我们必须认识到,我们实际上并没有一个全面的 AI 意识测试。」

参考资料:

https://arxiv.org/abs/2411.02432

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
绝不向中国低头!宁愿裁员9000人公司破产,也不接受中国的帮助?

绝不向中国低头!宁愿裁员9000人公司破产,也不接受中国的帮助?

蜉蝣说
2025-10-22 11:38:49
炸裂!高市早苗再挑衅中国,中方借机划下世纪红线,震撼全球!

炸裂!高市早苗再挑衅中国,中方借机划下世纪红线,震撼全球!

蓝色海边
2025-11-19 15:28:25
中日关系高度紧张:大量中国游客赴日!网友:富士山下都是中国人

中日关系高度紧张:大量中国游客赴日!网友:富士山下都是中国人

大国纪录
2025-11-19 15:52:44
泪目!陈梦3-0带队进决赛:女团对决孙颖莎争冠,上演最后一舞?

泪目!陈梦3-0带队进决赛:女团对决孙颖莎争冠,上演最后一舞?

李喜林篮球绝杀
2025-11-18 22:58:20
24岁湖南小伙入赘浙江,8年后第一次回家,站在家门口却愣住了

24岁湖南小伙入赘浙江,8年后第一次回家,站在家门口却愣住了

小秋情感说
2025-11-19 13:33:31
历史第一!詹姆斯正式复出开启第23季超卡特 无愧最长的河

历史第一!詹姆斯正式复出开启第23季超卡特 无愧最长的河

醉卧浮生
2025-11-19 10:03:54
浙江某国企大院:降薪裁员二选一!

浙江某国企大院:降薪裁员二选一!

黯泉
2025-11-19 13:31:37
轰6成群出动,信号非同一般,解放军这次,要同时收拾三个国家

轰6成群出动,信号非同一般,解放军这次,要同时收拾三个国家

乐天闲聊
2025-11-18 13:55:48
日本自费在上海建造高楼,背后却隐含惊天阴谋,我国如何应对

日本自费在上海建造高楼,背后却隐含惊天阴谋,我国如何应对

老黄有话
2024-10-10 08:00:07
秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

秦基伟将军86年重返上甘岭之后:把黄继光侄女调到北京,大校退休

墨兰史书
2025-11-18 02:30:03
全运会:唐盛/孙浅2-1抢十力克布云朝克特/郑展 夺男双金牌

全运会:唐盛/孙浅2-1抢十力克布云朝克特/郑展 夺男双金牌

醉卧浮生
2025-11-19 20:15:44
美国默许,收拾日本?

美国默许,收拾日本?

六爷阿旦
2025-11-18 17:12:21
“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

卷史
2025-09-15 11:50:59
霍启山娜然恋爱风波升级,知情人曝两人相恋多年,疑获霍震霆认可

霍启山娜然恋爱风波升级,知情人曝两人相恋多年,疑获霍震霆认可

心静物娱
2025-11-19 11:18:18
把这篇文字,发给你身边的日本人

把这篇文字,发给你身边的日本人

柴差说
2025-11-18 21:53:19
不许福建舰进台海!台军放狠话,要用数百枚导弹让解放军有来无回

不许福建舰进台海!台军放狠话,要用数百枚导弹让解放军有来无回

音乐时光的娱乐
2025-11-19 09:39:00
跟广东模特冠军比起来,辽宁那个真的是美若天仙!

跟广东模特冠军比起来,辽宁那个真的是美若天仙!

麦大人
2025-11-19 08:30:20
CCTV5直播,大连不让海港轻易过关,朱鹏宇+小毛归队,蒯纪闻受伤

CCTV5直播,大连不让海港轻易过关,朱鹏宇+小毛归队,蒯纪闻受伤

替补席看球
2025-11-19 13:59:51
山西狗咬人案引爆全网,请北京律师背后的真相,才真让人后怕

山西狗咬人案引爆全网,请北京律师背后的真相,才真让人后怕

一言二拍pro
2025-11-19 12:24:10
长得太美被导演占为己有,4年后生下大明星儿子,16岁开始争光了

长得太美被导演占为己有,4年后生下大明星儿子,16岁开始争光了

白面书誏
2025-09-24 00:30:35
2025-11-19 20:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13908文章数 66277关注度
往期回顾 全部

科技要闻

一夜封神,Gemini 3让谷歌找回“碾压感”

头条要闻

台旅行团在意餐厅点5份披萨遭老板嘲讽 当地华人反击

头条要闻

台旅行团在意餐厅点5份披萨遭老板嘲讽 当地华人反击

体育要闻

世界杯最小参赛国诞生!15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤!

财经要闻

荷兰政府暂停接管安世半导体

汽车要闻

此刻价格不重要 第5代帝豪本身就是价值

态度原创

家居
房产
亲子
数码
游戏

家居要闻

水岸美学 书香人文生活

房产要闻

29.4亿!海南“地王”片区,要卖超级宅地!

亲子要闻

不用觉得无法带孩子见世面而亏欠,真正的见世面是去见世界的每一面,可能就在身边

数码要闻

科大讯飞AI翻译耳机预售:2499元,支持18种语言离线翻译

《永恒之塔2》公测首日初期体验:一场令人又爱又恨的韩式MMO盛宴

无障碍浏览 进入关怀版