网易首页 > 网易号 > 正文 申请入驻

Trends Cogn Sci: 大脑并非只关注奖励,它其实更在意目标实现

0
分享至

基本信息

Title:The Reward Positivity signals a goal prediction error

发表时间:2026.1.2

Journal:Trends in Cognitive Sciences

影响因子:17.2

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本
  2. 点击页面底部“”即可跳转论文原网页



背景介绍

想象一下,你正在玩一款赛车游戏。当你意外吃掉一枚金币,或是费尽周折终于超过对手时,大脑中会产生一种名为“奖励正波”(Reward Positivity, RewP)的电信号 。长期以来,神经科学界普遍认为 RewP 就像一个“心情晴雨表”,忠实地记录着反馈的好坏,给奖金它就跳动,给惩罚它就收缩 。

然而,这个看似完美的“奖赏计数器”模型正面临挑战。为什么有时候没有金钱奖励,仅凭一句“挑战成功”也能诱发强烈的信号?为什么它在抑郁症患者身上表现得如此特殊?为了拨开云雾,James F. Cavanagh 与 Clay B. Holroyd 在 《Trends in Cognitive Sciences》(TICS) 上发表了最新综述,试图为 RewP 重新定性 。他们认为,我们一直以来可能都“找错了对象”:RewP 追踪的并非感官上的快乐,而是大脑对“目标达成”的精准校准 。

综述框架梳理

为了系统性地重塑这一理论,作者在文中构建了严密的论证路线:

首先,作者回顾了现有的研究共识,并针对“RewP 反映双向奖赏预测误差(RPE)”的传统假设提出了挑战 。

随后,通过分析脑电波形与空间定位,论证了 RewP 是一个独立且叠加在背景信号上的电生理特征 。

接着,作者引入了核心论点:RewP 本质上反映的是“目标更新”而非单纯的奖赏收受 。

最后,将这一信号置于强化学习的“演员-评论员”(Actor-Critic)框架下,探讨了其在认知控制与行为调整中的深层计算逻辑 。

核心观点总结

它是单向的叠加信号,而非双向的刻度尺

作者强调,RewP 并不是在正负反馈之间滑动的连续波形,而是特异性地对“好于预期”的反馈做出反应 。正如作者在图1中展示的,通过单试次相关分析发现,惩罚反馈(RPE-)主要调制背景成分(如 N2/P3)的幅度,而奖励反馈(RPE+)则诱发了一个独立且额外叠加的成分 。这种独立性意味着它拥有独特的计算职能 。



Figure 1. Feedback-locked event-related potentials (ERPs) at the Cz electrode. Fig1通过对比脑电波形,确立了RewP作为一个独立神经信号的地位。作者展示了惩罚反馈(RPE-)主要通过调制大脑已有的背景成分(如N1-P2-N2-P3复合体)的幅度来体现 ,而奖励反馈(RPE+)则诱发了一个额外叠加在背景之上的独立正向成分,即RewP 。单试次相关性分析(图1D)进一步证实,奖励信号在时间进程和空间分布上都与惩罚信号存在显著差异,这有力地反驳了“大脑用同一把刻度尺衡量奖惩”的传统观点 。

源自额叶中部的计算中心 RewP 的产生地在哪里?

作者通过荟萃分析指出,其最明确的来源是背侧前额叶皮层(dmPFC)和前中扣带回(aMCC) 。图2展示了两种生成假设的对比:相较于多个网络共同贡献的“多发生源假设”,作者更倾向于“单发生源假设”,即 dmPFC/aMCC 作为一个汇聚中心,集成了价值更新、代理感和执行功能,最终产出了 RewP 信号 。



Figure 2. Contrasting models of Reward Positivity (RewP) generation. Fig2探讨了RewP在大脑中的解剖学来源,对比了“多发生源”与“单发生源”两种科学假说 。多发生源假设认为,价值更新、显著性探测和执行控制等多个分布式的网络共同贡献了头皮记录到的信号 ;而单发生源假设则认为,虽然多个系统参与计算,但RewP直接产生于额叶中部的一个核心区域: 前中扣带回(aMCC) 。这一模型解释了RewP如何作为一个汇聚中心,将来自不同认知维度的信息整合为统一的目标评价信号 。

它是大脑的“目标达成”探测器

该综述最核心的观点是:RewP 信号由“目标预测误差”驱动,而非“快乐(奖赏)预测误差” 。该结论支撑了图3的核心模型:在赛车游戏比喻中,当玩家的目标从“捡金币”切换为“超越对手”或“追求竞技公平”时,诱发 RewP 的不再是金币,而是任何预示目标实现的抽象信号 。



Figure 3. Reward Positivity (RewP) is a flexible signal of goal achievement. Fig3通过赛车游戏的生动案例,直观地诠释了RewP的灵活性和抽象性。案例显示,当玩家的学习目标从捡金币(物质奖赏)切换到吃宝箱(抽象目标),甚至切换到为了维护兄妹和谐而主动让步(超额目标)时,RewP信号会随着主观目标的转移而重新定位 。这证明了RewP追踪的并非固定的物理奖赏,而是任何被大脑定义为“目标达成”的积极反馈,体现了其在认知控制中的核心作用 。

它是大脑里的“评论员”,而非“执行者”

基于强化学习框架,作者将 RewP 定义为一种“评论员(Critic)”信号 。它负责评估当前状态的价值并更新对未来的期望,却并不直接决定下一步的行动 。这解释了为什么 RewP 往往无法直接预测即时的行为调整,因为它更像是在更新大脑的“内部账本”,为长期的学习奠定基础 。

省流总结

这篇发表于Trends Cogn Sci的综述文章刷新了我们对大脑“奖励正波”(RewP)的本质认知,指出该信号并非单纯记录奖赏收受的“心情晴雨表”,而是一个特异性针对目标达成的“评价器” 。作者论证称,RewP是一个独立且仅对正向预测误差(RPE+)敏感的单向电生理特征,它在功能上更接近强化学习架构中的“评论员”(Critic),主要负责在背侧前额叶皮层(dmPFC)与前中扣带回(aMCC)区域更新关于目标状态的价值估算,而非直接驱动即时的行为调整 。这种机制使得RewP展现出极高的认知灵活性:它追踪的不是固定的物理奖励或感官快乐,而是任何被大脑控制系统定义为“当前目标”的抽象成就,从而将这一信号从基础的反馈处理提升到了高级认知控制的范畴

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本众议院正式解散!美财长当着全球的面,喊出高市最不想听的话

日本众议院正式解散!美财长当着全球的面,喊出高市最不想听的话

书纪文谭
2026-01-24 16:43:26
卡尼号召加拿大人“购买国货”以回应美国关税威胁

卡尼号召加拿大人“购买国货”以回应美国关税威胁

环球网资讯
2026-01-25 06:13:20
菲律宾出现变天征兆,杜特尔特之孙现身中国,老杜在做什么准备?

菲律宾出现变天征兆,杜特尔特之孙现身中国,老杜在做什么准备?

军机Talk
2026-01-24 14:53:04
太意外!美联储,突爆大消息!

太意外!美联储,突爆大消息!

证券时报
2026-01-24 22:16:02
罗永浩,人民日报表扬你了!

罗永浩,人民日报表扬你了!

不主流讲话
2026-01-24 13:59:20
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
上海二手房业主抱团保房价:统一挂牌价1460万,导致带看清零!

上海二手房业主抱团保房价:统一挂牌价1460万,导致带看清零!

黯泉
2026-01-24 21:44:22
联合国通过调查伊朗镇压决议,中国投反对票

联合国通过调查伊朗镇压决议,中国投反对票

桂系007
2026-01-24 19:59:37
中国共产党中央军事委员会副主席张升民简历

中国共产党中央军事委员会副主席张升民简历

上观新闻
2025-10-23 18:17:07
缝“哭哭马”的他找到了!“接到电话还有点不好意思”,老板娘:奖!每年8888元,直到下一个马年

缝“哭哭马”的他找到了!“接到电话还有点不好意思”,老板娘:奖!每年8888元,直到下一个马年

大象新闻
2026-01-24 17:45:16
2-0!20战轰21球,姆巴佩双响,皇马笑傲强强对话,超越巴萨登顶

2-0!20战轰21球,姆巴佩双响,皇马笑傲强强对话,超越巴萨登顶

我的护球最独特
2026-01-25 06:01:31
最不该反的人,反了

最不该反的人,反了

我是历史其实挺有趣
2025-11-22 08:46:10
惨烈!67犯79罚!全员杀红眼家政少杰最硬,7人满分广东双杀山西

惨烈!67犯79罚!全员杀红眼家政少杰最硬,7人满分广东双杀山西

后仰大风车
2026-01-24 22:18:52
被0-4拖累 李昊33次扑救仍无缘金手套奖 安东尼奥:不公+难以置信

被0-4拖累 李昊33次扑救仍无缘金手套奖 安东尼奥:不公+难以置信

我爱英超
2026-01-25 03:30:41
中方发出唁电,美国全国将降半旗,拜登筹划国葬

中方发出唁电,美国全国将降半旗,拜登筹划国葬

趣生活
2026-01-24 09:34:17
大布婚礼DJ亲证:没见过这样的妈!抢新娘风头,还拉儿子跳那种舞

大布婚礼DJ亲证:没见过这样的妈!抢新娘风头,还拉儿子跳那种舞

新欧洲
2026-01-24 21:21:07
美国对中国渗透没白费,扶持的“内鬼”,终于开始在中国露头了

美国对中国渗透没白费,扶持的“内鬼”,终于开始在中国露头了

历史求知所
2025-12-01 11:30:06
平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

平均每人负债1300万,书记吴仁宝去世10年后,华西村的现况如何?

哄动一时啊
2026-01-24 21:29:54
2-3!95分钟压哨绝杀 英超大冷门:10.4亿豪门13场不败惨遭终结

2-3!95分钟压哨绝杀 英超大冷门:10.4亿豪门13场不败惨遭终结

狍子歪解体坛
2026-01-25 03:29:41
央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

蜉蝣说
2026-01-24 12:45:07
2026-01-25 07:55:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
129文章数 10关注度
往期回顾 全部

科技要闻

黄仁勋现身上海菜市场

头条要闻

媒体:冯德莱恩遭遇三连击 她的麻烦才刚刚开始

头条要闻

媒体:冯德莱恩遭遇三连击 她的麻烦才刚刚开始

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

时尚
游戏
旅游
房产
艺术

冬天最佳“显瘦”公式:上短+下长

《轮回之兽》的优化不会像《宝可梦》系列那样差

旅游要闻

雪落颐和,一湖晨光藏尽中式美学的终极浪漫!

房产要闻

正式官宣!三亚又一所名校要来了!

艺术要闻

18位西方画家笔下的女人,美得惊艳了时光!

无障碍浏览 进入关怀版