网易首页 > 网易号 > 正文 申请入驻

TiCS | 大脑如何用“闭环”学会做更聪明的决定:眶额皮层 × 感觉皮层

0
分享至

PsyBrain 脑心前沿 | 公众号 PSY-Brain_Frontier

一键关注,点亮星标 ⭐️

不错过每日前沿资讯

认知神经科学前沿文献分享


基本信息:

Title:Orbitofrontal-sensory cortical interactions in learning and adaptive decision-making

发表时间:2025.12.4

Journal:Trends in Cognitive Sciences(TiCS)

影响因子:17.2

获取原文:

  1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本



引言

每天早上换一家咖啡店,哪一杯更香、更顺口,会悄悄决定你明天往哪家走——这就是强化学习(reinforcement learning, RL)在生活中的表现。然而,做出“下次去哪儿买”的决定,不只是简单记住味道这么粗糙。大脑需要把气味、口感、杯型、价格、情绪、品牌这些杂乱信息,整合成一个“值不值得再去”的主观价值,还要在环境变了(比如咖啡突然变难喝)时迅速翻盘。

传统观点认为,感觉皮层只是负责“看清、闻清、尝清”眶额皮层(orbitofrontal cortex, OFC)负责“算账和决策”。但新证据提示,感觉皮层本身也会编码注意(attention)、工作记忆(working memory)、不确定性(perceptual uncertainty)甚至价值相关信息而 OFC 又通过反馈信号改写感觉皮层的表征。两者更像一个不断互相教学的闭环系统,而不是简单的“前端采集 + 后端决策”。

这篇 TiCS 综述文章以计算强化学习框架为主线,系统梳理了 OFC 与五大感觉系统(视觉、听觉、躯体感觉、嗅觉、味觉)之间的双向连接

感觉皮层把压缩后的任务信息送给 OFC,帮助构建抽象的任务状态与“认知地图”(cognitive map);OFC 再把基于价值与任务结构的“教学信号”回送感觉皮层,放大有用特征、重映射价值,让感觉皮层从“被动感受器”升级为“带认知功能的前端模块”。

这不仅改写了我们对感觉皮层的认识,也为理解人脑如何高效学习,以及如何设计更聪明的人工神经网络,提供了新思路。


实验设计与方法逻辑

本文并非单一实验,而是整合解剖追踪、动物电生理、人类 fMRI 以及深度 / 元强化学习(deep/meta-RL)模型等多类证据:

作者先从解剖结构出发,明确 OFC 与各感觉皮层的互惠投射;随后分别梳理自下而上的“感觉→OFC”通路如何提供注意、工作记忆与不确定性信息,自上而下的“OFC→感觉”通路如何实现感知增强与价值重映射;最后在强化学习的计算框架中,把这些结果统一成一个闭环模型,解释大脑如何边感知边学习、边更新任务结构。


核心发现

解剖上:OFC 是连接五大感觉通路的“价值枢纽”

图 1 展示了人类大脑外侧视图中,OFC 与躯体感觉、嗅觉、味觉、视觉和听觉皮层的广泛双向连接:后部 OFC 接收更多来自初级感觉皮层的输入,前部 OFC 更多连接联络区,尤其是与物体 / 面孔识别相关的腹侧视觉通路。 这种“从外周到高级”的多级输入,使 OFC 得以整合多模态信息(比如咖啡的味道 + 香气 + 触感),计算跨模态的主观价值,并向下游(如纹状体、海马)输出价值与任务状态信息,从而在解剖上奠定其“价值枢纽”的地位


Figure 1. Major anatomical connections between sensory cortices and the orbitofrontal cortex (OFC).

感觉→OFC:不仅传“是什么”,还传注意、记忆和不确定性

图 2A 用示意流程总结了感觉皮层送往 OFC 的多条信息流:除传统的感觉特征外,还有自下而上的显著性 / 注意信号(bottom-up attention)、感觉工作记忆表征以及对当前刺激的感知不确定性。 这些“预处理后”的高级信号,帮助 OFC更精准地进行奖励预测、价值比较与责任归因(credit assignment):突出的刺激优先被评估,可维持在感觉工作记忆中的特征更易被正确“记账”,高不确定性则会压低价值信号、推动探索。


Figure 2. Contribution of sensory inputs to value computation and representation learning in the orbitofrontal cortex (OFC).

OFC→感觉:用价值信号直接“调参”感觉皮层

在图 3A 的咖啡例子中,一次令人愉快的体验,会让 OFC 向感觉皮层发送奖励期望与目标导向注意两类自上而下信号:前者提升对与奖励相关特征的响应增益,后者选择性放大与当前目标有关的刺激、抑制无关输入。 动物实验进一步显示,OFC 投射到 V1、A1 或嗅皮层时,可以分别抑制无奖刺激、放大奖励相关刺激的神经反应,实现对感觉编码的“价值调谐”;在人类 fMRI 中,则可观察到在反转学习阶段,OFC 与奖相关 S1 区域的功能连接瞬时增强,提示其通过“教学信号”重写感觉-奖励映射


Figure 3. The orbitofrontal cortex (OFC)–sensory cortex interactions supporting reinforcement-based adaptive learning.

闭环 RL 模型:OFC–感觉皮层协同构建

“任务认知地图”

图 2B 和 3B 合在一起给出一个闭环强化学习框架:感觉皮层将压缩后的任务相关特征(包括不确定性、显著性与近期刺激记忆)送入 OFC,OFC 将其与海马、内嗅皮层等处存储的既往任务状态进行比较——若相似,则更新旧状态;若不同,则创建新状态并附带“探索”加成。 这些任务状态构成抽象的认知地图,驱动对未来结果的预测,再通过价值期望与重映射信号回传感觉皮层,持续调整前端表征,实现在不确定、可变环境中的高效学习与灵活决策。


归纳总结和点评

总体来看,本文提出了一个优雅的闭环模型:

  • 感觉皮层不再是被动的“像素工厂”,而是能根据注意、记忆与不确定性进行智能“压缩”的前端;

  • 眶额皮层则在此基础上构建任务状态与认知地图,并通过价值导向的教学信号,塑造感觉皮层对世界的“看法”。

这种双向互动既可以解释动物与人类反转学习、价值驱动注意和感知增强等现象,也为人工智能中的表征学习与元强化学习提供了神经启发。

作为一篇跨解剖、系统神经与计算建模的综述,它在“感觉皮层也很聪明”与“OFC 不只是算钱,更在教别人怎么算”这两个点上,给出了兼具数据基础与理论高度的统一视角,值得做决策与学习研究的读者细细品味。


AI 一句话锐评

这篇文章本质上在说:真正聪明的脑,不是前端感知 + 后端决策,而是让“感觉皮层也会思考、OFC 也会 teach”,把整张大脑网络训练成一个自我更新的闭环强化学习系统。


请打分

这篇刚刚登上TiCS的综述,是否实至名归?我们邀请您作为“云审稿人”,一同品鉴。精读全文后,欢迎在匿名投票中打分,并在评论区分享您的深度见解。

前沿交流|欢迎加入认知神经科学前沿交流群!


核心图表、方法细节、统计结果与讨论见原文及其拓展数据。

分享人:BQ

审核:PsyBrain 脑心前沿编辑部

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
川普达沃斯宣告新世界开始、接管格陵兰及北冰洋、启动联合国重构

川普达沃斯宣告新世界开始、接管格陵兰及北冰洋、启动联合国重构

邵旭峰域
2026-01-23 12:15:08
老蒋扣押傅作义夫人,地下党束手无策,周总理悄悄放出一条消息

老蒋扣押傅作义夫人,地下党束手无策,周总理悄悄放出一条消息

搜史君
2026-01-21 10:05:09
从“一方诸侯”到“打回原形”,叙利亚库尔德武装如何兴衰的?

从“一方诸侯”到“打回原形”,叙利亚库尔德武装如何兴衰的?

战风
2026-01-23 11:49:30
这位湖北籍副部级干部,添新职

这位湖北籍副部级干部,添新职

坠入二次元的海洋
2026-01-23 16:09:24
先秦历史学者、湖南师大教授李健胜逝世,年仅50岁

先秦历史学者、湖南师大教授李健胜逝世,年仅50岁

澎湃新闻
2026-01-23 14:07:05
广东程序员高广辉去世!仅32岁,妻子曝死因,死后不能进祖坟

广东程序员高广辉去世!仅32岁,妻子曝死因,死后不能进祖坟

八斗小先生
2026-01-22 13:38:12
到北京才发现:波司登、骆驼羽绒服没人穿了,都在追这3个品牌

到北京才发现:波司登、骆驼羽绒服没人穿了,都在追这3个品牌

白宸侃片
2026-01-22 04:30:29
2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

忠于法纪
2026-01-20 18:30:40
睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

睡完首富睡首相:从厂妹到顶级名媛,靠男人捞到268亿,她凭什么

深度报
2026-01-21 22:54:05
马克龙受了奇耻大辱,转头对中国提出两个请求,特朗普紧急摊牌

马克龙受了奇耻大辱,转头对中国提出两个请求,特朗普紧急摊牌

阿七说史
2026-01-22 15:43:30
中国U23进决赛的背后:那五个本该在场上,却被时代淘汰的名字

中国U23进决赛的背后:那五个本该在场上,却被时代淘汰的名字

猪猪爱影视
2026-01-22 15:06:24
胡宗南明知熊向晖是中共卧底却不抓他,沈醉晚年回忆说出背后原因

胡宗南明知熊向晖是中共卧底却不抓他,沈醉晚年回忆说出背后原因

饭小妹说历史
2026-01-07 09:30:45
演员王雷方向嫣然天使基金捐款500元/月,发文称:李亚鹏太感人了,自己钱不多、富裕了再多捐

演员王雷方向嫣然天使基金捐款500元/月,发文称:李亚鹏太感人了,自己钱不多、富裕了再多捐

台州交通广播
2026-01-22 22:01:38
百感交集!李亚鹏一件衣服上有两个破洞,让无数网友集体破防了

百感交集!李亚鹏一件衣服上有两个破洞,让无数网友集体破防了

小李睡不醒了
2026-01-23 07:43:40
洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

素素娱乐
2026-01-23 11:07:53
记者:C罗预计明年夏天离开利雅得胜利,不排除就此退役

记者:C罗预计明年夏天离开利雅得胜利,不排除就此退役

懂球帝
2026-01-23 06:38:48
平潭金店被劫4天后告破:林某刘某落网,均为平潭人,损失近200万

平潭金店被劫4天后告破:林某刘某落网,均为平潭人,损失近200万

阿纂看事
2026-01-23 13:57:53
胡春华发表署名文章

胡春华发表署名文章

社评
2025-10-31 10:11:37
事实证明,70后注定是,中国有史以来,人生经历最丰富的一代

事实证明,70后注定是,中国有史以来,人生经历最丰富的一代

阿器谈史
2026-01-22 22:43:30
A股:今天收在4136,迹象表明了,下周一或这样走

A股:今天收在4136,迹象表明了,下周一或这样走

八斗小先生
2026-01-23 15:10:04
2026-01-23 18:36:49
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
126文章数 10关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

21岁女孩确诊白血病后急寻亲生父母:已签病危通知书

头条要闻

21岁女孩确诊白血病后急寻亲生父母:已签病危通知书

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

时尚
本地
家居
旅游
军事航空

告别臃肿!这种简约的高级穿法,别拒绝

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

家居要闻

在家度假 160平南洋混搭宅

旅游要闻

走进伊春冰雪森林,赴一场童话之约

军事要闻

美军首艘“高超导弹战舰”出海测试

无障碍浏览 进入关怀版