![]()
来源:PsyBrain脑心前沿
![]()
![]()
研究背景
学习会改变突触连接,但在复杂神经网络里,哪些神经元和突触该被“记功”或“追责”,也就是信用分配(credit assignment)问题,至今缺少直接的细胞亚区室证据。理论上,如果前馈输入和反馈/教学信息能在皮层锥体神经元不同树突区室中分开处理,那么单个神经元就可能接收到面向自身的向量化教学信号(vectorized teaching signals),而不是全体共享同一个标量信号。
这篇论文聚焦小鼠回顾后皮层(retrosplenial cortex, RSC)第5层锥体神经元的顶端树突(apical dendrites)。作者提出,若树突确实参与这类信用分配,至少应满足四个条件:树突活动包含胞体之外的信息;这些信息与奖励或误差等任务变量有关;其符号取决于该神经元在任务中的因果角色;扰动这类树突信号会影响学习。一个现实难点是,实验者往往不知道大脑内部究竟在优化什么奖励函数。为绕开这个问题,作者使用了由实验者明确规定奖励函数的神经反馈脑机接口(brain-computer interface, BCI)任务。
![]()
实验设计与方法逻辑
作者让头固定小鼠在双光子成像下学习一个闭环BCI任务:在RSC中选出两组空间上交错的第5层锥体神经元,定义为P+和P−,两组平均活动之差驱动视觉光栅朝目标方向旋转;达到目标后给予奖励。首先,研究连续追踪14天,确认小鼠能否学会任务,以及P+、P−神经元活动如何随学习变化。
随后,作者半同步记录同一神经元近端与远端顶端树干钙信号,并以近端树干作为胞体活动代理,定义体-树突残差(somato-dendritic residual, SD residual),用于量化在给定胞体事件幅度下,树突信号是相对放大还是相对衰减。这个指标的目的,是检验树突是否携带胞体活动之外的额外信息。
接着,研究用视野内周围神经元在事件前2秒的活动去预测单细胞SD residual,并在群体层面用SD residual解码奖励/未奖励、成功/失败等任务变量。更关键的一步是,P+和P−在任务中对误差的因果作用相反,因此可以检验树突中的误差信号究竟更像“全体共享的标量”,还是“依神经元角色改变符号的向量化表示”。最后,作者通过激活第1层的NDNF阳性中间神经元(NDNF+ interneurons)削弱顶端树突处理,观察相关信号和学习表现是否同时受影响。需要注意的是,这项研究证明的是与任务相关的树突信号及其必要性的一部分证据,并不能据此直接断言大脑普遍采用某一种具体学习算法。
![]()
核心发现
发现一:这项BCI学习依赖神经元群体的差异性重塑,而不是整体一起增强
小鼠确实学会了这项闭环BCI任务,而且学习过程中,P+与P−并不是同步朝同一方向变化。正文显示,14天训练后,无论按正确率还是每分钟奖励数衡量,任务表现都提升;与此同时,P−神经元活动逐渐下调,而P+整体更接近维持原水平。由于两类神经元在空间上交错、且训练初始瞬变频率相当,这更符合差异性重塑,而不是简单的非特异性增益上调。
![]()
Fig. 1 中,作者一边给出BCI任务规则,一边展示14天内的表现变化和P+、P−活动轨迹;这张图说明小鼠学会了任务,而且学习伴随的是两类控制神经元的分化调整,也对应了“发现一”。发现二:体-树突残差携带胞体之外的信息,并与奖励和试次结果相关
虽然胞体与远端树突的事件时间高度相关,但两者相对幅度并不固定。作者用SD residual量化这种差异后发现,它与胞体事件幅度去相关,却可以被周围网络状态在单细胞层面高于随机水平地预测,说明树突并不只是被动复制胞体输出。进一步地,在群体层面,SD residual能够以高于随机的准确率区分奖励/未奖励试次,以及成功/失败试次,表明这种体-树突差异信号与任务相关变量有关。麻醉和激活NDNF+中间神经元都会降低SD residual,也支持这一指标对应可被生理操控的树突处理过程。
![]()
![]()
![]()
Fig. 2 展示了SD residual的定义,以及周围网络活动如何预测单细胞树突相对放大或衰减;Fig. 3 说明这种指标会在麻醉或NDNF+中间神经元激活时下降;Fig. 4 则表明群体SD residual可解码奖励和试次结果,这几张图共同支撑了“发现二”。
发现三:树突中的误差信号具有神经元特异性,干扰后学习也会受损
如果误差信号只是全局广播的标量,那么P+和P−应当表现出同向的树突变化;但正文结果并非如此。在误差降低阶段,P+神经元树突相对放大,P−则相对衰减;到了误差升高阶段,两者关系反转。这说明树突中的相关信号带有“方向”,并依赖该神经元在任务中的因果角色,更符合向量化教学信号的预测。作者同时指出,这里观察到的更接近误差导数,而不是经典反向传播中的误差本身。进一步地,激活第1层NDNF+中间神经元后,这种P+与P−可分离的树突误差信号消失,训练后期的表现提升也被破坏,说明局部树突处理与该任务中的学习改进有关。
![]()
Fig. 5 中,作者直接比较了P+与P−在误差下降和误差上升时期的SD residual方向,并加入NDNF+中间神经元干预后的结果;这张图把“神经元特异性误差信号”与“学习受损”连成了同一条证据链,也对应了“发现三”。
![]()
总结
这篇Nature研究用闭环神经反馈BCI,把信用分配问题放进了可检验的实验框架。结果显示,小鼠RSC第5层锥体神经元的远端顶端树突中,体-树突残差与奖励、试次结果和误差变化相关,而且其符号取决于神经元在任务中的因果角色;扰动这类树突处理会削弱学习。但这还不能直接外推到全脑,也不等于已经证明大脑普遍使用经典反向传播。
阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”
![]()
未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。
截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.