Nature｜脑机接口揭示：神经元树突的差异性学习机制|信号|胞体

Nature｜脑机接口揭示：神经元树突的差异性学习机制

分享至

来源：PsyBrain脑心前沿

研究背景

学习会改变突触连接，但在复杂神经网络里，哪些神经元和突触该被“记功”或“追责”，也就是信用分配（credit assignment）问题，至今缺少直接的细胞亚区室证据。理论上，如果前馈输入和反馈/教学信息能在皮层锥体神经元不同树突区室中分开处理，那么单个神经元就可能接收到面向自身的向量化教学信号（vectorized teaching signals），而不是全体共享同一个标量信号。

这篇论文聚焦小鼠回顾后皮层（retrosplenial cortex, RSC）第5层锥体神经元的顶端树突（apical dendrites）。作者提出，若树突确实参与这类信用分配，至少应满足四个条件：树突活动包含胞体之外的信息；这些信息与奖励或误差等任务变量有关；其符号取决于该神经元在任务中的因果角色；扰动这类树突信号会影响学习。一个现实难点是，实验者往往不知道大脑内部究竟在优化什么奖励函数。为绕开这个问题，作者使用了由实验者明确规定奖励函数的神经反馈脑机接口（brain-computer interface, BCI）任务。

实验设计与方法逻辑

作者让头固定小鼠在双光子成像下学习一个闭环BCI任务：在RSC中选出两组空间上交错的第5层锥体神经元，定义为P+和P−，两组平均活动之差驱动视觉光栅朝目标方向旋转；达到目标后给予奖励。首先，研究连续追踪14天，确认小鼠能否学会任务，以及P+、P−神经元活动如何随学习变化。

随后，作者半同步记录同一神经元近端与远端顶端树干钙信号，并以近端树干作为胞体活动代理，定义体-树突残差（somato-dendritic residual, SD residual），用于量化在给定胞体事件幅度下，树突信号是相对放大还是相对衰减。这个指标的目的，是检验树突是否携带胞体活动之外的额外信息。

接着，研究用视野内周围神经元在事件前2秒的活动去预测单细胞SD residual，并在群体层面用SD residual解码奖励/未奖励、成功/失败等任务变量。更关键的一步是，P+和P−在任务中对误差的因果作用相反，因此可以检验树突中的误差信号究竟更像“全体共享的标量”，还是“依神经元角色改变符号的向量化表示”。最后，作者通过激活第1层的NDNF阳性中间神经元（NDNF+ interneurons）削弱顶端树突处理，观察相关信号和学习表现是否同时受影响。需要注意的是，这项研究证明的是与任务相关的树突信号及其必要性的一部分证据，并不能据此直接断言大脑普遍采用某一种具体学习算法。

核心发现

发现一：这项BCI学习依赖神经元群体的差异性重塑，而不是整体一起增强

小鼠确实学会了这项闭环BCI任务，而且学习过程中，P+与P−并不是同步朝同一方向变化。正文显示，14天训练后，无论按正确率还是每分钟奖励数衡量，任务表现都提升；与此同时，P−神经元活动逐渐下调，而P+整体更接近维持原水平。由于两类神经元在空间上交错、且训练初始瞬变频率相当，这更符合差异性重塑，而不是简单的非特异性增益上调。

Fig. 1 中，作者一边给出BCI任务规则，一边展示14天内的表现变化和P+、P−活动轨迹；这张图说明小鼠学会了任务，而且学习伴随的是两类控制神经元的分化调整，也对应了“发现一”。

发现二：体-树突残差携带胞体之外的信息，并与奖励和试次结果相关

虽然胞体与远端树突的事件时间高度相关，但两者相对幅度并不固定。作者用SD residual量化这种差异后发现，它与胞体事件幅度去相关，却可以被周围网络状态在单细胞层面高于随机水平地预测，说明树突并不只是被动复制胞体输出。进一步地，在群体层面，SD residual能够以高于随机的准确率区分奖励/未奖励试次，以及成功/失败试次，表明这种体-树突差异信号与任务相关变量有关。麻醉和激活NDNF+中间神经元都会降低SD residual，也支持这一指标对应可被生理操控的树突处理过程。

Fig. 2 展示了SD residual的定义，以及周围网络活动如何预测单细胞树突相对放大或衰减；Fig. 3 说明这种指标会在麻醉或NDNF+中间神经元激活时下降；Fig. 4 则表明群体SD residual可解码奖励和试次结果，这几张图共同支撑了“发现二”。

发现三：树突中的误差信号具有神经元特异性，干扰后学习也会受损

如果误差信号只是全局广播的标量，那么P+和P−应当表现出同向的树突变化；但正文结果并非如此。在误差降低阶段，P+神经元树突相对放大，P−则相对衰减；到了误差升高阶段，两者关系反转。这说明树突中的相关信号带有“方向”，并依赖该神经元在任务中的因果角色，更符合向量化教学信号的预测。作者同时指出，这里观察到的更接近误差导数，而不是经典反向传播中的误差本身。进一步地，激活第1层NDNF+中间神经元后，这种P+与P−可分离的树突误差信号消失，训练后期的表现提升也被破坏，说明局部树突处理与该任务中的学习改进有关。

Fig. 5 中，作者直接比较了P+与P−在误差下降和误差上升时期的SD residual方向，并加入NDNF+中间神经元干预后的结果；这张图把“神经元特异性误差信号”与“学习受损”连成了同一条证据链，也对应了“发现三”。

总结

这篇Nature研究用闭环神经反馈BCI，把信用分配问题放进了可检验的实验框架。结果显示，小鼠RSC第5层锥体神经元的远端顶端树突中，体-树突残差与奖励、试次结果和误差变化相关，而且其符号取决于神经元在任务中的因果角色；扰动这类树突处理会削弱学习。但这还不能直接外推到全脑，也不等于已经证明大脑普遍使用经典反向传播。

阅读最新前沿科技趋势报告，请访问21世纪关键技术研究院的“未来知识库”

未来知识库是 “21世纪关键技术研究院”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

（加入未来知识库，全部资料免费阅读和下载）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.