基本信息
Title:Spontaneous behavior is a succession of self-directed tasks
发表时间:2026.1.19
Journal:Neuron
影响因子:15.3
获取原文:B1
- 添加小助手:PSY-Brain-Frontier即可获取PDF版本
- 点击页面底部“”即可跳转论文原网页
![]()
引言
我们在实验室里研究“目标到动作”的转换,最常见的方式是设计结构化任务(structured task)动物学会在特定线索下做特定动作(比如左/右舔水)来换取奖励。这样的范式很清晰,也让前额叶皮层的编码能力被反复验证。但现实世界里,动物更多时间是在自发行动(spontaneous behavior):在场地里转圈、嗅探、停顿、理毛、靠墙走、突然去检查一个新东西……这些低层动作(动作片段、运动学特征)往往可以服务于很多不同“目的”,因此仅凭瞬时动作很难反推出动物到底在“做什么事”。这也是为什么传统open field 指标常常得出一个结论:PFC 损伤对探索影响不大——可能不是 PFC 不重要,而是我们测量的层级太低,没抓到真正与“目标/任务”相关的组织结构
作者把突破口放在时间结构上:如果自发行为也像任务一样由“阶段”组成,那么低层动作不会随机拼贴,而会在几十秒尺度上呈现可预测的簇集与切换;并且这些“阶段”应当与环境可供性(affordances,比如墙、同伴、物体)紧密耦合,还应当在负责目标导向控制的脑区(尤其是 dorsomedial PFC, dmPFC)里更清晰可读。于是,这篇文章的核心问题变成:能否从自由探索的动作序列中,自动提取出秒级到分钟级的“任务样”行为状态(behavioral states),并证明这些状态不仅能解释行为的长时程结构,还能成为 dmPFC 神经活动的主导组织维度?
实验设计与方法逻辑
作者先用深度相机与 MoSeq(Motion Sequencing)把自由探索切分为亚秒级“行为音节”(behavioral syllables),再提出分层隐马尔可夫模型(hierarchical hidden Markov model, HHMM)的新实现——shMoSeq,用“多秒级状态→偏置音节转移→生成姿态”的层级结构去拟合长时程序列,并用互信息(mutual information, MI)验证模型是否捕获真实行为的非马尔可夫性;随后在同一范式下同步记录 dmPFC 钙成像/神经电生理,并以编码-解码模型对比“状态变量”与“低层运动变量”对神经活动的解释力;最后通过改变可供性(同伴、物体、攻击情境)和 dmPFC 损伤来检验其对状态选择与长时程组织的因果贡献。
![]()
核心发现
1)行为存在“秒级任务状态”,能解释长时程可预测性(Figure 1)
真实音节序列的可预测性(MI)能维持到几十秒,而简单马尔可夫模型几秒内就掉到随机水平,说明自发行为并非只靠“上一动作→下一动作”的短链,用“状态调控音节转移矩阵”的方式,生成的模拟序列在 MI 衰减曲线几乎与真实数据重合;进一步看,状态本身更接近马尔可夫链,且状态持续可达近一分钟,提示“音节—状态”两层就足以解释 1 小时探索中的多尺度结构。
![]()
Figure 1. Behavioral states capture the higher-order structure in exploratory behavior
2)可供性决定“做哪种状态”,状态像是在围绕对象执行任务(Figure 2)
当场地只有墙时,最突出的是贴边定向的探索性运动状态(exploratory locomotion),表现为顺/逆时针沿墙巡航。换成新物体范式后,local investigation 状态被显著放大(约 3–4 倍),并伴随更靠近物体、更多“面向物体的音节”,而且这些状态在整段会话中多次自发启动,符合“自我发起的任务段落”而非被动反射。
![]()
Figure 2. Affordances sculpt the distribution of behavioral states
3)dmPFC 更“读状态”而非“读动作”,并在相关状态强化关键变量(Figures 3–4)
Figure 3 显示,dmPFC 中相当比例神经元在不同状态间出现显著激活/抑制,群体活动的低维嵌入也按状态分区;更关键的dmPFC 的预测精度,而在 dorsolateral striatum(DLS)中几乎无增益,形成“PFC 编码状态、纹状体编码音节”的分工。Figure 4 进一步把“任务相关变量”嵌入:靠墙导航时,墙的方向/距离在 thigmotaxis 样状态中最易解码;社交距离在 social engagement 状态中显著增强;物体距离与物体身份在 local investigation 状态最可读——这些都像结构化任务里“当前规则决定什么信息更重要”的自然版复现。
![]()
Figure 3. Behavioral states structure neural activity in the dmPFC
![]()
![]()
Figure 4. Encoding of affordance-related variables depends on behavioral state
4)dmPFC 不像“即时指挥官”,更像“情境化的状态编排者”(Figures 6–7)
如果 dmPFC 在逐瞬时驱动状态切换,神经活动应当领先行为;但 Figure 6 显示,多数状态相关活动在状态开始,不支持持续的分钟-秒级在线指挥模型。因果证据来自 Figure 7:dmPFC 损伤并不明显改变低层音节的内容或状态持续时间,却显著缩短音节 MI 的长时程结构,并让一些“较少出现但更依赖情境”的状态(如 grooming、local investigation,尤其在有新物体时)使用率下降,行为更被常见状态“挤占”。这提示dmPFC 的关键作用是让动物在特定情境下更容易选中合适、甚至相对“稀有”的任务状态,从而维持长时程的行为组织。
![]()
Figure 6. Neural dynamics lag behavioral transitions
![]()
Figure 7. dmPFC influences the usage of behavioral states
归纳总结和点评
这项研究把自发探索从“动作噪声”提升为可量化的层级结构:用 shMoSeq 在音节之上抽取秒级行为状态,并证明这些状态既受可供性塑形,又是 dmPFC 群体活动的主导坐标系。更难得的是,作者用跨脑区比较与损伤实C 并非细粒度控制每一步动作,而是帮助动物在不同情境下拓展并编排更丰富的状态库,维持长时程、上下文恰当的行为组织。整体上,这篇工作为“在不强加任务的情况下研究认知控制”提供了一个非常干净且可推广的范式与工具链。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.