预测神经动力学
Predictive Neural Dynamics
https://www.emergentmind.com/topics/predictive-neural-dynamics
![]()
预测性神经动力学是生物和人工神经系统在多个尺度上形成、传输和利用预测的机制。
它们整合了分层预测编码、循环网络架构以及信息论度量,以减少预测误差并实现鲁棒控制。
最近的进展将这些原理应用于机器人学和人工智能中的预测控制建模,实现了实时、可解释和自适应的系统行为。
预测性神经动力学涵盖神经系统——无论是生物的还是人工的——在多个尺度上(从细胞电生理学到高层感知与运动规划)形成、传递并利用对未来状态之预测的机制。该领域整合了循环与层级神经回路模型、对预测与误差的信息论量化方法,以及支持鲁棒预测与控制的学习算法。近期研究结合了神经网络架构、动力系统理论、信息论与最优控制理论,以剖析预测在脑功能中的作用,为神经科学提供可解释的分析工具,并启发先进的机器学习与控制框架。
理论基础:预测编码与层级神经动力学
预测性神经动力学的核心是预测编码框架,该框架将感知与行动形式化为层级化推理与预测误差最小化的过程。其典型架构包含循环、多层网络,其中每一层生成对下层活动的自上而下预测,而自下而上的信号则传递偏差(即预测误差)(Choi 等,2016;Choi 等,2017;Ofner 等,2021)。其关键特性包括:
- 双向层级架构 :高层区域发送生成性预测;低层区域反馈“意外”(即预测误差)信号。
- 时间与空间层级性:不同层级以不同时间尺度与空间粒度运作,反映了生物皮层的多尺度组织特性(Choi 等,2016;Choi 等,2017;Hwang 等,2017)。
- 迭代式推理:网络状态通过循环更新以减小自由能或预测误差,梯度信息或局部赫布型/可塑性规则引导权重与状态的适应性调整(Ofner 等,2021;Hwang 等,2017;Huang 等,2022)。
解析模型明确刻画了此类架构中的稳定性与波传播特性。数学结果表明:自下而上与自上而下校正权重(α, λ)、循环反馈强度以及激活函数的非线性特性共同决定了活动传播(即预测误差波或信号波)是向上、向下传播,抑或停滞;参数空间中存在自然区域,分别对应感觉驱动型、强先验驱动型,或处于平衡态的“健康”预测编码(Alamia 等,2025年5月14日;Faye 等,2023)。
神经与机器学习模型:架构与算法
预测性神经动力学在多种模型类别中得以具体实现,横跨生物合理性与工程实用性两个维度:
- 预测性状态空间模型与深度循环神经网络(RNN):长短期记忆网络(LSTM)与回声状态网络(ESN)已被用于预测生物神经元的发放与簇发放行为,以及高维混沌系统与状态跃迁系统。这些架构既能预测局部时间波动,也能预见大尺度状态变迁;其中ESN展现出对训练中从未出现过的系统状态进行预测的能力(Plaster 等,2019;Pershin 等,2021)。
- 层级化、多尺度RNN:如“预测性多时空尺度RNN”(P-MSTRNN)与“预测性视觉–运动深度动态神经网络”(P-VMDNN)等模型,通过协调空间与时间上的表征层级,实现稳健的预测与意图推断——高层编码缓慢变化的、类意图的吸引子态,而低层则追踪精细的感官或运动细节(Choi 等,2016;Choi 等,2017;Hwang 等,2017)。
- 记忆中的记忆(MIM)网络:在循环模块中直接嵌入时间差分运算,以处理高阶非平稳信号;通过分解时空趋势,使深层架构能够捕获多尺度结构(Wang 等,2018)。
- 脉冲门控与振荡环路:脉冲门控信息路由、分层赫布型环路,以及显式的振荡门控机制已被分析用于在线自回归(AR)过程预测,其研究既强调生物合理性,也突出功能性振荡复用(oscillatory multiplexing)的作用(Shao 等,2017)。
- 可微分广义预测编码:通过深度神经网络参数化并结合自动微分技术,实现变分自由能目标函数,整合层级性与动力学预测;该方法兼具生物学可解释性,并能扩展至非线性、高维任务(Ofner 等,2021)。
信息论与实证量化
对预测性神经动力学的定量理解,得益于信息论工具与多模态数据分析方法的推进:
- 局部主动信息存储(AIS)与传递熵(TE)
:这两项核心指标用于在每一时间点上量化一个神经过程在多大程度上可由其自身过去状态解释(AIS),以及在不同过程之间有多少新信息被传递(TE)。在突触层面,AIS 与 TE 呈正相关可定量地区分两种策略:“预测并传递可预测成分”(predict-and-pass-predictable)与“预测并仅传递误差”(predict-and-pass-errors)(Wollstadt 等,2022)。
- 部分信息分解(PID)
:用于拆解信息传递中的“唯一性”(unique)与“协同性”(synergistic)成分,从而分离纯粹的自下而上传递与依赖于当前系统状态的(即预测误差驱动的)信息路由(Wollstadt 等,2022)。
- 脑记录中的相干性分析
:EEG频段与刺激动态之间的时空相干性,可揭示自然视觉与语言加工中的预测性神经特征;该方法能区分统计结构完整与受损的刺激条件,并映射生成模型如何随经验发生调谐(Borneman 等,2025年12月24日)。
这些理论框架已在实验中直接操作化应用,例如:
• 视网膜–外膝体突触分析(证实了可预测输入成分的传递);
• EEG与光流信号的相干性研究(揭示了语言理解中层级化的预测性神经特征)。
模型预测控制与工程应用
预测性神经动力学通过将所学习的神经模型嵌入模型预测控制(MPC)框架,支撑了多种先进现实世界控制策略:
- 机器人中的神经MPC:深度神经网络(DNN),包括大型架构与残差多层感知机(MLP),被耦合至多段射击法(multiple-shooting)或序列二次规划(SQP)MPC回路中。借助对所学动力学模型的局部泰勒展开及批量化自动微分(autodiff)等技术,系统可在嵌入式硬件上实现实时运行,在高敏捷性任务中性能超越小型模型与解析模型方法(Salzmann 等,2022)。
- 混合整数预测控制(MIPC):通过对ReLU网络进行激进稀疏化(借助连续松弛与架构协同优化获得),可将非线性神经动力学编码为适配混合整数规划(MIP)求解器的直接形式,从而实现全局最优规划;其性能优于未稀疏化网络及强化学习基线方法(Liu 等,2023)。
- 具有限时收敛性的神经MPC:神经动力学二次规划(QP)求解器(例如:限时收敛神经动力学,FTCND)可嵌入MPC回路中,实现亚毫米级轨迹跟踪,兼具限时收敛性与对机械扰动的鲁棒性(Su 等,2024)。
- 概率性与具探索意识的MPC:储备池计算模型(如ESN)被集成至模型预测路径积分(MPPI)控制框架中,实现快速在线系统辨识与不确定性驱动的主动探索;在非线性、模型不确定环境中,其性能优于标准基于QP的MPC(Inoue 等,2025年9月4日)。
上述控制理论方面的进展,展示了预测性神经原理向实际工程系统的成功转化。
预测性神经动力学在感知、心智模拟与人工智能中的应用
预测性动力学机制支撑了大脑——以及人工模型——进行灵活模拟、规划与“心智时间旅行”的能力:
- 潜在状态的未来预测
:经过训练以预测紧凑潜在表征(尤其是源自视频基础模型的表征)演化的感知–认知网络,其行为最契合人类行为判断与精细的灵长类皮层神经放电模式,表明大脑的内部模型运作于 未来潜在状态 层面,而非原始感官信号层面(Nayebi 等,2023)。
- 心智模拟与意图推断
:配备预测编码与误差回归机制的网络,可内生生成多模态行为轨迹,并对隐藏意图进行逆向推断,其机制与生物镜像神经元系统及高层运动控制中的机制高度平行(Hwang 等,2017)。
- 鲁棒性与去噪能力
:将预测编码动力学嵌入传统卷积神经网络(CNN)中(如“Predify”框架),可构建具备迭代误差校正能力的层级结构,从而实现表征去噪、提升对抗鲁棒性,并诱导出类脑的时间推理特性(Choksi 等,2021)。
上述发现既对神经科学模型构成约束,亦为具身人工智能(Embodied AI)架构设计提供启发——强调层级性、时间延展性与生成性潜在预测是认知系统的核心组织原则。
解析现象:波传播、稳定性与功能障碍
显式的数学模型刻画了预测性神经动力学如何支撑系统稳定性与波传播,并进一步通过参数扫描揭示各类功能障碍的潜在机制:
- 行进波与传播失效:系统分析识别出不同参数区域——活动中可向上(前馈误差驱动)、向下(自上而下预测驱动)传播,或被“钉扎”停滞;并揭示了输入幅度与时程对传播与否存在的阈值现象(Alamia 等,2025年5月14日;Faye 等,2023)。在反馈强度/阈值参数空间中绘制的相图,呈现“健康”、“感觉门控主导”与“强先验主导”等不同动力学模式,分别可类比于“盲视”(blindsight)、自闭症谱系障碍及精神分裂症等感知障碍。
- 振荡模式与传导延迟:层间传导延迟,以及自下而上与自上而下通路强度的相互作用,可产生振荡现象——这些振荡对应电生理记录中观测到的α、β、γ频段活动,并复现经验性EEG/MEG中观测到的波传播特征(Faye 等,2023)。
- 侧向预测编码与反应加速:单层模型表明,习得的侧向连接权重可驱动冗余抑制、对熟悉输入的加速响应,以及对称性破缺(symmetry breaking),这些特性再次与实验观测到的皮层微环路结构高度吻合(Huang 等,2022)。
上述分析统一了动力系统理论与信息处理视角,将预测编码框架拓展至严格定义的多尺度、多动力学模式情境中。
展望与启示
预测性神经动力学目前已整合若干统一性原理——层级生成建模、预测误差最小化、时空与信息论的量化分析,以及最优控制——这些原理已在生物与人工系统中获得定量实现。跨学科进展仍在持续推进,体现在以下方向:
将层级化、多尺度架构扩展至现实世界任务与大规模数据场景;
在不同模态与模型类别间统一信息论诊断工具(如AIS、TE、PID);
在工程系统中嵌入显式的预测结构,以实现具有前瞻性、鲁棒性与可解释性的控制;
联结神经、行为与计算三个层面,深化对心智模拟、推理与规划机制的理解;
通过解析方法剖析不同参数区域下系统的稳定性、波传播及失效现象,既服务于模型验证,亦有助于理解认知功能障碍的机制。
理论、实证与工程层面的持续互动,有望进一步澄明“预测”在各类认知与行为领域中的神经基础与计算能力(Choi 等,2016;Hwang 等,2017;Ofner 等,2021;Nayebi 等,2023;Borneman 等,2025年12月24日;Alamia 等,2025年5月14日;Wollstadt 等,2022;Su 等,2024;Inoue 等,2025年9月4日;Liu 等,2023;Pershin 等,2021;Wang 等,2018)。
原文链接: https://www.emergentmind.com/topics/predictive-neural-dynamics
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.