基本信息
Title:Primate-informed neural network for visual decision-making
发表时间:2026.1.9
发表期刊:PNAS
影响因子:9.1
![]()
研究背景
在人工智能飞速发展的今天,深度神经网络(DNN),尤其是卷积神经网络(CNN),在视觉识别任务上已经取得了令人瞩目的成就,甚至在某些特定领域超越了人类的表现。然而,这种“暴力美学”的背后隐藏着显著的缺陷:它们往往是巨大的“黑箱”,缺乏生物学可解释性;它们需要海量的标注数据进行训练;更致命的是,它们在面对噪声干扰或对抗攻击时表现得异常脆弱。相比之下,人类大脑的视觉系统经过亿万年的演化,展现出了惊人的效率、适应性和鲁棒性。
长期以来,神经科学与人工智能之间存在着一道鸿沟。神经科学家试图通过电生理记录和脑成像技术揭示大脑的奥秘,而AI研究者则致力于构建更强大的算法。尽管“类脑计算”的概念通过脉冲神经网络(SNN)等形式已被提出多年,但如何将宏观的神经影像证据(如MRI/fMRI数据)直接用于优化微观的神经网络模型,仍然是一个极具挑战性的未解难题。
目前的生物启发模型大多依赖于对单一脑区或简单回路的模拟,且参数调整往往基于平均化的实验数据,忽略了导致个体行为差异的关键生理特征。这就引出了一个激动人心的科学问题:我们能否构建一个忠实于灵长类背侧视觉通路(dorsal visual pathway)的动力学模型,并利用人类专家的脑成像数据来“指导”这个模型的进化,使其不仅像大脑一样工作,更像大脑一样顽强?这正是本研究试图解答的核心命题。
![]()
Fig. 1. A neural dynamics model of motion perception inspired by the dorsal visual pathway.
研究核心总结
本研究由清华大学启元实验室与北京师范大学的研究团队合作完成,2026年1月9日发表于 PNAS。研究者构建了一个基于灵长类背侧视觉通路的神经动力学模型(Primate-Informed Neural Network,PINN),并创新性地提出了一种“神经影像引导的微调策略”(Neuroimaging-guided fine-tuning)。该策略成功将人类宏观的脑结构与功能特征映射到微观网络参数上,显著提升了模型的决策性能与鲁棒性。
![]()
Fig. 2. Behavioral performance of the model in RDK tasks and effect of virtual electrical stimulation.
忠实复现灵长类背侧通路的神经动力学特征
研究团队基于LIF(Leaky Integrate-and-Fire)神经元构建了包含LGN(外侧膝状体)、V1(初级视觉皮层)、MT(中颞叶)和LIP(外侧顶内沟)四个核心模块的动力学网络,用于模拟随机点运动(RDK)的感知决策任务。结果显示,PINN不仅在行为学层面复现了人类的心理物理曲线(如反应时随相干性增加而降低),更在神经元层面完美重现了电生理实验中的经典发现。例如,V1和MT神经元表现出明确的方向选择性,且MT的选择性随刺激相干性增强而增强;而LIP神经元则展现出典型的“赢者通吃”(Winner-Take-All)和斜坡式(ramping)放电活动,反映了证据积累的动态过程。
![]()
Fig. 3. Structural feature correlation in the RDK task and neuroimaging-guided model tuning.
神经影像引导的参数微调:连接宏观与微观
这是本研究最核心的突破。研究者采集了人类被试的结构磁共振(sMRI)和功能磁共振(fMRI)数据,并发现个体的知觉阈限与特定的脑影像指标显著相关。
![]()
Fig. 4. Functional connectivity correlation in the RDK task and neuroimaging-guided model tuning.
结构层面:左侧外侧枕叶复合体(LOC)的白质平均各向异性分数(FA)与知觉阈限呈负相关。研究者据此推测低FA值可能反映了更高的连接多样性,并通过调整模型中V1-MT的连接保留率模拟了这一特征,结果发现增加连接多样性有效提升了模型敏感度。
功能层面:右侧MT区与前脑岛(AAIC)的静息态功能连接(rs-FC)与任务表现呈正相关。这暗示了自上而下的调控机制。研究者通过增加模型中MT模块的突触电导来模拟这种调控,同样观察到了决策效率的提升。
![]()
Fig. 5. Perturbation comparison between CNN and the neural dynamics model.
卓越的鲁棒性与吸引子动力学机制
为了验证模型的优越性,研究者将PINN与结构相似的卷积神经网络(CNN,即MotionNet)进行了“破坏性测试” 。在面对突触丢失、神经元凋亡以及噪声注入等微扰时,PINN展现出了远超CNN的鲁棒性。特别是在高层级脑区(如LIP输入端)引入噪声时,PINN的性能几乎不受影响,而CNN的准确率则大幅下降。通过构建能量景观(Energy Landscape)分析,研究揭示了其背后的机制:LIP区域的循环连接形成了稳定的决策吸引子(Decision Attractors)。适当的参数优化能够加深吸引子原本的“势阱”,使得网络状态在充满噪声的环境中依然能稳定地收敛至正确的决策状态,这正是生物智能相对于人工神经网络在稳定性上的本质优势。
![]()
Fig. 6. Diagram showing the impact of parameter adjustments on the model.
综上所述,该研究建立了一套完整的各种尺度融合的方法论:利用宏观神经影像证据直接指导微观AI模型的优化。这不仅为理解视觉决策的神经机制提供了可操作的计算平台,更为构建新一代高鲁棒性、强可解释性的类脑人工智能系统指明了方向。
Abstract
The human brain excels at complex tasks with remarkable efficiency, adaptability, and resilience, making it a powerful source of inspiration for AI. Here, we present a neural dynamics model inspired by the primate dorsal visual pathway, a circuit crucial for motion and spatial processing. Incorporating key neuronal and synaptic dynamics, the model reproduces human-like decision-making behaviors and neural activity patterns without the need for extensive training. Compared with conventional artificial networks, it exhibits superior robustness to perturbations such as noise and damage. To further enhance its performance, we introduce a neuroimaging-guided fine-tuning strategy. Correlations between MRI features and behavioral performance are mapped onto critical model parameters, guiding the optimization toward more biologically plausible operational regimes. This approach improves performance and adaptability while preserving biological plausibility and reducing the parameter search space. This is a demonstration of directly integrating human neuroimaging evidence into AI model optimization, establishing a methodology for brain-inspired modeling. By combining insights from primate electrophysiology, human neuroimaging, and biologically grounded modeling, our work narrows the gap between neuroscience and AI. It demonstrates how brain-inspired approaches can advance the development of adaptive, resilient, and interpretable AI systems, offering a paradigm for biologically grounded intelligence.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.