网易首页 > 网易号 > 正文 申请入驻

NC最新 | 统一视觉注意力的计算框架:双向循环门控机制如何解决特征绑定难题

0
分享至


认知神经科学前沿文献分享

基本信息

Title:Modeling attention and binding in the brain through bidirectional recurrent gating

发表时间:2026-05-05

发表期刊:Nature Communications

影响因子:15.7

获取原文:

1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本


研究背景

当我们注视着眼前复杂的场景时,大脑的视觉系统正面临着一个极其艰巨的挑战:如何从数以百万计的神经元活动中,将属于同一个物体的颜色、形状和运动轨迹准确地“绑定”在一起,并将其与背景区分开来?这个被称为“绑定问题”(binding problem)的谜题,以及与之紧密相关的视觉注意力机制,一直是认知神经科学领域的核心未解之谜。

过去几十年里,研究者们分别在空间注意力、特征注意力以及基于客体的注意力等多个维度积累了丰富的实证数据。然而,当前的计算模型往往是碎片化的。例如,有的模型依赖显著性图,有的依赖时间同步性,还有的依赖选择性路由。我们至今缺乏一个统一的计算框架,能够在一个符合神经生物学规律的网络中,同时解释这些跨越不同尺度的注意力现象。此外,当前主流的人工智能视觉模型高度依赖纯前馈网络,忽略了大脑腹侧视觉流中至关重要的自上而下(top-down)反馈和侧向(lateral)循环处理。

为了打破这一僵局,来自柏林工业大学和宾夕法尼亚大学等机构的研究团队在《Nature Communications》上提出了一种名为“双向循环门控”(bidirectional recurrent gating)的神经启发计算机制。这项研究试图回答一个根本问题:如果我们为神经网络赋予类似大脑视觉皮层的架构约束,并让其在多任务环境中学习,那些复杂的、类人的注意力行为和神经生理特性,是否会自然涌现?

研究核心总结

这项研究并没有为每一种注意力现象单独设计模块,而是构建了一个统一的U-Net变体架构。在这个架构中,自下而上的前馈路径负责提取视觉特征,而自上而下和侧向连接则传递与任务和上下文相关的调节信号。研究者通过一系列精心设计的实验,揭示了该模型在行为、知觉和神经生理三个层面的核心发现。

一、统一架构在多任务学习中展现出全能的注意力行为

研究者首先考察了模型是否具备类似人类的灵活注意力分配能力。通过在包含复杂遮挡和动态噪声的MNIST和COCO组合数据集上进行多任务训练,模型不仅出色地完成了基础的物体识别与分割,还成功执行了视觉搜索、空间线索定向和特征突显(pop-out)等经典注意力任务。

更重要的是,该模型展现出了处理时间动态信息的能力。在目标追踪任务中,模型能够持续将注意力锁定在移动的客体上;而在多目标场景中,模型自发学会了“返回抑制”(inhibition of return),即在扫描完一个物体后,主动抑制对该位置的关注,从而顺利将注意力转移到下一个新物体上。这表明,双向循环门控机制足以支撑视觉系统在空间和时间维度上的复杂过滤与搜索行为。


Fig 1. 展示了双向循环门控模型的核心架构,自下而上的特征提取与自上而下的注意力调节在网络中交汇并相互作用。


Fig 2. 模型在多任务学习范式下的表现,证明了单一网络可以同时掌握空间线索、特征突显和自上而下的视觉搜索。
二、模型自发涌现出与人类高度一致的心理物理学错觉与知觉局限

一个优秀的认知计算模型不仅要能完成任务,还要能复现人类在信息处理时的“局限性”。研究者利用经典的心理物理学范式对模型进行了测试。结果发现,当模型将注意力集中在特定区域时,其对比度阈值显著降低(对比度增益),并且会主观上“认为”被关注区域的刺激对比度更高,这与人类受试者的表现如出一辙。

此外,模型还完美复现了知觉负载理论(Perceptual Load Theory)的核心现象。当视野中的干扰物增加、知觉负载变大时,模型检测目标变化的准确率系统性下降。特别是在无效线索引导注意力的试次中,模型对极其明显的视觉变化视而不见,展现出了典型的“无意视盲”(inattentional blindness)。在经典的Bregman错觉测试中,模型也像人类一样,能够利用可见的遮挡物边界来辅助目标识别,证明了其具备处理边界归属(border-ownership)的能力。


Fig 4. 经典的Bregman错觉测试表明,模型与人类一样,会利用可见的遮挡物边界来辅助目标识别与特征整合。


Fig 7. 心理物理学实验再现,揭示了模型在面对知觉负载增加时,同样会出现类似人类的无意视盲现象。
三、内部神经元发育出类似灵长类视觉皮层的生理特性

为了探究模型内部的计算机制是否具有生物学合理性,研究者打开了网络的“黑箱”,将其内部单元的活动与猕猴视觉皮层的单细胞记录进行了对比。在模拟的曲线追踪(curve-tracing)任务中,模型成功实现了基于客体的注意力分配,其早期层神经元的活动在目标曲线经过其感受野时显著增强,这与猕猴V1区神经元的反应模式高度吻合。

进一步的调谐曲线分析显示,注意力对模型深层神经元的调节是乘性的(multiplicative)。也就是说,注意力仅仅放大了神经元的反应强度,而没有改变其对特定方向的固有偏好(即注意力不变性调谐),这直接呼应了在猕猴V4区观察到的经典生理学现象。此外,在图地分离任务中,模型自发分化出了两类神经元:一类负责纯粹的特征提取,另一类则专门编码物体的边界方向,这为近期关于视觉皮层边界归属编码的生物学发现提供了强有力的计算解释。


Fig 3. | Multitask training on MNIST composites (Part 2/2). Results for a singlemodel trained on seven tasks simultaneously. The figure includes inp...


Fig 5. | Multitask training on COCO. Results for a single model trained on threetasks simultaneously: a object recognition, b cued perceptual group...


Fig 6. | Feature attention and masking. a The CelebA dataset contains a strongspurious correlation between hair color and sex, which can be exploit...


Fig 11. | Architecture backbone, building blocks, and elements. The terminologyused here follows PyTorch layer conventions. Sequential operations ar...


Fig 12. | Architecture backbone, building blocks and elements. a Detailedarchitecture used for the MNIST experiment. For the MNIST model, we use RNN...


Fig 8. 在曲线追踪任务中,模型早期层神经元的活动在关注目标曲线时显著增强,再现了猕猴V1区的电生理记录。


Fig 9. 神经元调谐曲线分析显示,注意力仅通过乘性增益增强了神经元反应,而未改变其固有的方向选择性偏好,高度契合猕猴V4区的生理记录。


Fig 10. 图地分离任务中的神经元活动表明,网络自发分化出了类似灵长类视觉皮层中负责边界归属编码的特定神经元群。

研究意义

这项工作为认知神经科学和人工智能领域带来了多重启发。首先,在理论层面上,它为“涌现注意力假说”(emergent-attention hypothesis)提供了坚实的机制级证据。研究表明,空间、特征和客体注意力并不需要大脑中存在相互独立的专属模块,它们完全可以通过一个统一的循环门控机制,在任务驱动的局部竞争与全局调节中自然涌现。同时,该模型也强有力地支持了“通过发射率增强实现绑定”的理论。

其次,在方法学上,这项研究为理解视觉系统提供了一个极具潜力的“白盒”替代方案。相比于一味追求性能的纯前馈深度学习模型,这种受脑启发的架构在处理虚假相关性、应对复杂遮挡以及多任务泛化方面展现出了更高的鲁棒性。

当然,研究者也客观指出了当前模型的边界。例如,该模型尚未整合眼跳等显性注意力机制,且其依赖的基于时间的反向传播(BPTT)算法在严格的生物学意义上仍存争议。但瑕不掩瑜,这一框架不仅为未来设计针对视觉认知障碍的计算实验提供了理想的测试床,也为下一代更具灵活性和类人推理能力的AI架构指明了方向。

分享人:饭鸽儿

审核:PsyBrain 脑心前沿编辑部

你好,这里是「PsyBrain 脑心前沿

专注追踪全球认知神经科学的最尖端突破

视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊

每日速递「深度解读」与「前沿快讯

科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。

点击卡片进群,欢迎你的到来

一键关注,点亮星标 ⭐ 前沿不走丢!


一键分享,让更多人了解前沿

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网传上海生化所发生有害物泄露,致多名师生中毒,校方隐瞒不报

网传上海生化所发生有害物泄露,致多名师生中毒,校方隐瞒不报

可达鸭面面观
2026-05-12 20:27:09
貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

貔貅认主不看财富,这四个生肖千万别碰,戴了反而会破财

纸鸢奇谭
2026-04-13 16:06:54
李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

李讷左手拉着大孙女右手抱着小孙女,儿子王效芝儿媳王伟围在身边

大江
2026-05-12 11:09:07
张献忠打重庆多惨烈?破城后屠尽官员、剐杀瑞王,三万俘兵被断掌

张献忠打重庆多惨烈?破城后屠尽官员、剐杀瑞王,三万俘兵被断掌

鹤羽说个事
2026-05-12 22:46:36
惊天大反转!国人赴乌参战被俘,中方表态:绝不兜底

惊天大反转!国人赴乌参战被俘,中方表态:绝不兜底

阿芒娱乐说
2026-05-13 11:30:51
任正非出现在镜头里的那一刻,信号已经发出去了

任正非出现在镜头里的那一刻,信号已经发出去了

普陀动物世界
2026-05-12 18:24:55
知情人士:阿联酋秘密打击伊朗,正式成为参战方,4月初曾袭击伊朗拉旺岛一座炼油厂

知情人士:阿联酋秘密打击伊朗,正式成为参战方,4月初曾袭击伊朗拉旺岛一座炼油厂

每日经济新闻
2026-05-12 21:45:10
私吞别人家产,并霸占人家二姨太,上海军代表乐得逍遥,终被枪决

私吞别人家产,并霸占人家二姨太,上海军代表乐得逍遥,终被枪决

真实异闻
2024-10-08 21:47:41
皇马主席放飞自我了!弗洛伦蒂诺:让那个女孩提问,你们其他人都太丑了

皇马主席放飞自我了!弗洛伦蒂诺:让那个女孩提问,你们其他人都太丑了

懂个球
2026-05-13 14:17:43
女子硕士入学清华后参与智力测验,仅得25分,回应:无论是学习、工作、创业,我都没有遇到困难,但我居然智力中下

女子硕士入学清华后参与智力测验,仅得25分,回应:无论是学习、工作、创业,我都没有遇到困难,但我居然智力中下

扬子晚报
2026-05-11 07:48:21
我嫁给不能生育的迪拜富商,不到3个月我竟孕吐不止,医生:恭喜

我嫁给不能生育的迪拜富商,不到3个月我竟孕吐不止,医生:恭喜

千秋文化
2026-03-25 21:42:08
大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

大家不知道的是,妈祖乩童的真实待遇,不只是荣耀这么简单

智慧生活笔记
2026-05-13 10:15:27
韩寒力推《给阿嬷的情书》:愿票房可以突破10亿

韩寒力推《给阿嬷的情书》:愿票房可以突破10亿

红星新闻
2026-05-13 15:39:18
民警非法查询个人信息这件事,有多离谱

民警非法查询个人信息这件事,有多离谱

雷斯林
2026-05-12 19:15:51
黄仁勋拿下第6个博士学位 毕业演讲:AI 可能不会取代你,但善用AI的人可能会

黄仁勋拿下第6个博士学位 毕业演讲:AI 可能不会取代你,但善用AI的人可能会

每日经济新闻
2026-05-12 11:03:00
突发!灰熊前锋克拉克去世,年仅29岁

突发!灰熊前锋克拉克去世,年仅29岁

体坛周报
2026-05-13 06:33:13
临时公务豁免,鲁比奥来了,中方对其制裁仍然有效

临时公务豁免,鲁比奥来了,中方对其制裁仍然有效

雪中风车
2026-05-13 10:08:05
2000吨飞絮惹众怒,一斧子全砍了认错?专家:三大代价承受不起

2000吨飞絮惹众怒,一斧子全砍了认错?专家:三大代价承受不起

小兰聊历史
2026-04-26 11:37:23
特朗普正式启程访华,卢比奥赫格塞斯随行,我官媒一句话亮了

特朗普正式启程访华,卢比奥赫格塞斯随行,我官媒一句话亮了

DS北风
2026-05-13 11:34:05
中国队8强对手出炉!出线后至少5人获健将称号 无需高考+保送大学

中国队8强对手出炉!出线后至少5人获健将称号 无需高考+保送大学

侃球熊弟
2026-05-13 03:10:32
2026-05-13 16:11:00
PsyBrain脑心前沿
PsyBrain脑心前沿
追踪脑科学新动态,聚焦认知与神经新研究
414文章数 20关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

女生没电脑每天在电竞馆学习十几个小时 女店主:免费

头条要闻

女生没电脑每天在电竞馆学习十几个小时 女店主:免费

体育要闻

14年半,74万,何冰娇没选那条更安稳的路

娱乐要闻

白鹿掉20万粉,网友为李晨鸣不平

财经要闻

盘中最高4041.99点!创业板创历史新高

汽车要闻

4月BBA无一款车型销量破万 新能源渗透率首破60%

态度原创

教育
房产
游戏
时尚
本地

教育要闻

英伦滤镜之外:在不平等研究课堂上,直面学术体系的不平等

房产要闻

海口禁摩,3.3万名车主要慌了!

品质优先!一战FPS新作《加里波利》官宣延期至夏季

老钱风失宠了?这个风格突然爆火,夏天穿太高级了!

本地新闻

用苏绣的方式,打开江西婺源

无障碍浏览 进入关怀版