![]()
认知神经科学前沿文献分享
![]()
基本信息
Title:Three-dimensional scene boundary representations for wall orientation and distance are represented distinctly in the human visual cortex
发表时间:2026-3-25
发表期刊:PLOS Biology
影响因子:7.2
获取原文:
1. 添加小助手:PSY-Brain-Frontier即可获取PDF版本
![]()
![]()
研究背景
当我们走进一个陌生的房间时,大脑能够毫不费力地感知到墙壁在哪里、房间有多深。这种对环境3D空间布局的视觉表征,是我们能够在物理世界中自如导航的基础。在啮齿类动物中,研究者已经发现大脑利用“向量编码”(vector coding)原则来构建空间地图,即通过计算自我与边界之间的距离和方向来定位。在人类大脑中,枕叶位置区(OPA)、海马旁位置区(PPA)等场景选择区域也被证实参与了空间布局的编码。
![]()
然而,过去关于人类空间认知的大多数神经成像研究,往往依赖于高度简化的几何图形或人造3D房间作为视觉刺激。这类刺激虽然便于控制变量,却丢失了真实世界中复杂的语义上下文、光影变化和物体遮挡。反过来,现有的自然场景图像数据集虽然真实,却缺乏精确的3D布局标注,导致我们很难直接研究大脑是如何从复杂的自然图像中提取出“距离”和“方向”这两个核心边界向量的。
为了跨越这道方法学鸿沟,近期,北京大学的研究团队开发了一种基于计算机视觉的3D布局重建方法,能够从2D自然室内图像中定量估算出墙壁的相对距离、方向以及观察者的自我姿态。借助这一工具,研究者结合大尺度7T fMRI数据集(NSD)以及全新的fMRI与MEG实验,以前所未有的精度拆解了人类大脑在自然场景下表征3D边界的时空机制。
![]()
Fig 1. 展示了研究者如何通过标注自然室内图像中的关键平行与垂直边缘,结合透视原理,重建出包含墙壁方向与相对距离的3D空间布局模型。
![]()
研究核心总结
这项研究并没有停留在“哪些脑区对场景有反应”的粗粒度层面,而是将3D布局拆解为“边界相对距离”和“边界方向”两个核心特征,并揭示了它们在视觉皮层中截然不同的处理逻辑。
一、空间解离:早期视觉皮层算距离,高级脑区算方向
研究者首先利用大规模自然场景数据集(NSD)的fMRI数据进行了表征相似性分析(RSA)。为了确保结果的纯粹性,他们严格控制了图像的低级空间频率、中级纹理特征以及高级语义特征。
结果显示,沿着视觉处理层级,边界特征的表征出现了清晰的解离:初级和早期视觉皮层(V1-V3)主要负责编码侧墙的“相对距离”(即墙壁在视野中占据的相对面积比例,用于推断远近),而更高级的场景选择区域(如OPA和PPA)则专门负责编码墙壁的“方向”。这种从后部枕叶到前部枕颞叶的表征梯度表明,大脑在提取空间布局时采取了分步策略:先在早期皮层完成基于图像几何的自我中心距离估算,再在高级脑区整合出更抽象的3D结构方向。
![]()
Fig 2. NSD数据集的fMRI分析表明,在严格控制了2D视觉与语义特征后,早期视觉皮层显著表征边界相对距离,而场景选择区域显著表征边界方向。
![]()
Fig 3. Searchlight 分析直观呈现了单个被试大脑中从后部枕叶(红色,距离表征)到前部枕颞叶(绿色,方向表征)的层级递进梯度。二、自我姿态的显式编码:视觉皮层能“看”出你的俯仰角
除了环境本身的布局,成功的导航还需要大脑知道观察者自身的姿态(Self-pose)。研究者利用重建出的相机参数,测试了视觉皮层是否编码了观察者的俯仰角(Pitch,低头/抬头)和翻滚角(Roll,左右倾斜头)。
解码分析发现,整个视觉皮层(包括早期视觉区和场景选择区)都能可靠地预测出图像的俯仰角,但无法预测翻滚角。这一发现为人类视觉系统显式编码导航相关的自我姿态信息提供了直接证据。从生态学角度来看,俯仰角在垂直导航(如上下楼梯)中极为关键,且在日常视觉体验中变化频繁,大脑对此保持高度敏感具有重要的适应性意义。
![]()
Fig 4. 视觉皮层能够可靠解码出观察者的俯仰角(Pitch),但无法解码翻滚角(Roll),证实了关键自我姿态参数在视觉系统中的显式表征。三、任务调节:导航需求会动态增强早期视觉皮层的布局表征
NSD数据集中的被试进行的是简单的图像记忆任务,空间布局对他们而言是“任务无关”的。那么,当人们真正需要关注空间结构时,大脑的表征会发生什么变化?
研究者使用带有真实3D标注的Matterport3D数据集开展了新的fMRI实验,让被试分别执行“布局辨别任务”(导航相关)和“纹理辨别任务”(非导航控制)。结果发现,当空间布局成为任务核心时,初级视觉皮层(V1)对边界距离和方向的表征强度都得到了显著增强。这提示早期视觉皮层并非只是被动接收信息的“中转站”,而是会根据当前的导航需求,动态调整其对关键3D几何特征的处理精度。
![]()
Fig 5. 采用Matterport3D数据集的实验范式,对比了要求被试主动关注空间结构的布局任务与仅关注表面颜色的纹理任务。
![]()
Fig 6. fMRI结果显示,当空间布局与当前任务相关时,初级视觉皮层(V1)对边界距离和方向的表征均得到了显著增强。四、时空动态:距离计算是自动的,方向计算依赖晚期反馈
为了捕捉这种任务调节背后的时间动态,研究者使用相同的范式进行了MEG实验。时间分辨率极高的MEG数据揭示了一幅生动的动态图景:
对“相对距离”的表征出现得非常早(刺激呈现后约160-240毫秒),并且无论被试在做什么任务,这种早期表征都会自动涌现。相反,对“边界方向”的表征出现得要晚得多(约410-560毫秒及670-720毫秒),并且仅仅在被试执行布局辨别任务时才会出现。进一步将fMRI与MEG数据进行跨模态融合分析后,研究者发现,V1在晚期时间窗口的表征增强与方向特征的出现时间高度吻合。这强烈暗示,高级脑区在处理完方向信息后,通过自上而下的反馈机制(或工作记忆维持),重新塑造了早期视觉皮层的活动模式。
![]()
Fig 7. MEG结果揭示了时空分离:距离表征在早期自动出现,而方向表征在晚期且仅在导航任务中涌现。
![]()
Fig 8. fMRI与MEG的跨模态表征相似性分析提示,V1在晚期(650-750ms)的表征增强可能源于高级脑区对初级视觉皮层的自上而下反馈。
![]()
研究意义
这项工作在理论与方法学上都极具启发性。
在理论层面,它为人类空间布局感知提出了一套清晰的时空层级框架:大脑首先在早期视觉皮层快速、自动地基于2D图像特征(如墙壁占据的面积比例)估算自我中心的相对距离;随后,高级场景选择区域在更晚的时间窗口整合出边界的3D方向;最后,如果当前任务需要导航,高级脑区会将这些结构信息反馈给早期视觉皮层,以维持或增强高分辨率的空间表征。有趣的是,研究发现大脑似乎并不倾向于计算绝对的物理度量距离,而是依赖于相对的视觉几何启发式线索,这反映了生物视觉系统在计算效率与导航需求之间的巧妙平衡。
在方法学层面,本研究开发的自然图像3D布局重建技术,成功在高度控制的人造刺激与缺乏真实标注的自然场景之间架起了一座桥梁。它证明了只要辅以巧妙的计算机视觉提取手段,像NSD这样的大尺度自然图像公开数据集,完全可以被转化为研究高级空间认知机制的强大宝库。
分享人:饭鸽儿
审核:PsyBrain 脑心前沿编辑部
你好,这里是「PsyBrain 脑心前沿」
专注追踪全球认知神经科学的最尖端突破
视野直击 Nature, Science, Cell 正刊 及核心子刊与顶级大刊
每日速递「深度解读」与「前沿快讯」
科研是一场探索未知的长跑,但你无需独行。欢迎加入PsyBrain 学术社群,和一群懂你的同行,共同丈量脑与心智的无垠前沿。
点击卡片进群,欢迎你的到来
一键关注,点亮星标 ⭐ 前沿不走丢!
![]()
一键分享,让更多人了解前沿
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.