![]()
本篇采访,汪小京教授探讨了两方面内容:一是他为何认为编写一本新的理论神经科学教材的时机已经成熟,二是“分岔”(bifurcation)作为关键概念,为何在当前神经科学的解释体系中处于缺失状态。
![]()
对谈嘉宾
汪小京
纽约大学神经科学教授
汪小京教授是纽约大学神经科学教授、斯沃茨理论神经科学中心主任,原上海纽约大学创始PROVOST(首席学术官)、科研副校长。在2012年加入上海纽约大学之前,他任耶鲁大学神经生物学终身教授,耶鲁大学斯沃茨理论和计算神经科学中心主任。
他是理论与计算神经科学专家,研究重点是认知功能的脑机制,尤其以在工作记忆、决策的神经机制的研究而著称。他的团队开拓了被称为“大脑CEO”的前额叶皮质模型研究。他也是“计算精神医学”(COMPUTATIONALPSYCHIATRY)的创始人之一。最近,汪教授的团队正创建大型脑神经系统仿真模型,来深入研究认知、行为的神经网络机制和计算原理。
![]()
主持人
Paul Middlebrooks
卡内基梅隆大学的特聘助理研究员
卡内基梅隆大学的特聘助理研究员,同时是播客“Brain Inspired”的主持人。他主要研究运动皮层和基底神经节神经群体活动如何在自由行为的小鼠中支持自然行为,致力于揭示神经活动与复杂行为之间的关系。
目录:
01 神经科学研究的时代变迁
02 脑区功能分化的核心机制
03 超越马尔层级:理论范式革新
04 分岔:动力系统理论的关键补充
05 神经科学的跨界延伸:AI 与动物模型
06 高级认知与临床启示
保罗:今天的嘉宾是汪小京(Xiao-Jing Wang),他现任纽约大学(NYU)斯沃茨理论神经科学中心主任。他在中国出生并长大,之后在比利时学习了8年理论物理,研究方向包括非线性动力系统(nonlinear dynamical systems)和确定性混沌(deterministic chaos)。用他自己的话说,他从布鲁塞尔到美国加州做博士后时,经历了一连串大洗牌:语言从法语换成英语,文化从欧洲模式融入美国模式,研究领域更是从物理学转向了神经科学。
在我眼里,汪小京是非人灵长类神经生理学与理论神经科学建模领域的传奇人物,正是他,为我们后来人研究“工作记忆”、“决策”等高级认知功能的脑活动机制,奠定了坚实的基础。最近,他刚出版了新书《理论神经科学:理解认知》(Theoretical Neuroscience: Understanding Cognition)。虽然这也是一本教材,涵盖了该领域的基础知识,但它有着独特的灵魂。
具体来说,书中既梳理了认知功能建模的研究历史,也收录了当前的最新研究——从简单的基础问题到复杂的认知层面问题都有涉及。同时,这本书还带有一定的哲学思考,认为我们需要更新神经科学领域解释大脑工作机制的方法:本质上要超越大卫・马尔(David Marr)提出的“马尔层级”(Marr's levels)。取而代之的,是进入汪小京所说的“跨层级机制解释探索”阶段。
我也是刚发现,他在书里还引用了我的研究:包括我博士阶段关于非人灵长类元认知的研究,以及博士后阶段关于反应抑制的研究*。能被收录进参考文献,对我来说就是这本书“优秀且有价值”的铁证。能邀请到自己的偶像来节目,我感到非常开心,也希望大家喜欢我们的对话。
* Middlebrooks, Paul G., and Marc A. Sommer. "Neuronal correlates of metacognition in primate frontal cortex." Neuron 75.3 (2012): 517-530.
Middlebrooks, Paul G., and Jeffrey D. Schall. "Response inhibition during perceptual decision making in humans and macaques." Attention, Perception, & Psychophysics 76.2 (2014): 353-366.
![]()
▷Theoretical Neuroscience:Understanding Cognition
保罗:你的新书《理论神经科学:理解认知》,“理解认知” 这个副标题,听起来可是野心勃勃啊。这本书的内容很丰富,是别人邀请你写的,还是你自己觉得 “是时候写一本这样的书了”?
汪小京:其实我早就有写这本书的想法了,我觉得现在推出一本这个领域的新教材,正是好时机。你也知道,过去20年左右,神经科学领域有了巨大发展,主要体现在两个方面:一是新的技术手段不断涌现,由此产生了各类海量数据;二是大家逐渐意识到,或许需要让理论与建模和实验研究齐头并进,这样才能加速科学发现。与此同时,计算科学作为一个领域也已日趋成熟。综合这些因素,现在确实是推出新教材的好时候。
![]()
神经科学研究的时代变迁
保罗:如果你不介意我这么说的话,至少在我刚踏入计算神经科学领域时,你就已经是这个圈子里的传奇人物了,我想现在依然是。而且这本书是只有你一个作者,大多数教材都是多作者编写的,单从这一点来看,它就显得很特别。
我还想深入问问,你刚才提到领域发展很快,现在已经进入了大数据时代。回想我刚入行那会儿,研究还停留在“单细胞记录”的时代:动物在做任务时,我们插一根电极进去,忙活半天,最多也就记录到一两个,顶多三个神经元的活动。我对你的最初印象,也正是来自你在工作记忆领域的那些经典研究。
你很早就开始做工作记忆和决策相关的计算神经科学研究了。能不能请你回顾一下,现在的研究和你职业生涯早期相比,除了规模更大、数据更多之外,还有哪些本质上的不同?
汪小京:嗯,就像你说的,我们聊的是大概30 年前、25年前的事了。那时候,对执行任务的动物进行记录(哪怕设计的任务很有研究价值),大多都局限在一次只能记录一个细胞。你本身也在这个领域,我想你应该同意,像工作记忆、决策这类认知功能的研究,大致是在世纪之交前后才开始的。
在那之前,我们这个领域的研究重心主要集中在感觉编码、感觉信息处理,或是运动相关领域,比如昆虫的中枢部件和发生器这类课题。而在更灵活的信息处理过程中,单细跑层面究竟发生了什么,相关研究其实是在世纪之交前后才真正起步的。
比如鲍勃・德西蒙(Bob Desimone)关于选择性注意的研究,杰夫・肖尔(Jeffrey Schall)关于动作选择的研究,比尔・纽瑟姆(Bill Newsome)和迈克・沙德伦(Mike Shadlen)关于知觉决策的研究,还有Daeyeol Lee、保罗・格利姆彻(Paul Glimcher)等人关于经济决策的研究*,这些重要工作基本上都出现在那个时期。
* Desimone, Robert, and John Duncan. "Neural mechanisms of selective visual attention." Annual review of neuroscience 18.1 (1995): 193-222.
Schall, Jeffrey D., and Doug P. Hanes. "Neural basis of saccade target selection in frontal eye field during visual search." Nature 366.6454 (1993): 467-469.
Shadlen, Michael N., and William T. Newsome. "Neural basis of a perceptual decision in the parietal cortex (area LIP) of the rhesus monkey." Journal of neurophysiology 86.4 (2001): 1916-1936.
保罗:确实是这样。
汪小京:但坦白说,在我看来,这些内容此前从未以系统的方式在教材中呈现过,这也是我在这本书里试图弥补的一点。
保罗:我不知道有多少教材会引用苏斯博士(Dr. Seuss)的话,但你的书最后一章就有一句——“你满脑子智慧,双脚也充满力量,聪明如你,绝不会走上歪路。”说实话,我读苏斯博士的作品读得不太好,但你提到的这一点很关键:书的最后一章里有个表格,把你刚才聊到的内容,也就是研究认知时用到的各类实验任务,按某种层级顺序整理了出来,而且涵盖了很多常用任务。显然,这是一本内容全面又贴近前沿的书。你是不是觉得,我们对“认知类任务”的现代理解,以及相关的理论概念,之前一直没有被系统整合起来?
汪小京:没错。我认为对于计算神经科学来说,这一点非常重要。你刚才提到了“任务”,其实我作为物理专业出身的人,这对我来说也是一个很大的转变。刚开始接触神经科学时,即便我尝试构建工作记忆的模型,也完全不了解行为心理学,所以当时并没有太关注行为表现。
我想,很多从物理或数学领域转过来的人,可能都有过类似经历。那时候会觉得,“这是一个神经网络模型”,本质上就是某种物理动力学系统。我会关注无标度动力学(scale-free dynamics)、关注振荡现象(oscillations)——这些都是动力学层面的现象,却很少去思考“实验任务”本身的意义。
对我个人而言,这个转变过程其实很有意思:我逐渐开始理解心理学领域的研究传统,也慢慢意识到,研究者们是如何通过设计实验任务,来精准解答“大脑如何工作”这类具体问题的。
你也知道,计算科学本身是高度跨学科的。我每次上课都会发现,学生里总有一些来自物理或数学专业,他们对大脑一无所知;当然,也有少数生物背景的实验研究者,数学基础相对薄弱。所以我觉得,写这本书在某种程度上也是想传递一个理念:在这个领域里,关注“行为”、理解“任务设计”有多重要。
保罗:确实是这样。你在书里也反复强调了这一点。那现在从物理领域过来的学生,是不是还会像你当初那样,不了解行为层面的知识,也不关注行为或心理学相关的内容?你会不会特意跟他们强调这一点的重要性呀?
汪小京:情况因人而异。现在很多学生之所以对我们这个领域感兴趣,其实是受了人工智能(AI)和机器学习的影响。但即便如此,我觉得至少目前来看,这种情况依然存在。来自定量学科(物理、数学等)的学生,可能还是没有机会接触到“行为”和“脑功能”背后丰富的内涵。
保罗:关注人工智能的人可能更在意基准测试(benchmarks),这和“行为”是两回事。我不确定这算不算一种细微差异,你怎么看?
汪小京:没错,确实是这样。这本质上还是和 “表现”有关,对吧?
保罗:表现——这词确实挺笼统的,但你说的对,是这么回事。
汪小京:但具体是“什么的表现”呢?我觉得不同人关注的点不一样。另外还有个我觉得很有意思的点,某种程度上,我们谈论大脑时会有点前后矛盾。当然,我们都知道,不同的心理过程、不同的脑功能,在一定程度上依赖大脑的不同区域。比如视觉、听觉、运动行为对应的脑区,我们都有明确认知。但很多时候,当我们泛泛谈论“神经元计算”,比如讨论大脑与人工智能的关系时,却常常把这一点抛在脑后,不再强调“功能特化”的重要性。
保罗:你是说“模块化”(modularity)吗?
汪小京:对,类似模块化的概念。比如你可以做个调查,问问普通大众,甚至人工智能研究者:他们对视觉系统的腹侧通路和背侧通路了解多少?要知道,腹侧通路可是卷积神经网络的最初灵感来源。这两条通路有什么区别?为什么会有这些区别?该如何解释这些区别?我敢说,真正深入思考过这些问题的人恐怕不多。
这就是我刚才说的“前后矛盾”——我们明明知道脑区功能不同,却很少深入探讨:大脑不同区域究竟是如何实现不同功能的。这本质上就是“模块化”要解答的问题。你能理解我的意思吗?
保罗:能。我现在立刻就想聊工作记忆的问题。在我印象里,你最知名的研究就是关于工作记忆的。而且回顾你过去的成果,会发现你在很多领域都很有建树。你之前提到过,大脑里有很多环路、很多区域,都存在“工作记忆类型的活动”,也就是你认为的、属于工作记忆范畴的环路活动。这似乎和你刚才聊的“模块化”能对应上。你觉得工作记忆是阐释“模块化”的好例子吗?
汪小京:当然是,绝对是个好例子。你知道,神经科学研究中,我们通常会先从脑损伤患者身上获得线索——也就是大脑特定区域受损的患者。之后,再通过严谨的损伤研究(lesion studies)进一步验证。这类研究指出,比如前额叶皮层(prefrontal cortex)在工作记忆中发挥着关键作用。也正因为如此,像福斯特(Fuster)和帕特里夏・戈德曼-拉基奇(Patricia Goldman-Rakic)这样的学者,才会在执行工作记忆任务的动物大脑中,向前额叶皮层植入电极进行记录。
这种研究设计很巧妙:以延迟反应任务(delayed response task)为例,实验不会让动物在接收到刺激后立刻做出反应,而是要求它先在工作记忆中“记住”刺激信息,在延迟期内对信息进行处理,之后才能做出“记忆引导的反应”。
保罗:没错。或许我们可以这样定义工作记忆:它不仅是一种临时记忆,还包含在这种临时存储阶段内进行的信息处理。
汪小京:正是如此。关键在于,工作记忆不受外界环境直接支配,是一种内在的脑活动过程。当你观察到工作记忆相关信号时,会发现它们并非由外部输入直接驱动,这是在“主动在脑中记住信息”的阶段产生的。这一点和初级感觉神经元(比如接收刺激就产生反应)形成了鲜明对比,很有意思。
保罗:我们的整个大脑都具有高度丰富的循环连接,这类(工作记忆)信号其实在大脑中随处可见,只是在某些区域会更显著。你可以聊聊这一点吗?
汪小京:要解答这个疑问,需要从多个角度入手。而且说实话,这至今仍是个未解之谜,甚至可以说,它已经成为当前领域的核心问题之一。我展开给你说说原因:和我们之前聊的 “一次只能记录一个神经元”不同,现在有了像神经元像素探针(Neuronpixels)这样的技术突破,研究者已经能在执行任务的动物身上,同时记录多个脑区的数千个神经元活动。之后人们会用不同方法分析这些数据,比如解码不同脑区神经元活动中所编码的信息。
结果发现,居然在很多脑区都能解码出工作记忆信号。这一点非常有意思,它表明工作记忆具有“分布式”特征,但同时也带来了困惑:我们能提出一连串问题,却暂时找不到答案。比如,当在某个脑区观察到这类信号时,我们不知道它是如何产生的,也不清楚背后的原因。
就像你说的,脑区之间存在大量相互作用。举个例子,通过对初级皮层的连接组学测量发现,约67%的潜在连接实际存在。具体来说,如果大脑有n个区域,每个区域理论上能和其他(n-1)个区域形成长距离连接,总潜在连接数就是n×(n-1),而其中约67%是真实存在的。在小鼠大脑中,这个比例更高,有研究称达到了95%甚至97%。
保罗:这我还真不知道,太有意思了。等等,这是不是意味着,在分类谱系的“更高层级”(比如非人灵长类和人类灵长类)中,大脑的模块化程度更高?而小鼠的大脑则更均质化?
汪小京:确实有这种可能。当然,影响因素还有很多,但单从连接组学数据来看,这个推测是成立的。毕竟在小鼠脑中,几乎通过一两个突触的连接,就能从任意一个区域到达另一个区域。举个极端点的例子:
或许工作记忆本质上只依赖少数几个核心脑区,但由于脑区间的相互作用,其他区域会接收来自核心脑区的投射信号,进而也表现出工作记忆相关的活动。从理论上来说,这种可能性是存在的。
接下来我们自然会从功能层面追问:这些“非核心区”的信号是无用的干扰,还是有实际功能?我认为大脑会根据行为需求,找到利用这些信号的方式。目前,在新数据的推动下,研究者已经开始着手探索这些问题了。
保罗:没错,这种冗余性确实很有意思。冯・诺依曼(Von Neumann)曾提到过,冗余性是大脑的一个特征,简单来说,如果你传递多份信息副本,就能降低噪声干扰。你刚才说的内容,还让我想到大脑的能量效率其实很高:如果核心区域之外存在这些“额外活动”,或许实际上并不会消耗太多成本。
汪小京:有道理,但问题是,如果初级视觉皮层(V1)中也存在记忆信号,大脑该如何利用这些信号呢?
保罗:确实,我正想问这个,那工作记忆的核心到底在哪个位置呢?
汪小京:顺便说一句,其实我也没有完全确定的答案。冗余性固然有不少好处,比如抗干扰,但我还想提一点:刚才说的这些现象,或许可以结合拉什利(Lashley)提出的“等势性理论”(equipotentiality)来理解。你应该记得,他的研究认为——切除大脑越大的区域……
保罗:切除的大脑区域越大,(功能影响)反而越接近?对,我记得这个理论。
汪小京:没错,他认为大脑不同区域在功能上或多或少是等效的。但我其实并不认同这个观点,这也正是我们面临的谜题。我们一直在努力研究,并尝试提出解决方案。要理解这个谜题,需要先明确两个前提:第一,大脑存在大量长距离连接。顺便说一句,在我看来,这也是神经环路和物理系统最根本的区别之一——物理系统中的相互作用通常是局部的。
保罗:你说的“物理系统”具体指什么?
汪小京:比如分子之间的相互作用,要么是碰撞,要么是化学反应,都属于局部相互作用。但大脑环路完全不同,它的长距离连接能让信号传递到各个不同区域——这是第一个前提。第二个前提,是“标准环路”(canonical circuits)的概念。
保罗:你说的是芒卡斯尔(Mountcastle)提出的“皮层标准微环路”(canonical microcircuitry in the cortex)吧?
汪小京:正是。戴维・休伯(David Huber)、托尔斯滕・威塞尔(Torsten Wiesel),还有后来的凯文・马丁(Kevin Martin)、罗德尼・道格拉斯(Rodney Douglas),都对这个理论有贡献。这是一个非常精妙的原则:本质上,皮层是由“相同的神经组件”构成的,相当于把相同的局部标准环路重复排列。
保罗:这么说,如果我们能弄明白其中一个微环路的功能,就能解开整个皮层的工作原理了?这可是个大目标。
汪小京:一点没错。而且这个原则在不同物种中都适用,从啮齿类动物到猴子,再到人类。这是个极具说服力且精妙的理论,很多人都认同它。但问题来了:如果同时认可这两个前提,要解释“模块化”就变得非常不简单了。对了,需要说明的是,“模块化”这个词的用法其实很灵活,比如研究图论的学者在分析神经网络,甚至大脑连接组时,对“模块化”的定义就和我不一样。
保罗:你是说,他们指的是物理结构层面的模块化,对吧?
汪小京:是的,也就是网络科学(Network science)中的定义。在图论分析中,人们会默认所有“节点”(对应脑区或神经元)的本质是相同的,差异只存在于输入和输出的连接上。
保罗:不过,节点之间的连接方式也有差异,比如小世界网络(small world network)等,但核心还是……
汪小京:没错,核心还是输入和输出的不同。每个节点的输入、输出连接不同,但节点本身是相同的。从这个角度看,它和“皮层局部标准环路”的理念其实有点像。当然,不同领域的人对“模块”“模块化”的定义确实不一样,我需要先澄清这一点。
我所说的“模块化”,指的是“功能模块化”,比如存在一个专门负责工作记忆的模块。但结合之前的前提,矛盾就出现了:如果假设大脑不同区域由“相同的神经组件”构成,且通过密集网络相互连接,那这些区域究竟如何实现功能分化呢?这才是真正的谜题。
保罗:我知道你对此有一些思路。其实要解释清楚,或许并不需要太复杂的理论。不如你给我们讲讲,这种功能分化可能是如何实现的?
汪小京:目前我们还没有确定的答案,但过去这些年,我们确实在努力构建模型来探索这个问题。
![]()
脑区功能分化的核心机制
保罗:理论上,我觉得我们其实有答案了,答案就是,并非所有皮层柱(cortical columns)都完全相同,因为它们表达的蛋白质存在差异。即便这些差异很细微,也能让不同皮层柱产生不同的功能。
而且模块化本身,还有连接方式本身,比如一个皮层柱接收来自14个不同区域的输入,另一个皮层柱只接收其中12个区域的输入,再加上某个独特区域的输入。就像你之前说的,单靠输入-输出结构的差异,就能实现功能分化。我还以为你接下来就要聊这个呢。
汪小京:这个思路很好。确实有人认为,“标准环路”理论虽然有吸引力,但并不充分,或许皮层不同区域本质上就不一样。当然,我们也能观察到各种差异:如今,无论是转录组数据(transcriptomic data)、连接组数据,还是其他各类数据,都指向这个方向,也就是说,“皮层各区域完全相同”的说法其实并不成立,大脑中存在大量异质性(heterogeneities)。
不知道你是否了解这一点:以灵长类动物的皮层为例,其中包含兴奋性神经元(比如锥体细胞,pyramidal cells)和抑制性神经元。在初级视觉皮层(V1)中,约15%的神经元是抑制性的,85%是兴奋性的;而在前额叶皮层(PFC)中,抑制性神经元的比例其实是V1的两倍。
保罗:说到前额叶皮层,如果把大脑看作一个前馈式输入-输出系统,那前额叶皮层应该处于皮层层级的顶端吧?
汪小京:没错。前额叶皮层(PFC)位于大脑前部、眼睛正上方的皮层区域,长期以来它的功能都很神秘。直到近几十年,我们才逐渐意识到它对认知功能和行为执行控制的重要性,有时它也被称为大脑的“首席执行官”(CEO)。我想把它和V1这样的初级感觉皮层做个对比,两者的差异其实非常显著。
保罗:嗯,你刚才提到的抑制性神经元比例就是一个大差异,V1是15%,那前额叶皮层具体是多少呢?
汪小京:30%。
保罗:30%?人们总说“兴奋-抑制平衡”(excitation-inhibition balance)是神经功能的关键,那这个比例差异对两个脑区的功能来说意味着什么呢?
汪小京:目前大家还在努力探索这个问题的答案。我们团队也做了一些研究,试图解答这个疑问。如果你不介意的话,我可以稍微展开讲点细节,我觉得这些内容对你的听众来说可能会很有意思,原因有几个。
我们之前聊到过工作记忆:当我们尝试构建工作记忆模型时,我们担心的是大脑如何忽略干扰信号?当你需要在脑中记住某个信息时,要忽略那些不相关的干扰信号其实很难,这些干扰可能是外部刺激,也可能是需要抑制的内部杂念。
这件事要追溯到20年前,我们在2004年发表过一篇相关论文*。机缘巧合的是,当时我和一位来自匈牙利的解剖学家塔马斯・弗洛因德(Tamás Freund)聊过这个话题。我们之前一直认为,抑制性神经元的作用是靶向兴奋性神经元、调控兴奋性神经元的活动。但他告诉我,他们团队刚发现了一组“不作用于锥体细胞”的抑制性神经元,这些神经元完全不靶向兴奋性神经元。这一发现连他自己都很意外。最初是在海马体中观察到的,后来又发现了更多解剖学证据,结果表明:这类不作用于锥体细胞的抑制性神经元,其实靶向的是另一类抑制性神经元。
* Wang, X-J., et al. "Division of labor among distinct subtypes of inhibitory neurons in a cortical microcircuit of working memory." Proceedings of the National Academy of Sciences 101.5 (2004): 1368-1373.该论文首次在计算模型中明确了不同类型的中间神经元(树突靶向 vs 胞体靶向)在维持工作记忆和抗干扰中的不同功能。
保罗:是和它们自身不同类型的抑制性神经元吗?
汪小京:是第二类抑制性神经元。而这第二类抑制性神经元,靶向的是锥体细胞的树突(dendrites),它们实际上在调控进入锥体细胞的信号流。如果这类抑制性神经元活性很强,就会直接“阻断”进入锥体细胞的信号通路。
保罗:这是为了实现稀疏性(sparsity)吗?还是为了高效编码机制?你提到了海马体,而海马体的某些区域确实需要稀疏性,但——
汪小京:我们最初是在海马体中发现这类“不作用于锥体细胞”的神经元,但我认为它们的核心功能可能是“门控”(gating)——这也让它们有了明确的分类名称。这类神经元可以通过特定生物标志物识别,比如以VIP(血管活性肠肽)或钙视网膜蛋白(Calretinin)为标记物,我们所说的“靶向特定神经元的抑制性神经元”指的就是它们,明白吗?
保罗:明白。
汪小京:至于第二类抑制性神经元,可以用生长抑素(somatostatin,简称SOM)作为标记物,它们的作用靶点是锥体细胞的树突。如果这类SOM神经元活性增强,就会直接阻断进入锥体细胞的信号;但如果某种情况下,第一类VIP神经元被激活,它们就会抑制SOM神经元的活动,进而“打开”信号传递的闸门。
保罗:原来是这样,这就是“去抑制”(disinhibition)的概念吧?不过我到现在还是有点绕不过来,虽然基底神经节回路中经常出现这种机制。
汪小京:确实是这样。
保罗:毕竟是“去抑制”嘛(负负得正),总需要花点时间理解。
汪小京:没错。不过我们刚才聊的这类机制,更侧重于针对锥体细胞树突、调控输入信号的过程。我们团队构建的模型中,其实包含了三种抑制性神经元:除了刚才说的VIP和SOM神经元,还有第三种,它的作用是直接控制锥体细胞的spike输出(即动作电位输出)。
简单总结一下:SOM神经元负责调控“输入信号”,另一类以小白蛋白(parvalbumin,简称 PV)为标记物的神经元,负责调控锥体细胞的 “输出信号”。这种包含三种抑制性神经元的 “神经环路基序”(motif),我不知道现在有多少人真正了解,它最早是在我们2004年的建模论文中提出的理论概念。
如今,借助基因工具,研究者已经证实,这种神经环路基序在整个皮层中基本是普遍存在的。不过回到你之前的问题,或许皮层不同区域,对“输出控制”和“输入控制”的需求本就不同。
你想想初级视觉皮层(V1):它的输入来源可能比较少;但前额叶皮层(PFC)的锥体细胞,会接收大量来自不同区域的输入信号。或许正因为如此,PFC需要比早期感觉皮层更多 “负责输入控制的抑制性神经元”,而实际研究结果也确实如此。不同脑区中,“输入控制型” 与“输出控制型”抑制性神经元的比例,差异非常显著。
保罗:抱歉我稍微回溯一下,抑制性神经元的比例,从初级视觉皮层(属于早期视觉皮层区域)的15%,上升到前额叶皮层的30%,这个比例是沿梯度线性增加的吗?
我们已知一个现象:从早期感觉皮层到前额叶皮层,脑区处理信息的时间尺度会越来越长,我猜这可能和抑制性神经元的比例有关。但这个比例是会出现突变,还是就沿这个轴(脑区层级)逐步增加呢?
汪小京:这是个很好的问题。当人们说大脑存在大量异质性时,关键在于如何量化这种异质性:它是类似高维分布的随机差异,还是会沿着某个低维轴呈现出系统性变化呢?
我们团队和约翰・默里(John Murray)等研究者,用不同类型的数据(包括抑制性神经元比例、转录组数据等)来探究这个问题,结果发现答案是后者。实际上,大脑的生物学特性会沿着特定低维轴发生系统性变化,我们现在称之为“微观梯度”(microscopical gradient)。
顺带提一句,这里有两个需要区分的要点:一是抑制性神经元相对兴奋性神经元的比例,二是在抑制性神经元内部,负责“输入控制”和 “输出控制”的神经元各自所占的比例。
总之,这些特性都呈现出非常规律的微观梯度,这一点很有意义,因为能被量化,有具体数值,我们就能据此构建模型。这种大规模模型目前还处于较新的阶段,但前景很好。构建时,我们不会凭空设计连接方式,而是基于连接组学测量数据,搭建多区域的大规模模型(比如猕猴皮层模型)。
之后,我们会引入突触兴奋和抑制的梯度差异,确保不同皮层区域呈现出梯度化的特性差异。从数学角度来说,这意味着每个局部区域可以使用相同的方程,而异质性则体现在:即便方程相同,方程中的参数值也会有所不同。这种方法很严谨,能帮助我们构建受生物学约束的模型。
保罗:抱歉我插个题外话,听你说话的时候,我突然意识到,你很早就进入这个领域了。现在我想到神经科学,会觉得“哦,现在好像全是计算神经科学的天下了”,但你刚开始做研究的时候,情况完全不是这样,当时计算神经科学的内容非常少。你可以说是最早把理论观点、数学模型引入神经科学的人之一。
你能不能回想一下,我理解的情况对吗?现在神经科学真的变得“全是计算导向”了吗?你会觉得自己当初的选择是正确的吗?你刚进入神经科学领域时,会不会觉得“这些做生物学的人只是在收集数据(像集邮一样),我要改变这种现状”?那时候的情况是怎样的?你当时在做这些研究时,会不会觉得孤单呀?
汪小京:谢谢你的认可。我在上课的时候,有时会跟学生说,任何领域都有先驱者。比如构建了霍奇金-赫胥黎模型的霍奇金(Hodgkin)和赫胥黎(Huxley),还有像约翰・林泽尔(John Rinzel)、威尔(Will)、巴顿(Barton)、南希・科佩尔(Nancy Kopell)这样的应用数学家。但从领域发展来看,计算神经科学真正起步,可能要等到数据收集积累到一定阶段,再加上戴维・马尔(David Marr)这类从功能视角出发的研究者,推动了用数学模型理解大脑工作机制的理念。
保罗:对。我过会儿再问你戴维・马尔的事,先接着刚才的话题,你是说,这个领域的起步,是等到数据收集达到一定程度之后?
汪小京:嗯,或许我可以换个角度表述。至少在我看来,当系统神经科学发展到一定阶段(比如出现了芒卡斯尔、休伯、威塞尔等研究者的成果)之后,人们才开始运用数学工具。而且,这一过程可能还结合了数学心理学的方法,比如运用信号检测理论(signal detection theory)、点过程(point process)等,于是开始用数学工具来分析(神经数据)。
保罗:没错。那时候的模型都很简单,哦,我不该说“简单”,但确实是非常“小”的模型,对吧?你会把它们称为“小模型”吗?
汪小京:对。之后,人们又用信息论来量化编码过程;还有像伊芙・马德(Eve Marder)这样的研究者,为了探究运动行为背后的节律机制,开始运用动力系统理论(dynamical systems theory)。这些都是计算神经科学早期的例子。
再回头看,霍奇金-赫胥黎模型、罗(Roe)和林泽尔的研究,更多聚焦于神经元生理学,这个领域本身一直都很注重定量分析。我自己的背景是动力系统理论和统计物理,不过有点机缘巧合的是,我很早就进入了前额叶皮层的研究领域。
保罗:你说“机缘巧合”,具体是怎么回事呀?
汪小京:确实有点偶然。我转做神经科学研究时,是在加州大学伯克利分校沃尔特・弗里曼(Walter Freeman)的实验实验室工作。不知道你是否了解,他的父亲是那个因做额叶切除术而声名狼藉的人。
保罗:哦,还真不知道。是“声名狼藉”那种是吧?
汪小京:对,声名狼藉。他父亲实际上做过数千例额叶切除术,还会开着车——
保罗:就是那种“冰锥额叶切除术”(ice pick frontal lobotomy)吗?
汪小京:没错。他父亲会开车穿梭于各个州,提供这种手术作为“治疗手段”。约翰・肯尼迪(John Kennedy)的妹妹罗斯玛丽・肯尼迪(Rosemary Kennedy),就是他做的额叶切除术。
保罗:居然是他做的。沃尔特・弗里曼(儿子)是他的儿子?
汪小京:对。
保罗:天呐。那你知道沃尔特・弗里曼(儿子)是怎么看待他父亲这些事的吗?
汪小京:我不记得我们当时有没有聊过这个话题了。不过不管怎样,我从那时候开始听说了前额叶皮层(PFC),也意识到它可能对理解精神病学有重要意义。尽管——
保罗:这也太有意思了。你会研究前额叶皮层,居然是因为以前有人在“切除”前额叶皮层,而且某人的父亲还在主动“去除”这个被认为“不重要”的脑区,结果你反而觉得“这脑区说不定很重要”。
汪小京:确实是这样。而且罗斯玛丽・肯尼迪的情况很悲惨:她23岁时做了这个手术,结果彻底失败了,之后完全无法正常生活。
保罗:哦,是的。我对她的情况了解不多,但听说那次手术对她的影响特别大,后果很严重。
汪小京:没错。她之后在机构里住了五十多年,这是个很惨痛的例子,也说明当时我们对前额叶皮层的功能一无所知。后来我到了匹兹堡,情况才有了变化。
我在匹兹堡开始了第一份教职,在那里认识了戴维・刘易斯(David Lewis)。是他从科学的角度给我介绍了前额叶皮层,我也是从他那里了解到,前额叶皮层对精神病学很重要,因为显然所有主要的精神疾病,或多或少都与前额叶皮层功能异常有关。也是通过他,我认识了帕特里夏・戈德曼-拉基奇(Patricia Goldman-Rakic),之后才真正进入这个领域的研究。
保罗:原来如此。我插一句——帕特里夏・戈德曼-拉基奇,我学工作记忆相关知识时,也学到过她的研究:她记录了执行工作记忆任务的猴子前额叶皮层的神经活动。以前学的内容是,存在这样一种单细胞:当猴子在工作记忆中“记住”某个信息时,这个细胞会产生持续性活动(persistent activity)。
具体来说,当没有刺激输入、猴子需要在脑中 “记住”信息时,这种单细胞就会开始活跃;而且会一直保持活跃,直到猴子得到响应指令,需要根据工作记忆中的内容做出反应。这就是当时关于工作记忆的经典研究结论。
汪小京:对。另外,还有一些研究者也做过相关工作,比如日本的福斯特(Foerster)和渡边(Watanabe),但戈德曼-拉基奇的研究有其独特性,她不仅在自己的实验室里,还尝试通过多种方法,从不同层面去理解工作记忆的机制。
正如你所说,他们团队会在工作记忆任务中做单细胞记录(single-unit recording),但除此之外,她还做脑成像研究、体外脑片(in vitro slice)实验;她本身也是解剖学家出身,还做了大量解剖学分析。我觉得这正是她最独特的贡献:通过多种研究手段,综合探究(工作记忆的)机制。
![]()
超越马尔层级:理论范式革新
保罗:好的,你这么一说,正好让我想回到大卫・马尔(David Marr)的话题上。咱们来聊聊 “跨层级机制” 吧。你的教材有个独特之处,它不只是一本普通教材,更像是在呼吁一种研究大脑的新范式。
我们这个播客之前聊过很多次大卫・马尔,不过还是先简要回顾一下,你之前也提到过他,他提出的研究框架在神经科学领域很流行,核心是教我们如何理解大脑、如何解释大脑活动。他著名的“马尔三层级”理论具体是这样的:
首先是计算/功能层级,关注“任务是什么”“认知活动的目标是什么”;其次是算法/表征层级,研究“大脑要完成这个任务,需要执行哪些步骤”;最后是实现层级,回答“神经元如何行动、如何执行这些算法、完成这个任务”。
你在书的第一章就明确提出,现在我们应该 “超越马尔层级”,为什么这么说呢?
汪小京:或许我可以先从大卫・马尔理论的逻辑背景和历史背景说起。他提出这三个层级是在20世纪80年代初,顺便提一句,这个理论其实是他和汤米・波焦(Tommy Poggio)一起提出的。
保罗:波焦啊,我之后打算邀请汤米来节目呢。对。
汪小京:好啊,到时候可以问问他。我和他聊过这个话题,很有意思。我觉得他们提出这个理论,主要有两个出发点。
第一个是,坦白说,当时的神经生物学家不太关注“行为”,很多人都在研究单个神经元如何工作、突触传递如何进行,这类研究大多用体外脑片(in vitro slice)实验,而脑片实验里根本不存在“行为”这个概念。
保罗:确实是这样。这么说的话,那种研究有点像“收集数据(集邮)”,不过——
汪小京:就是“集邮式”研究,和行为完全不挂钩。而且即便当时有人做在体(in vivo)记录,也大多是在麻醉动物身上进行的。
保罗:这种研究不会关注动物的行为,只是想弄明白“这些神经组件是怎么运作的”,这本身是很有价值、也很有必要的研究。
汪小京:绝对是必要的。我想,大卫・马尔和他的同事们觉得,或许可以用一种“互补性方法”:不那么纠结于“实现层面”,先专注研究行为。比如他们会想,“视觉研究很难,那怎么理解立体视觉呢?不如先从定量定义‘立体视觉是什么’开始,这就是功能层面的研究;然后再尝试提出一些数学算法,也就是软件层面的研究”。
保罗:对,不管底层是由什么构成的,是大脑组织也好,计算机硬件也罢,先搞清楚“怎么实现这个功能”。
汪小京:没错,而“底层构成”就是第三个层面,也就是硬件(实现层级)。对了,第二个出发点带点社会学因素,听汤米说,当时有不少人认为“只要搞懂分子生物学,就能理解大脑的一切”。
当时确实有这种倾向。所以大卫・马尔才会说,“我们可以基于行为本身的价值去研究它”,这个观点很有道理。不过我觉得,随着时间推移,我们得去 读他的原始著作才能准确理解;但可能有些研究者理解得比较“朴素”,把大卫・马尔的“三层级”当成了一种“单向层级关系”,认为“功能层级最重要,其次是软件(算法)层级,要是还有兴趣,最后再考虑实现(硬件)层级”。
保罗:现在大家确实都这么理解,但这是不是 “误读”呢?这种理解会不会已经成了“流传的说法”,偏离了原意?
汪小京:我倒不觉得……你还记得吗?刚才你描述“马尔三层级”时,提到“实现层级”,用的词是“只是硬件层面”。
保罗:我这么说了吗?不过从文化氛围来看,我确实一直被这种“单向层级”的理解影响着。没错。
汪小京:其实我想提一个观察:如果有人真的只关注“功能”,比如人工智能领域的研究者,那他们应该会注意到,如今人工智能系统的核心工具,以前是卷积神经网络、深度神经网络。
保罗:现在应该是Transformer(转换器)了吧,不过上一代(AI核心)是卷积神经网络。
汪小京:最初其实是深度神经网络,深度神经网络属于“软件”层面,但它的最初灵感,其实来自我们对视觉系统“硬件”(指神经结构)的认知。
保罗:这一点在AI领域至少是被严重低估了。
汪小京:正是从视觉系统的神经结构(硬件)中获得的启发,才让杨立昆等人开发出了这种(卷积神经网络)架构。
保罗:还有福岛邦彦(Fukushima)也是(该领域的先驱)。
汪小京:没错。我可以举很多这样的例子。我想说的是,从神经科学中汲取灵感这件事,我们其实还没做完。尤其是在前额叶皮层,或是视觉系统背侧通路这类领域,还有很多可挖掘的空间。不过还有一点我不太确定:有人认为 “同一种软件(算法)可以用各种不同的硬件(物理载体)来实现”,这种思路的实际价值到底有多大。
保罗:你说的是“功能主义视角”吧?对,有这种观点。
汪小京:对。这种观点部分源于“大脑与计算机类比”的思路。比如人们会说,“图灵机既可以用老式真空管实现,也可以用芯片实现”。但事实上,我不确定这种类比是否真的适用于大脑功能。
保罗:什么?你是说图灵机的实现方式?理论上这不应该是成立的吗?
汪小京:图灵机的情况确实成立。但我想说的是“大脑功能”,我不确定(“软件-硬件分离”的思路)在多大程度上适用于大脑。而且我也不确定,这种思路对脑科学研究来说,到底有多大帮助、多大价值。或许“将大脑与计算机类比”的这个方向,本身就不是那么有趣、那么有用。
保罗:你一直都这么认为吗?还是因为你是早期计算神经科学家,某种程度上,“把大脑当作计算机来研究”成了你的核心工作,所以才会有这种想法?
汪小京:其实我更倾向于把大脑看作一个“动力系统(dynamical system)”。
保罗:哦,那我之前的理解可就有点偏差了。
汪小京:至少在我看来,大脑和计算机的区别可以再展开说说。不过不管怎样,如果你真的关心“大脑如何工作”,我认为我们现在需要一个新的神经科学研究框架,这也是我在书中试图阐述的内容。可惜书的篇幅有限,只能简要提及,之后有机会我很乐意更详细地展开这个观点。
简单来说,现在我们已经有了足够多的数据,而且“跨层级研究”是切实可行的。30年前大卫・马尔提出理论时,可能还做不到这一点,但现在不一样了。我们确实有义务利用转录组、连接组等领域的海量数据,去理解大脑功能。
保罗:这正是大家的理想目标。不管是从功能到实现的“自上而下”研究(这是我们对马尔理论最普遍的理解),还是从实现到功能的“自下而上”研究,马尔理论的核心思路都是“保持各层级独立,无需跨层级研究”。而你认为,现在正是开展“跨层级机制研究”的时候,对吗?
汪小京:我不知道马尔是否真的说过“无需跨层级”,但我觉得他说“可以基于每个层级自身的价值去研究”是合理的。
保罗:嗯,这么表述更准确。
汪小京:对,而且这种思路确实有价值、很重要。但就像之前说的,随着时间推移,可能有人误解了,或者说用过于简单的方式理解了这个理论——把它当成了一种“单向层级关系”,我认为这种理解现在来看不一定有成效,具体还是看研究目标。我只是想强调:“现在跨层级研究确实可行了”。
我可以举个例子:“在工作记忆中忽略干扰信号”属于功能层面的问题,但实际上,包含三种中间神经元的“去抑制性神经环路基序”,不只是“实现层面”的细节,它更是一种能解释“信号门控”机制的特定神经环路。从这个角度看,跨层级研究是能做到的。至少它具备可行性,至于要不要做,就看研究目标了。我认为很多时候,这种研究方式是值得尝试的。
不介意的话,我再结合自己的经历举个例子:关于工作记忆模型的构建。你可能会好奇,我后来怎么又研究起决策机制了,其实这事某种程度上也是偶然。
保罗:这次总不是额叶切除术的缘故了吧。
汪小京:主要是当时研究遇到了瓶颈,是我自己的瓶颈。工作记忆信号的表征理论认为,信号是通过神经环路的“循环交互”在内部维持的,不像初级视觉皮层(V1)的神经元那样受外部刺激驱动。这就好比你我现在对话:只要声音足够大(不用小声嘀咕),即便没有外部干扰,我们也能一直聊下去。这就是循环交互的逻辑。
假设我们就是神经元,这就是“神经回响”(reverberation)的核心思路。通过这种“循环兴奋”,神经元能维持特定活动状态,从而实现不受外界环境干扰的工作记忆,这是我们当时试图定量验证的核心假设。
但构建模型时,问题来了:我们必须调高模型中的“兴奋强度”,可结果要么无法得到稳定的活动状态(没法形成工作记忆环路),要么兴奋强度过高导致“系统崩溃”,出现“失控性兴奋”(runaway excitation)。这时候就会想:“或许该同时调高抑制强度,通过兴奋-抑制平衡来解决?”
可一旦调整,“时间”和“动力学特性”就成了新的关键。当时人们普遍认为“兴奋反应速度很快”,但即便在模型中加入“兴奋比抑制快”这个生物学细节,问题还是没解决,这就像一个工程系统的困境:如果你有工程背景就会知道,要是系统里有“反应极快的强正反馈”,再搭配“反应较慢的强负反馈”,根本没法稳定运行。那段时间我卡了好几个月,尝试了各种方法:突触短期易化、突触短期抑制、神经适应等等,都没用。
保罗:你说“卡了好几个月”?建模不是调调参数、跑个程序就能看到结果吗?
汪小京:这就是外行人容易误解的地方。我很幸运能和帕特里夏・戈德曼-拉基奇这样的实验学家合作,有时候会半开玩笑地跟他们说:“建模是需要时间的。”真不是调个参数就能搞定的。
保罗:我懂了。我是实验背景出身,以前总羡慕做建模的人,觉得你们出结果很快,看来根本不是这么回事。
汪小京:总之最后我意识到:“如果让兴奋反应比抑制慢,会不会就没这个问题了?”让神经回响缓慢渐进,同时用快速抑制持续、高效地调控它。这么调整后,模型居然成了!这也引出了一个关键观点:“缓慢神经回响依赖NMDA受体”。而现在发现,这种“缓慢神经回响”恰好能解释决策相关的生理学观测结果*。
罗伊特曼(Roitman)和沙德伦(Shadlen)做过一个著名实验*:当动物执行高难度决策任务时,神经元及神经元群体中会出现“渐进式攀升活动”(gradual ramping activity),正是通过这种活动,大脑会积累“支持不同选项的信息”。
* Wang, Xiao-Jing. "Synaptic basis of cortical persistent activity: the importance of NMDA receptors to working memory." Journal of Neuroscience 19.21 (1999): 9587-9603.
Roitman, Jamie D., and Michael N. Shadlen. "Response of neurons in the lateral intraparietal area during a combined visual discrimination reaction time task." Journal of neuroscience 22.21 (2002): 9475-9489.
保罗:我先给不太了解的听众解释一下,这就是著名的“随机点运动任务”(random dot motion task),核心是“随机运动一致性”。你可以想象盯着一个屏幕,上面满是点,其中一部分会朝同一个方向运动。我们可以通过多种方式调整任务难度,比如改变“朝特定方向运动的点的比例”,你的任务就是判断这些看似随机的点到底在往哪个方向动。抱歉打断一下,我只是想确保大家都能跟上思路。
汪小京:完全没错。这个实验的精妙之处在于,你可以通过“参数化调整”(改变朝两个方向中任一方向同向运动的点的比例),精准控制任务难度。
保罗:难度可以从“超级简单”调到“完全无法判断”,而且能以很小的幅度逐步调整。神经科学里用来解释这种行为的理论是“神经活动向阈值渐进攀升”,就像大脑在“积累证据”,直到证据量达到某个阈值,而神经活动的表现看起来就像是在执行这个“证据积累”的计算过程。
汪小京:对极了。当你降低点的同向运动比例、让任务越来越难时,无论是在单细胞层面,还是如今用神经元像素探针(neuropixel)记录的群体层面,都能观察到这种“随时间渐进的攀升活动”。顺便说一句,很有意思的是,这种算法和二战时艾伦・图灵(Alan Turing)破译恩尼格玛密码(Enigma code)用的算法,本质上是同一类。
保罗:他当时可不知道什么NMDA受体。
汪小京:确实不知道。但说实话,我们当时把 “原本为工作记忆设计的模型”拿出来,直接用到这个“点感知决策任务”上时,结果很意外——模型几乎能解释实验中观察到的所有现象。这背后是模型的“双特性”:一方面,通过缓慢神经回响实现“渐进式攀升”,这属于“慢瞬态动力学”(slow transient dynamics),和 “吸引子”之类的机制无关;另一方面,模型还能实现“赢家通吃”,最终做出明确的分类选择*。
我觉得这又是一个“跨层级研究”的例子:最终解释行为的,是动力系统理论描述的“涌现性群体动力学”(emergent collective population dynamics)。你既可以往下追溯,探究“背后的细胞受体机制是什么”;也可以往上对比,把模型表现和猴子的心理物理学数据做对照,现在这些都能做到了。
* Wang, Xiao-Jing. "Probabilistic decision making by slow reverberation in cortical circuits." Neuron 36.5 (2002): 955-968.
Wong, Kong-Fatt, and Xiao-Jing Wang. "A recurrent network mechanism of time integration in perceptual decisions." Journal of Neuroscience 26.4 (2006): 1314-1328.
![]()
分岔:动力系统理论的关键补充
保罗:我最后想问问“分岔”(bifurcation)的问题。初级视觉皮层(V1)也有抑制性神经元,只是比前额叶皮层少;V1也有较强的循环连接,可能比前额叶皮层弱一点。但从性质上来说,为什么V1没有工作记忆功能呢?它和前额叶皮层的机制看起来类似,只是时间尺度更快。是不是存在一个“临界点”,过了这个点,神经活动就能脱离感觉刺激的依赖(形成工作记忆)?
汪小京:你问的其实就是“分岔”的问题啊。
保罗:看来我确实是在问这个。
汪小京:对了,我正在给The Transmitter写一篇文章。标题大概是《动力系统理论中“缺失的另一半”》——这“缺失的另一半”就是分岔。现在动力系统理论在神经科学领域越来越常见、越来越流行了。
保罗:你本身就是这个领域出身的。那它是不是曾经冷门过一段时间,现在又重新兴起了?你怎么看动力系统理论现在的流行趋势?
汪小京:我觉得它的流行本质是“数据驱动” 的。就像我们之前聊的,以前一次只能记录单个神经元的spike序列,那时候研究可能更关注时间序列分析;但现在能同时记录数千个神经元的活动,这时候该怎么做研究呢?
保罗:以前的方法肯定不管用了。是啊,该怎么做呢?
汪小京:有一批研究者开辟了新方向,比如吉勒斯・洛朗(Gilles Laurent)最早在小型物种上做相关研究,后来克里希纳・谢诺伊(Krishna Shenoy)和他的合作者也做了很多工作。现在神经科学期刊上,满是关于“状态空间轨迹”(trajectories in the state space)、“降维”(dimensionality reduction)、“子空间通信”(subspace communication)、“流形发现”(manifold discovery)的论文,这就是动力系统理论流行的原因。这些方向确实非常重要,但说实话,现在还处于早期阶段,不过能看到这些进展还是很让人兴奋的。
保罗:你觉得现在还处于早期?
汪小京:我认为是早期,一方面是因为未来还会有更多数据,我们对“流形”这类概念的理解还没完成;另一方面更关键的是,目前的研究还偏“描述性”,只是用这种方法观察数据,还没有达到“机制性理解”的层面。
保罗:不过当我们讨论“维度”时,其实已经隐含了一些机制性理解吧?比如,如果一个系统无法用低维度解释,就说明它必然处于高维状态。从这个角度来说,这不算是机制性理解吗?
汪小京:不算。但“维度相关的认知”确实是很重要的知识,也能帮我们理解一些现象。比如你提到的稀疏编码(sparse coding),有证据表明感觉系统确实需要稀疏编码;而我和斯特凡诺・富西(Stefano Fusi)合作提出*,前额叶皮层(PFC)其实更需要“高维表征”,这依赖于我们所说的“混合选择性”(mixed selectivity),从功能角度看这种设计是合理的。这些确实能帮我们理解大脑功能,但还不算“机制性理解”。
* Rigotti, Mattia, et al. "The importance of mixed selectivity in complex cognitive tasks." Nature 497.7451 (2013): 585-590. 该论文证明了神经元对多个任务变量的非线性混合编码(混合选择性)对于大脑产生高维表征、从而实现灵活的认知任务至关重要。
保罗:我补充一句,“混合选择性”指的是神经元可以对多种不同信号产生反应,或者说它们的活动不单一对应某一种功能,而是可能与多种功能相关——本质上是对“多种事物”都有选择性。
汪小京:这种特性对神经环路的“灵活性”可能至关重要,而它需要高维表征的支撑。我同意你的观点,这确实很重要。但我说的“机制性理解”,本质还是“跨层级的环路机制”。比如,有人提出“脑区间的通信通过子空间实现”,这个发现本身很有意思,但我们更想知道“这一过程具体是如何发生的”。
保罗:“子空间”这个概念确实有点抽象。我自己虽然经常用这个术语,也觉得用着顺手,但真要解释清楚“子空间到底是什么”,我其实也说不太明白。
汪小京:这确实是个值得深入聊的话题,或许之后有机会再展开。不介意的话,我再举个例子,稍微深入点技术细节,还是和“前额叶皮层依赖的行为灵活性”有关。心理学家布兰登・米尔纳(Brandon Milner)设计了一个经典范式来测试前额叶功能,叫“威斯康星卡片分类任务”。任务是这样的:给你一副卡片,每张卡片上都有不同数量、颜色和形状的图案,你需要按三种规则中的一种分类,要么按颜色,要么按数量,要么按形状。
比如一张卡片是“三个绿色三角形”,另一张是 “四个红色正方形”。如果当前规则是“按颜色分”,你就把所有红色卡片放一堆,绿色卡片放另一堆,以此类推。关键是,规则会在你没被告知的情况下突然改变,这时候你需要用同样的卡片,按新规则重新分类。
保罗:也就是通过观察和反馈来学习新规则。
汪小京:对,只能通过观察结果和“对错反馈” 来调整。比如精神分裂症患者,或者前额叶受损的人,做这个任务会很困难,尤其是规则切换时,他们会“固执地”沿用旧规则,哪怕一直得到“错误”的反馈。我们为这个任务构建了模型*,核心需求是“大脑要能在长时间内维持当前规则,且在需要时切换规则”。
直接说建模结论吧:我们发现,不同规则对应的神经群体活动,会分布在“不同的子空间” 中,这些子空间大致是正交的。比如按“颜色规则”分类时,所有信息处理都在“颜色子空间” 里进行;按“形状规则”时,就切换到“形状子空间”。我们设计这个模型,也是为了验证“特定靶向性抑制性神经元(即之前提到的生长抑素神经元,SOM神经元)负责信号门控”的猜想。
首先,我们在模型中观察到了“正交子空间表征”的现象;然后,模型的优势在于可以做各种模拟操作。比如我们在模型中模拟“光遗传学”抑制。
* Parker, Andrew J., and Kristine Krug. "Neuronal mechanisms for the perception of ambiguous stimuli." Current opinion in neurobiology 13.4 (2003): 433-439.
Masse, Nicolas Y., et al. "Circuit mechanisms for the maintenance and manipulation of information in working memory." Nature neuroscience 22.7 (2019): 1159-1167.
保罗:明白,是模型里的模拟操作,不是真的光遗传学实验。
汪小京:对,就是模型仿真。当我们在模型中 “抑制生长抑素神经元”后,两个正交子空间就 “坍塌”了,模型的任务表现也完全消失了。
这就是我想说的“从流形描述到环路机制”。我们不仅观察到了“子空间(流形的一种)”这种描述性现象,还找到了对应的“抑制性神经元门控”机制,甚至能提出具体预测。比如可以找研究者,让他们训练小鼠做这个任务,然后用真正的光遗传学技术去抑制生长抑素神经元,验证模型的预测。
我希望这个例子能说明,如何在“描述性现象” 和“环路机制”之间建立联系。现在,我们可以回到“缺失的另一半”了吧?
保罗:好,聊聊“分岔”(bifurcation)。
汪小京:“分岔”这个概念,很多人可能有所耳闻,但并非所有人都熟悉,不过它其实应该被更广泛地了解。有个大家都能理解的例子,就是单个神经元的活动。回想一下你学过的知识:霍奇金-赫胥黎模型描述了神经元对注入电流的反应。如果注入的电流较弱但为正值,神经元膜电位会小幅上升,然后达到一个稳态,这和实验中观察到的现象一致。比如在脑片实验中,你单独观察一个神经元,给它注入弱电流,就能看到膜电位发生去极化。
保罗:是小幅去极化,没错。
汪小京:在霍奇金-赫胥黎模型中,这种状态对应“稳态”,也就是数学上所说的“不动点(fixed point)”。接下来,如果你逐渐增大注入电流的强度,到某个临界点时,稳态会突然消失,取而代之的是神经元以特定频率重复产生动作电位。
保罗:对,就是给细胞注入强度足够高的恒定电流时会出现这种情况。
汪小京:这时细胞状态就不再是稳态了,数学上把这种现象描述为“振荡”,专业术语叫“状态空间中的极限环”。它属于“吸引子”的一种,意思是如果短暂干扰这个系统,干扰消失后,系统会回到状态空间中原来的轨迹,像在状态空间里(这里指单个细胞的活动空间)循环运动一样。而你所做的,其实只是逐渐改变了一个变量(这里是注入电流的强度)。
保罗:比如线性增加,你可以线性调整这个电流,对吧?
汪小京:对。这种“线性、渐进的定量变化”,最终能导致“行为的定性变化”。如果用严谨的数学语言描述这个过程,就称之为“分岔”。
想必你也很了解“吸引子网络”的应用——比如用于解释位置细胞(place cells)、网格细胞(grid cells),还有我们研究的工作记忆。这些现象本质上都是“涌现性集体现象”,只需要适度调整某个变量(比如我们之前聊到的循环兴奋强度),就能出现。这正是分岔概念的精妙之处。
对比初级视觉皮层(V1)和前额叶皮层(PFC):两者都基于通用的“局部标准环路”,你要做的只是调高前额叶皮层中“循环兴奋”的强度,就能突然观察到“吸引子状态”的出现。顺便说一句,这是早期研究得出的核心洞见。
保罗:我本来是想在你提到“涌现”这个词时,问问分岔和涌现的关系,毕竟分岔是一种定性变化,但还是你先把思路说完吧。
汪小京:那我先提一句,神经科学领域早期就有人提出过这类想法,比如著名的约翰・霍普菲尔德(John Hopfield),还有丹尼尔・阿米特(Daniel Amit)——他在“吸引子网络范式” 的研究中做了很多开创性工作。我认为这就是分岔概念在神经科学中有用的例子之一,但它的重要性还没有得到应有的广泛认可。
保罗:你觉得现在动力系统理论的主流研究中,分岔概念是缺失的吗?它没有被足够重视吗?为什么你说它是“缺失的另一半”?分岔和状态空间中的“相变”有什么关系?
汪小京:两者是相关的。从广义上来说,它和物理学中的“相变”很像。比如水:当你把温度升到100摄氏度,水会突然汽化,H₂O的状态发生了突变。分岔和这个过程类似:都是“从定量变化到突然的定性转变”。我觉得神经科学领域应该更广泛地了解这个概念。我们也用分岔的思路来理解“模块化的涌现”——之所以说 “涌现”,是因为这种模块化不是预先设计好的,甚至不是图论意义上“预设模块”的结果,而是真正通过动力学过程自发产生的。
保罗:也就是“自下而上”产生的?
汪小京:是通过动力学产生的,没错。另外,连接组确实很重要,看到这么多新的连接组数据库问世也很令人兴奋,比如基于连接组的果蝇导航系统模型,就是个很好的例子。但仅靠连接组,还不足以解释动力学和功能。我在书里举过一个例子:从两个“通过互抑连接”的神经元开始,会产生什么结果?通常会形成“半中枢振荡器”——一个神经元活跃时,另一个就不活跃,然后两者交替切换。
这种结构可能是“中枢模式发生器(central pattern generator)”的基本单元,但意外的是,在某些突触相互作用的动力学条件下,这种“互抑连接”居然能让系统产生“完美的同步振荡”。这说明,要真正解释功能,必须结合动力学分析。所以在我看来,分岔的价值在于:如果我们想理解“大规模多区域系统中功能模块化的涌现”,分岔概念会非常有用。我再举个例子,让“功能模块化”的意思更清楚些吧。
我们之前聊过决策任务,比如那个“随机点运动任务”。想象一个高难度试次:点的运动非常随机,支持“向左运动(选项A)”的证据非常微弱 ——
保罗:几乎就是偏向向左运动了。
汪小京:没错,但你的主观判断却是“向右运动”,你会说“我觉得是向右”。这时候大脑里发生了什么?视网膜会忠实地编码物理刺激,所以视网膜层面应该有更多支持“向左”的证据。初级视觉皮层(V1)可能也是如此,负责运动信息处理的专门视觉脑区MT区(middle temporal area)或许也是这样。
保罗:就是你之前提到的那条背侧通路(dorsal stream)里的脑区。
汪小京:但到了某个脑区,信号会突然变成 “主观决策相关”的,有些脑区仍在编码“向左” 的物理刺激(一直传递A信号),而另一些脑区却在说“不对,我觉得是向右”(传递B信号)。正是这些脑区,决定了你的主观选择。
保罗:最终信号会传递到运动神经元,驱动动作执行。而在“物理刺激编码”和“运动执行”之间的某个环节,信号方向发生了翻转。
汪小京:我认为这就属于“主观选择相关的功能模块化”问题,我们可以把“负责主观选择的功能模块”定义出来。再回到我之前说的:大脑有标准环路,有复杂的相互作用,通过一两个突触就能连接任意脑区,那“专门负责主观选择的功能模块”是怎么涌现出来的?我们认为,“空间分岔”或许能解释这个过程。
保罗:这听起来好像分岔是个很敏感的概念。你之前提到过伊芙・马德(Eve Marder),她研究龙虾这类生物的节律性味觉模式,得出的核心结论之一是“实现同一结果的路径有很多”,存在大量“简并性”和“多重可实现性”。我在想,这和你说的“分岔”该怎么兼容?你认为分岔是系统中非常有价值的机制,能实现状态空间的翻转、本质上是相变;但她的研究显示,即便你尝试触发分岔,系统在很多不同条件下都能维持在同一“相”里。我们该怎么理解这种矛盾?
汪小京:这个问题很有意思。其实这更关乎 “冗余性”,生物需要让某些功能在“环境变化、受到干扰”时仍保持稳健。确实有人把伊芙的发现解读为“多重可实现性”,认为同一功能能通过不同方式实现,但这种解读其实有点简单化了。伊芙后来的研究表明,螃蟹和龙虾生活在不同环境中,比如气候变化会导致水温变化,她其实写过一篇关于“气候变化如何影响这些生物节律”的论文。
保罗:她来过我的播客,对这个话题特别有热情。她在自己居住的海边就能观察到这种现象。
汪小京:没错。这其实是在说“冗余性的价值”,但回到分岔的话题,或许我这么说有点极端,但如果往深处想,分岔可以看作是“产生功能新颖性的数学工具”。怎么解释“功能新颖性”?当然,生物进化是根本答案,但如果给定 “相同的神经组件”(比如标准局部回路),怎么解释大脑不同区域有不同的功能?或许,你只需要让某些生物学参数发生“定量差异”就够了。
保罗:用相同的组件,“量变引发质变”。
汪小京:完全对,但这里的“不同”,是“定量差异带来的定性不同”。
保罗:是微小的定量差异。
汪小京:对,就是微小的差异。当然,这还需要整个领域(不只是我的实验室)共同推进研究,验证这个想法是否成立。如果成立,我们或许能找到一种通用方法,理解不同类型的脑功能。我再补充一点关于“稳健性”的内容:“空间分岔”有意思的地方在于,它其实不需要精细调控。对比一下之前说的“单个神经元”例子:你需要小心调整注入电流的强度,才能刚好触发分岔,偏左或偏右一点,都观察不到分岔现象。
从这个角度看,要达到“转变临界点”,确实需要精细调控,得靠实验者手动调整变量。但 “空间分岔”不一样,它是在皮层组织的某个位置自然发生的。
保罗:情况一定是这样吗?它会不会不是发生在某个特定位置,而是分布式的?比如你觉得它发生在皮层的这部分,或者那部分?或许这个问题本身没什么意义。
汪小京:不,这个问题很有意义,只是目前我们还没完全搞懂。顺便说一句,“空间分岔”目前还只是个理论假设,仅此而已。我们必须提出“可实验验证的具体预测”才行。比如,如果你把大脑皮层看作一个二维空间系统,那分岔转变会发生在哪个位置?如果你的问题是“分岔转变的边界在哪里”,那我也不知道答案。
保罗:对,我问的就是这个。
汪小京:关键在于,这种分岔必然具有局部性,因为它需要能区分“参与工作记忆的脑区” 和“不参与的脑区”。反过来想,如果分岔是 “全脑分布”的,那工作记忆就会“无处不在”,但我持相反观点:大脑中确实存在负责工作记忆的模块,它并非在全脑均匀分布。至少从这个角度出发,我们可以看看这个观点能否与现有数据兼容、能否解释数据。而要支撑这个观点,就需要“局部化的空间区域”来区分、定义这个模块。另外,你刚才问起“精细调控”,我再补充一点。
保罗:好。
汪小京:这种空间中的转变具有很强的稳健性。即便你改变模型中的任何参数,比如在真实大脑系统中,转变发生的具体位置可能会偏移,但“转变”这个现象本身,并不需要对参数进行任何精细调控。你能理解吗?
保罗:能。这和“如何定义脑区”有关。你是说,模块的边界可以移动,而且不需要精确到 “是100个神经元还是101个神经元在执行功能”这种程度。
汪小京:甚至可能不需要精确到“脑区”这个层面。比如根据行为需求,某些脑区在有些任务中参与工作记忆,在另一些任务中就不参与。理论上,这个边界可以...
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.