Concepts as Semantic Pointers: A Framework and Computational Model
作为语义指针的概念:一个框架与计算模型
https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265
摘要
基于原型、范例和类理论结构的概念理论的调和是认知科学中的一个长期问题。针对这一问题,研究者们最近倾向于采用混合理论,将各种类型的表征结构结合起来,或者采用消除理论,用更精细的心理表征分类来取代概念。在本文中,我们描述了一种替代性方法,涉及一种名为“语义指针”的单一类别的心理表征。语义指针是由感知、词汇和运动表征的压缩与递归绑定所产生的类似符号的表征,有效地整合了传统联结主义和符号主义方法。我们提出了一个使用语义指针的计算模型,该模型复制了涉及每种先前范式分类研究的实验数据。我们认为,涉及语义指针的框架可以为概念现象提供统一的解释,并将我们的框架与现有替代方案在概念的范围、内容、递归组合和神经实现方面进行了比较。
关键词:概念;分类;神经计算;语义学;计算建模;心理表征
1. 引言
概念的研究在近期认知功能理论的发展中发挥了核心作用。从分类到语言使用,各种现象都可以通过概念加工来有效地描述(参见Murphy, 2002的综述),并且许多有影响力的认知发展描述都是基于假设概念是我们对世界知识的基本表征单元而产生的(例如,Carey, 1985, 2009;Tenenbaum, Kemp, Griffiths, & Goodman, 2011)。然而,尽管概念对认知科学的持续研究显然具有重要意义,但研究者们对概念在大脑中的结构和表征方式有着截然不同的观点。
这种分歧的主要原因是,不同学科的理论家有着众多且有时相互冲突的解释目标。例如,心理学家通常希望解释涉及分类和概念学习等任务的实验数据(例如,Lin & Murphy, 1997;Regehr & Brooks, 1993;Rips, 1989;Smith & Medin, 1981)。而哲学家则通常希望理解概念的语义和拥有条件(例如,Fodor, 1998;Laurence & Margolis, 1999;Peacocke, 1992;Prinz, 2002)。即使在达成一致的解释目标时,需要解释的数据范围往往过于庞大且分散,难以发展出统一的理论(Murphy, 2002)。例如,仅凭原型理论、范例理论或概念理论理论的个体资源,无法全面解释分类现象(Rogers & McClelland, 2004)。
为了应对这一僵局,研究者们最近倾向于采用两种一般策略之一。第一种策略涉及提出“混合”或“多元”模型,其中单个概念对应于多个相关或共指的表征结构,这些结构用于解释不同现象(Laurence & Margolis, 1999;Murphy, 2002;Weiskopf, 2009)。第二种策略则相反,主张在认知科学的词汇中用更精细的心理表征分类取代“概念”一词,这些表征各自具有不同的功能(Machery, 2009)。这两种方法的相对优劣是当前争论的主题(Machery, 2010),但可以说,这两种观点都没有获得广泛的支持。
在本文中,我们提出了一个替代性的、统一的解决方案,以应对当前概念研究中的挑战。利用用于表征神经系统中表征状态的方法(Eliasmith, 2003, 2013;Eliasmith & Anderson, 2003),我们用涉及一种最近被假设的心理表征类别——“语义指针”(Eliasmith, 2013)的过程来描述概念。粗略地说,语义指针是神经实现的、类似符号的表征,可以通过多种方式转换以产生进一步的表征,这些表征支持分类、推理和语言使用等认知过程。值得注意的是,语义指针已成功用于解释目前世界上最大的功能性人脑模型中的一系列感知、认知和运动行为(Eliasmith et al., 2012)。然而,过去的工作并未详细探讨语义指针与概念现象的相关性。因此,我们的目标是展示基于语义指针的建模框架可以为概念理论家传统上感兴趣的那类现象提供统一的解释。为了支持我们的观点,我们描述了一个生物学上合理的脉冲神经元模型,该模型处理语义指针以解释用于支持三种竞争性概念理论(原型理论、范例理论和理论理论)的分类实验数据。
2. 概念理论的标准
尽管用于评估概念理论的标准常常存在争议,但人们普遍承认某些认知功能是典型的概念性功能。例如,语言使用、推理以及命题态度的形成只是众多被明确界定为涉及概念操作的认知任务中的一部分。因此,我们将从认为概念理论应当解释这些概念功能是如何实现的观点出发。然而,除了这些功能解释之外,还应当提供某些理论解释。例如,应当解释概念如何能够在从抽象到普通的种类之间变化,以及它们如何能够指代现实世界中的对象群体。鉴于这些考虑,我们提出以下标准作为对概念加工的令人满意的解释的最低要求(参见Barsalou, 1999;Fodor, 1998;Laurence & Margolis, 1999;Prinz, 2002):
1. 分类
2. 递归绑定
3. 神经实现
4. 范围
5. 内容
当然,还可以选择其他标准,但我们选择了这五个标准,原因很简单,它们似乎捕捉到了大量概念现象的共同属性。例如,分类任务在有关概念的文献中被广泛研究(Murphy, 2002),并且在某些情况下会调用背景知识,以推理的形式将对象属性与类别成员身份联系起来。因此,合理地认为涉及推理和语言的其他概念过程的描述可以部分地被理解为更复杂的分类形式。由于这些以及相关的原因,我们在模拟中只关注分类效应。
对于任何概念加工的解释来说,对绑定的解释也是一个重要的目标:它既涉及包含多个概念的组合结构的形成(例如,LARGE RED DOG),也涉及类别实例的多模态表征的整合。绑定已经吸引了许多对心理表征结构感兴趣的研究人员的广泛关注(例如,Jackendoff, 2002),因此我们认为这是一个相对没有争议的约束条件。
关于神经实现,当然,说概念过程是神经过程多少有点老生常谈。但由于神经过程的性质可能限制了认知系统能够轻松计算的函数类型(Eliasmith & Anderson, 2003),因此,任何特定认知模型所描述的函数是否确实可以被神经实现仍然是一个悬而未决的问题。因此,采用神经实现标准表明,其他条件相同的情况下,对特定模型的实现展示将极大地有利于该模型。
至于更具理论性的标准,范围指的是不同种类概念的广泛多样性。概念包括可感知对象(例如,TABLE)的概念、抽象概念(例如,VIRTUE)、理论假设(例如,GENE)、数学术语(例如,SUM)以及不存在的实体(例如,CENTAUR)等(Prinz, 2002)。一个好的理论应该能够解释这些不同类别的概念,并且应该与将特定神经系统和解剖区域与这些类别加工相关联的现有证据保持一致。例如,对患有语义缺陷的神经病学患者的研究表明,具体实体和抽象实体的概念是在不同的神经系统中加工的(Shallice & Cooper, 2013)。
最后,概念是关于事物的,这意味着它们具有内容或意义。这种内容反过来可以大致定义为一个给定概念如何描述它所代表的事物。一个充分的理论必须解释为什么一个给定的概念指称某些事物而不是其他事物(即,提供其外延的解释),并且还必须解释为什么这个概念以某种方式而不是其他方式描述这些指称对象(即,提供其内涵的解释)。关于心理表征的语义和个体化问题的哲学文献为采用这一标准提供了动机(例如,Fodor, 1987, 1998;Peacocke, 1992;Prinz, 2002)。
总结来说,前三个标准涉及概念功能的性质和实现,而后两个标准涉及使这些功能得以实现的表征的理论属性。我们的框架旨在满足这些标准,尽管我们对前三个标准的讨论旨在更加全面,而对后两个标准的讨论则旨在更具启发性。为了开始详细发展框架,我们首先描述神经表征和计算的原则,这些原则推动了我们许多论点的形成。
3. 神经表征与计算
尽管人们普遍接受心理表征是神经系统的特征,但当前的认知建模方法通常不会用高度详细的神经术语来描述表征。例如,符号主义方法通常用基于类似语言的语法结构的原子表征来定义计算(例如,Fodor, 1975),很少甚至从不考虑神经细节。联结主义方法则使用大量个体处理节点之间的加权连接来描述表征(例如,Rogers & McClelland, 2004; Rumelhart & McClelland, 1986),但这些模型仅粗略对应于大脑的结构,且忽略了真实神经元的生理属性、动态属性和连接方式等许多重要细节。
我们倾向于采用一种用大量单个脉冲神经元的活动来描述表征和计算的方法。更具体地说,我们采用了Eliasmith和Anderson(2003)开发的神经工程框架(NEF)。根据该框架,脉冲神经元的活动模式可以用数学对象(如向量,即一组数值)来描述,这些向量反过来可以捕捉有关世界的信息(通过神经元对环境刺激的调谐)。通过指定两个或多个神经元群体之间的突触权重集合,可以计算这些向量的转换,包括将多个向量绑定在一起以在向量空间中嵌入复杂层次结构的转换。因此,NEF有时被描述为一种将基于向量的算法翻译成神经脉冲语言的编译器(见Eliasmith, 2013)。对于我们来说,以这种定量方式描述神经系统的活动有两个显著优势。首先,已有成熟的技术可以将各种词汇、感官和运动表征转换为向量(Georgopoulos, Schwartz, & Kettner, 1986; Jones & Mewhort, 2007; Plate, 2003),因此向量具有足够的表征能力来解释概念表征的多模态性质(参见Barsalou, 1999)。其次,涉及向量的计算可以实现强大的递归绑定形式(Gayler, 1998; Kanerva, 1994; Plate, 2003; Smolensky, 1990),鉴于即使是简单概念也与大量内容相关联,绑定的解释可能是开发合理概念加工模型的关键。
在NEF中,可以通过一种称为循环卷积的过程来实现绑定(Eliasmith, 2004, 2013)。撇开数学细节不谈,循环卷积可以被视为一种将两个输入向量混合成一个相同维度的输出向量的函数。实现这一功能相对直接:如果两个“输入”神经元群体分别代表一个向量,并且连接到一个中间群体,该中间群体投射到一个“输出”群体,那么可以使用NEF求解这些群体之间的突触权重集合,从而使输出群体编码一个向量,该向量是两个输入向量的卷积。这个过程可以无限重复,并且也可以逆转,以恢复递归生成结构中绑定的任何一个向量的近似值。总体而言,NEF具备描述涉及多种神经表征的复杂句法操作(包括组合和分解)的所有工具。NEF的神经表征和计算原则相结合,描述了一种非常强大的表征类型,Eliasmith(2013)将其称为“语义指针”。我们以语义指针的概念为起点,开发一种能够满足第2节中提出的全部五个标准的概念解释。
4. 语义指针
在其最基本的形式中,语义指针可以被看作是一种压缩表征,捕捉关于特定领域的摘要信息。通常,这类表征源自感知输入。例如,视野中一个物体的图像最初会被编码为大量神经元群体的一种活动模式。然而,通过上述类型的转换,进一步的神经元群体层会产生关于原始视觉输入的越来越抽象的统计摘要(见图1)。最终,可以产生一个高度压缩的输入表征。这种描述既与视觉皮层中较晚层次神经元数量的减少一致,也与受神经启发的用于降维的层次化统计模型的发展一致(Hinton & Salakhutdinov, 2006; Serre, Oliva, & Poggio, 2007)。类似的表征也可以在其他模态(如听觉和触觉)中生成。
之所以将这种压缩表征称为语义指针,是因为它们通过压缩过程与所表征的状态非任意相关,从而保留了关于这些状态的语义信息。之所以称这些表征为指针,是因为它们可以用来“指向”或再生压缩网络中较低层次的表征(Hinton & Salakhutdinov, 2006)。此外,任何一个给定的语义指针都可以独立于生成它的网络进行操作。例如,一个关于桌子的感知的语义指针可以在与桌子相关的认知任务中使用,而不一定引发相关压缩网络底部更丰富的感知表征的重新激活。
语义指针的计算能力在于它们能够通过压缩操作(如循环卷积)被绑定在一起,形成包含来自多种来源的词汇、感知和运动信息的高度结构化表征。重要的是,这些结构化表征本身也是语义指针,因为它们可以指向并再生它们所构建的下属表征。再次考虑桌子这个玩具示例。通过已经描述过的递归绑定(这是一种压缩操作),关于桌子的视觉和触觉图像的语义指针可以被结合起来,同时还可以结合关于“桌子”声音的听觉图像的指针和关于字母“t-a-b-l-e”的视觉图像的指针。此外,各种对应于诸如“有一个平面”或“用于吃饭”等语言信息的结构也可能被绑定在一起。这些结构本身也将由其他语义指针构建而成,包括压缩后的关于平面、用餐场景等的视觉图像。总体而言,这些众多绑定操作的结果是一个单一的表征,它捕捉了与桌子相关的广泛内容之间的关系。这个单一表征可以通过多种方式转换,以重新访问桌子的图像、关于桌子的语言信息,或者通常用于与桌子互动的运动指令。
此时,语义指针在解释概念现象方面的高度适用性应该已经显而易见。它们可以解释以单一对象类别为中心的符号过程、感知模拟以及许多其他功能。换句话说,它们可以作为一个类别事物的摘要表征,而这正是概念通常被认为所具有的功能。使用语义指针已经成功地进行了诸如简单语言推理(Eliasmith, 2013)、归纳推理(Rasmussen & Eliasmith, 2011)和基于规则的问题解决(Stewart & Eliasmith, 2011)等概念任务的神经模拟,以及能够执行多种认知功能的大规模脑模型(Eliasmith et al., 2012)。基于这些成功的应用,我们认为语义指针的概念为解释广泛的概念现象提供了理想的基础。
5. 概念作为语义指针
人们可能会倾向于声称概念就是语义指针。然而,我们避免这种理论表述,原因很简单:语义指针在孤立状态下无法满足所有期望的标准。回想一下,语义指针只是一个由神经元群体的脉冲活动编码的向量。这个向量捕捉了其他各种表征之间的关系,并且可以通过多种方式转换以访问这些表征,但向量本身并不具备普通概念所具有的完整语义内容。因此,与其将语义指针视为等同于概念的实体,不如将其视为使概念得以发生的基础实体。
在我们的观点中,概念最好被视为一种倾向性(dispositional)的存在。拥有一个概念意味着能够激活各种神经状态序列,这些序列对应于围绕单一类别的视觉和听觉模拟、自然语言表达以及运动指令等。这些过程中的相关神经状态是由语义指针的转换产生的,并且在任何给定的概念发生场合中,只会有有限范围的可能转换得以执行。换句话说,构成给定概念发生的神经过程是依赖于情境和任务的(Barsalou, 1999)。例如,涉及语言推理的概念任务将激活与涉及触觉刺激分类的概念任务不同的神经状态(见图2)。同样,涉及“狗”这一概念的认知任务可能在一个个体中唤起对大型动物的视觉模拟,而在另一个个体中唤起对小型动物的模拟。阐述这一理论的部分任务是解释影响这种情境多样性的因素。尽管如此,我们的观点是,这些构成概念加工的各种神经状态都源自一个共同的起点,即语义指针的转换。
鉴于这种描述,重要的是要考虑我们的观点与最近发展起来的“新经验主义”理论之间的明显相似性,这些理论将概念加工等同于部分重新激活之前捕捉到的感知状态(例如,Barsalou, 1999; Barsalou, Simmons, Barbey, & Wilson, 2003; Barsalou, Santos, Simmons, & Wilson, 2008; Prinz, 2002)。例如,Barsalou(1999)将概念等同于“模拟器”或有组织的类别特定感知符号系统,这些符号可以被选择性地转移到工作记忆中。正如人们可能预期的那样,这种将符号转移到工作记忆的过程与通过转换语义指针来访问详细感知表征的过程高度相似。同样,Prinz(2002)声称概念是“代理型”(即“可以通过工作记忆招募来表征类别的感知派生表征”)(第149页),这与我们关于概念作为部分对应于感知模拟的过程的观点有许多共同之处。
语义指针框架与这些新经验主义理论之间存在两个显著差异。首先,语义指针理论与非模态表征的存在是一致的。例如,对应于词汇项的语义指针可以包含关于相关项在某些语境中共现的非模态统计信息(Eliasmith, 2013)。在缺乏感知表征的情况下访问此类信息可以解释在某些需要验证词语与属性之间匹配的任务中的反应时间(例如,Solomon & Barsalou, 2004)。此外,鉴于通常被用来支持严格经验主义理论的论据和证据的争议性(Machery, 2007),以及存在证据表明具体和抽象概念是在至少部分分离的系统中加工的(Shallice & Cooper, 2013),我们认为语义指针框架在这一问题上的中立性是一种优点。
其次,我们提出的观点对概念的实际表征方式提供了不同的解释。新经验主义理论通常将概念等同于(1)模拟器(即有组织的感知符号系统)或(2)模拟(即工作记忆中的临时表征)。第一种选择的问题在于,它在如何执行功能方面没有明确说明(Dennett & Viger, 1999)。语义指针框架通过将概念发生与神经过程等同起来,并以独立动机的神经计算原则和下面描述的基于模型的实现来机械地描述这些过程,从而解决了这一不足。第二种选择的问题在于,它意味着每个特定模拟的实例都对应于一个独特的概念。如果是这样,那么一个人可以拥有多个指代单一类别的概念,并且由于在不同时间产生完全相同的模拟的可能性很小,因此很少会两次唤起同一个概念。如果没有解释为什么这些模拟形成了不同的概念(或者如果它们不是不同的概念,为什么它们是相关的),那么这个理论就会显得模糊和不精确。我们的观点通过假设一个共同的底层神经机制来统一单一概念的多样化发生,从而避免了这个问题。
语义指针框架与通过梯度下降训练以关联各种模态特定表征(例如,感知、语言描述等)的联结主义模型之间的相似性也很明显,这些模型通过中介的非模态语义表征来关联这些表征(Rogers et al., 2004; Roy & Pentland, 2002; Rumelhart & McClelland, 1986)。两个关键特征区分了我们的方法。第一个是我们提供的表征绑定的解释。学会关联表征的联结主义模型没有递归绑定表征的手段,因此也没有解释复合概念或具有句法结构的表征的手段。第二个是,通常使用一种局部编码形式,其中个体处理节点被认为代表独特的语言谓词和感知特征。这种编码违反了实现标准,因为这些节点与神经基质之间的对应关系没有被明确说明。
由于上述所有原因,我们提出我们的观点为满足第2节中介绍的标准提供了一种有前景的新方法。然而,在重新回到根据这些标准对理论进行评估之前,我们首先描述了一个基于语义指针的模型,该模型能够解释原型理论、范例理论和理论理论对概念的重要特征。尽管这个计算模型并不全面,但它很好地初步展示了基于语义指针的框架对概念现象提供统一解释的潜力。
6. 模型描述
我们的建模工作集中在三项典范的分类研究上。第一项研究由Posner和Keele(1968)进行,表明当受试者学习对通过干扰各种原型模式生成的点阵图案进行分类时,他们会抽象并利用有关相关原型的信息。第二项研究由Regehr和Brooks(1993)进行,证明在某些情况下,基于相似性的分类策略可以取代更具分析性的策略。第三项研究由Lin和Murphy(1997)进行,研究了背景知识对涉及相同视觉刺激的分类决策的影响,这些刺激在不同的功能描述下被分类。这三项研究共同记录了分类效应的广泛多样性。
我们提出了一种单一的模型架构,该架构在解释这些不同效应时不会发生变化。从功能上讲,该模型以对应于压缩自然图像的向量作为输入,并输出对应于运动反应的向量。所有中间处理过程都使用大约30万个模拟的漏电积分-发放(LIF)神经元来实现,并且在每次模拟中都使用128维向量。关于LIF神经元如何用于编码、解码和转换向量的详细信息可以在补充材料的A部分找到。
在更具体的层面,模型架构包括一个工作记忆系统、一个动作选择系统,以及两个进一步的子系统,用于对输入刺激进行感知和推理评估(见图3)。工作记忆存储编码视觉范例和定义类别成员资格的软规则的语义指针。动作选择系统控制如何从这些语义指针中提取信息,并以任务依赖的方式操纵输入刺激。从解剖学上讲,动作选择系统被映射到基底神经节和丘脑的部分区域,而其他子系统则被映射到皮层。这些解剖学映射主要受到其他研究工作的启发(Eliasmith, 2013; Eliasmith et al., 2012),在目前的研究中,最好将它们视为合理的假设。模型的功能性是我们的主要关注点,在下面报告的模拟中,我们没有使用模型以一种独立证明这些映射的方式解释神经数据。
在每次实验中,模型首先接收一个视觉输入,提示当前的实验任务,然后是一个需要分类的刺激。根据提示,动作选择系统启动过程,将语义指针解压缩,以(a)将刺激与之前学习的范例进行比较,或者(b)应用一组定义类别成员资格的规则。
为了提供更正式的细节,工作记忆系统包含神经元群体,其活动代表在每次实验的训练阶段学习的概念对应的语义指针。在涉及感知分类的实验中,这些语义指针将具有以下数学描述:
其中 是一个索引特定规则的向量,而 是该规则内容的表征。通过依次检索和应用这些规则,模型能够推断出给定输入刺激与规则所编码的类别描述的一致性程度。总体而言,(1)和(2)为我们的模型中使用的语义指针提供了表征方案,但需要注意的是,这些方案是为了适应特定的分类实验而选择的,并不能反映我们框架的表征能力。
动作选择系统的细节更为复杂。许多传入连接使得该系统能够监测模型中其他神经群体中的表征状态,并且其中一小部分状态与系统执行以控制信息流动的动作相关联。该系统由一系列解剖学上对应于基底神经节的神经群体组成,而对应于尾状核的输入群体编码每个被监测的表征状态与触发特定动作的状态之间的相似性(即,点积)。输出的内苍白球群体连接到丘脑,丘脑再连接回模型的其他部分,从而在特定时间执行对应于最高编码相似性度量的动作。关于这一基底神经节动作选择模型的实现和生物学合理性的详细信息可以在 Stewart、Choo 和 Eliasmith(2010)中找到。然而,我们的关注点在于利用该系统的功能,而不是直接用它来解释神经数据。
执行感知评估和推理评估的系统最好通过例子来说明。在每个实验条件下,模型首先接收一个表示当前任务的向量,随后接收一个对应于待分类视觉刺激的向量。当任务向量通过视觉缓冲区时,它触发一个动作,更新工作记忆中任务上下文的表征,这反过来决定了刺激向量将如何被处理。在感知分类任务的情况下,这种上下文表征触发一个动作,将输入刺激与图3中标记为“感知评估”子系统中的解压缩语义指针进行比较。从数学上讲,感知评估系统的后续输出可以描述为:
其中SP是由(1)描述的那种语义指针,而 是正在被分类的输入向量的伪逆。这个输出通过一个由当前任务上下文的工作记忆表征触发的动作被传递到运动缓冲区。图4展示了这一过程在模型执行Posner和Keele(1968)的任务时的展开。
在推理序列完成后,任务上下文表征的最终状态触发一个动作,将推理评估系统的输出传递到运动缓冲区。图5展示了这一过程在模型执行Lin和Murphy(1997)的任务时的展开。
我们认为这个模型是统一的,原因如下:所有表征都是语义指针,模型结构在不同任务之间保持不变,动作选择系统可以执行的动作集合也在不同任务之间保持不变。
可能会有人认为,因为我们为不同的任务上下文定义了不同的动作,所以我们实际上提出了一种混合模型。然而,这类似于争论说计算器没有提供算术的统一实现。仅仅根据输入(例如,按下了哪个操作按钮)改变设备中的信息流,并不意味着该设备实现了算术的混合解释。表征、结构和处理步骤都保持不变。
同样,在我们的模型中,改变动作选择系统执行的转换类似于手动更换计算器上的操作按钮。我们选择当前的实现方式是为了最小化模型的复杂性和运行时间。然而,至关重要的是,改变动作选择系统执行的转换,只改变了模型中信息流的控制方式——它并没有改变所使用的表征的性质、模型的结构,或者刺激被分类的整体过程。
7. 模拟实验
7.1. 原型理论:实验 1
我们模拟的第一个研究是 Posner 和 Keele(1968)对点模式分类的实验 3。该实验旨在探讨受试者是否会在仅被训练对由原型变形生成的模式进行分类时,抽象出有关类别原型的信息。在实验的训练阶段,30 名受试者通过纠正性反馈被教导对一组 12 张幻灯片进行分类,每张幻灯片都描绘了一个在 30×30 矩阵内独特排列的九个点的图案。这些幻灯片分为三个类别,每个类别中的四张幻灯片都是通过随机变形一个单一的“原型”点图案生成的,而这个原型点图案并不存在于训练集中。每个类别定义原型的四张训练幻灯片是通过一个变形规则生成的,该规则规定了每个点从其起始位置移动的距离。当受试者能够连续两次无误地对所有 12 张幻灯片进行分类时,训练被认为完成。
在完成训练阶段后,32 名受试者进入转移阶段,被要求在没有反馈的情况下对一组 24 张幻灯片进行分类。这些幻灯片包括来自训练阶段的六个旧模式(每个原型两个)、使用训练阶段的变形规则生成的六个新模式(每个原型两个)、使用较弱变形规则生成的六个新模式(每个原型两个)、三个原型以及三个完全随机的模式。转移阶段的结果表明,训练模式和原型的分类效果最好且相当,而新的低水平变形模式和新的高水平变形模式的分类准确率则逐渐降低。
为了模拟这个实验,我们首先假设所有的视觉刺激都被压缩成语义指针,使用第 3 节中描述的神经转换。因此,点模式以神经脉冲模式编码的个体向量的形式呈现给模型。通过一种略微受限的随机向量生成方式构建三个原型,以确保一定程度的相似性,然后将其归一化为单位长度。所有向量均为 128 维。为了生成训练刺激和转移刺激,使用以下公式:
其中,k表示向量的维度, r 表示变形的程度,I 表示一个 k x k 的单位矩阵。用通俗的话说,刺激向量是通过将从标准差为 r 的正态分布中抽取的随机数加到相关原型向量的每个元素上而构建的。 r 的值用于近似 Posner 和 Keele 对原型图案施加的变形程度。需要注意的是,低变形规则和高变形规则是彼此的精确比例关系,因此一个 r 值就足以描述两者。
为了运行实验的试验,创建了一个模型实例,该实例使用语义指针编码了12个标记的训练图像(如公式(1)所示),并将它们直接输入到工作记忆中。对应于任务上下文(例如,“Posner”)和测试刺激(例如,“AT1”——原型A,训练项目1)的向量随后依次输入到视觉缓冲区。任务向量触发一个动作,该动作更新工作记忆中的任务上下文表示,以指示应执行感知评估;然后,该表示进一步触发任务上下文表示的更新,这使得感知评估系统的输出被路由到运动缓冲区。图4详细说明了实验单次试验的这一过程。每次试验对应于450毫秒的模拟处理时间。
为了详细复制Posner和Keele的实验,我们使用32个随机种子为每个32名实验受试者生成模型的独特实例。这些种子固定了模型中用于设置各种神经元参数(例如,最大放电率、首选刺激向量等)的随机数生成器,并允许在试验中重新创建模型的相同实例。为了运行完整的实验,每个模型实例都在独立的试验中对一组测试刺激进行测试。特定模型实例涉及的所有试验中使用的测试刺激是相同的,总共进行了21×9×32=672次试验。结果是通过统计模型在每个刺激类别中犯错误的比例,并将该比例平均到32个模型实例上获得的。
在所有后续实验中都使用了这种程序,并且在实验中使用相同的模型实例,以确保所有结果严格是由于相关参数值的变化。
为了评估模型,我们在自由参数r和Posner及Keele报告的数据之间找到了最佳拟合。我们在r值从0.05到0.15的范围内进行了11次完整的实验,图6绘制了每个刺激条件下分类错误率与r的关系。这些结果表明,该模型在一系列刺激失真值范围内概括了Posner和Keele的发现:分类准确性对于训练模式和原型是最高的,并且随着低水平和高水平失真模式的增加而逐渐降低。
进一步检查这些结果表明,r值为0.1时,模型结果与数据之间的均方根差最小。基于每个刺激类别中正分类判断和负分类判断的百分比,分别计算了模型数据和人类数据的95%置信区间。
在总结这些结果时,有助于指出,模型在该实验中的表现主要归因于语义指针的数学结构以及它们的处理方式。具体来说,每个随机生成的原型向量可以被视为128维空间中的一个点,每个刺激可以被视为另一个从原型随机偏移一定量的点,该偏移量由r指定。随着r的增加,这些偏移在低失真和高失真条件下都变得更大,某个刺激位于与错误原型(因此是错误类别标签)更密切相关的空间区域的概率增加。因此,图6中显示的结果模式并不令人惊讶。
然而,该模型在训练模式和原型模式上的表现优于人类。以下两点评论有助于澄清这种差异的意义。首先,每个刺激类别中平均错误率的差异大约为10%,这相当于在实验中每两名参与者中每个类别多出一个错误。鉴于每次实验中对超过180个训练刺激进行了分类,这种差异实际上相当小。其次,由于原型是随机生成的单位向量,它们可能相当不相似,这降低了错误分类的可能性,因为与每个原型相关的刺激更有可能位于向量空间的不相交区域。强制规定原型之间的最小相似性值可以减少图7中可观察到的差异,但也会为模型增加一个额外的自由参数(我们在报告的结果中没有明确设置这个参数——见脚注6)。根据这些因素调整模型可能会减少此处观察到的性能差异。
7.2. 范例理论:实验2
尽管原型理论和范例理论传统上被发展为对同一现象的相互竞争的解释,但有许多实验结果表明,范例表征在概念加工中发挥着独特的作用(Murphy,2002)。为了说明这种效应,我们模拟了Regehr和Brooks(1993)设计的实验(1C),该实验旨在测试分析性特征匹配和更整体的刺激相似性测量在形成分类判断中的相对重要性。在实验过程中,32名受试者被训练对虚构生物的绘画进行分类。每种生物都具有一组独特的特征集合,这些特征集合定义在五个二元维度上,并且根据这一特征集合属于两个类别之一。这两个类别被称为“建造者”类别和“挖掘者”类别。为了成为建造者,一种生物必须具备三个特定特征中的至少两个。否则,这种生物就是挖掘者。在实验中,对于每个受试者,以下四个规则中的一个用于指定哪些特征可用于识别建造者(第99页):
1. 长腿、棱角分明的身体和斑点。
2. 短腿、长脖子和斑点。
3. 六条腿、棱角分明的身体和斑点。
4. 两条腿、长脖子和斑点。
使用这些不同的规则旨在平衡特定特征维度在决定类别归属方面的相关性(然而,需要注意的是,斑点与无斑点的维度始终是相关的;Regehr & Brooks,1993,第99页)。
重要的是,每个特征的感知特性可以在绘画中有所不同。例如,“长脖子”特征在一幅绘画中可能有各种弯曲,而在另一幅绘画中则相对笔直。这些分析上相同的绘画之间是否存在这类感知差异被用来定义两个实验条件。在“组合”条件下,分析上等价的特征在感知上也是等价的。在“个体化”条件下,分析上等价的特征在感知上是不同的。通过比较这两个条件下的分类表现,可以评估分析结构和感知相似性在形成分类决策中的相对重要性。
在实验的训练阶段,32名受试者中的每一个都通过纠正性反馈被教导根据上述四个规则中的一个对一组八个图形进行分类。一半的受试者被安排在组合条件下,另一半被安排在个体化条件下;每个条件都有自己的八张训练绘画。在迁移阶段,受试者被要求在没有反馈的情况下对总共16张绘画进行分类,其中八张是训练范例,另外八张是新的绘画。所有新的绘画都与训练集中的一对“双胞胎”配对,这对“双胞胎”仅在一个维度上有所不同(即,斑点的存在与否;因此,双胞胎在感知上相当相似)。属于与其双胞胎同一类别的新图形被称为“良好迁移”(GT)项目,而属于与其双胞胎相反类别的新图形被称为“不良迁移”(BT)项目。双胞胎项目之间的感知相似性因此可以暗示正确或错误的分类决策:对于GT项目,感知相似性暗示正确的决策,而在BT项目的情况下,感知相似性暗示错误的决策。
实验结果表明,在组合条件下,受试者在训练、GT和BT项目上的分类错误率大致相同。然而,在个体化条件下,BT项目的错误率显著更高。
为了模拟该实验,我们使用了与原型模拟中相似的方法。我们假设刺激通过压缩过程被转换为语义指针,并且每个语义指针的结构符合以下数学描述:
其中“DimensionF”和“ValueF”是随机生成的向量,用于定义每个刺激分析结构的组成部分。例如,一个可能的维度-值对是“SPOTS(斑点)~ YES(有)”。为了增加特征的个体化,并近似“组合”和“个体化”实验条件之间的差异,对每个特征值施加了可变幅度的高斯扰动。
其中,k 再次表示向量的维度,r表示高斯分布的标准差,I 表示一个k x k 的单位矩阵。
每个实验试验都采用与Posner和Keele模拟中相同的方法进行。一个语义指针对八个标记的训练刺激进行编码,并作为直接输入提供给工作记忆,同时视觉缓冲区依次被提供任务向量和刺激向量。任务向量启动了图4中描述的相同动作序列,因此模型性能的变化仅是由于使用了不同的测试刺激和不同的语义指针。每次试验再次对应于450毫秒的模拟处理时间,模型的分类判断通过评估模型运动系统中的表征状态来确定。
为了评估特征个体化对分类表现的影响,我们进行了15次实验,使用r值从0.01到0.15生成的刺激。每次实验涉及在前16个模型实例上测试16个刺激,总共进行了16×16=256次试验。图8绘制了每个刺激条件下分类错误率与r的关系。模型评估是通过将自由参数r拟合到Regehr和Brooks报告的数据来完成的。我们观察到,在组合条件下,r值为0.02时,模型结果与数据之间的均方根差最小。同样,在个体化条件下,r值为0.1时,模型结果与数据之间的均方根差最小。使用不同的r值来解释不同的刺激条件是相当合理的,因为较低的r值对应于不同刺激上分析等价特征之间的相对较小差异,而较高的r值对应于这些特征之间的相对较大差异。图9报告了组合条件和个体化条件下模型结果与实验数据的直接比较。置信区间如之前所述进行计算。
为了直观地解释这些结果,将每个刺激视为高维空间中的一个点是有用的。标记的训练刺激定义了与两个类别标签之一相关联的空间区域。当没有特征个体化时,分析结构的差异是两类刺激之间存在的唯一差异。这很重要,因为它意味着每个标记的训练范例都表明某种特定的分析结构是属于某一特定类别的诊断特征。当一个新刺激被映射到高维空间时,可以认为存储在记忆中的每个训练范例都会根据结构上的重叠点对新刺激的类别归属进行“投票”。例如,如果一个训练范例具有“长脖子”特征,并且被标记为建造者,那么在测试刺激中出现这一特征将导致该训练范例为将测试刺激归类为建造者投出一票。所有这些投票的平衡决定了最终的分类判断(由于在(6)中描述的刺激构建中使用的随机生成向量不能保证正交,因此存在一些噪声)。总体而言,当没有特征个体化时,每个记忆中的范例产生的投票仅对分析结构敏感,这意味着GT项目和BT项目之间分析结构的变化会导致测试刺激获得每个类别的票数发生变化。这种对分析结构的敏感性解释了为什么在低特征个体化条件下,模型不太容易出现BT错误——模型注意到了BT项目与其训练配对之间的结构变化。
然而,随着刺激物的个体化程度增加,每个训练刺激所提供的投票对分析结构的敏感性却降低了。要理解其中的原因,回想一下,特征个体化产生的是分析上等价但感知上不同的特征。这意味着,一个特定训练样本所提供的投票只适用于具有感知上相似特征的测试刺激,因为分析上等价的特征可能由于用于近似特征个体化的扭曲而被表示为高度不同的向量。在这种情况下,如果一个训练样本具有高度个体化的“长脖子”特征,那么该样本并不会为“长脖子”这一特征在总体上提供支持票。它只对特定类型的长脖子提供支持票。这种行为导致在BT项目上的错误率增加,原因如下。在训练集中与BT项目相对应的样本在所有维度上都具有相同的特征,只有一个维度除外(有斑点与无斑点)。这意味着,随着特征个体化程度的增加,训练样本为分类BT测试刺激提供了越来越多的相关投票。而由于训练样本与BT测试刺激属于相反的类别,这些投票增加了分类错误的可能性。因此,当图8中一系列实验中r值增加时,模型在BT项目上的表现逐渐变差也就不足为奇了。
最后,值得一提的是,该模型在特征个体化程度最低的情况下对GT刺激的分类表现优于人类。这可能是因为Regehr和Brooks的加性特征规则设计得使得GT项目偶尔(且唯一地)不具有任何表明其属于相反类别的特征。具体来说,每条三特征规则可以将所有可能的特征划分为三类:表明属于建造者(Builder)的特征、表明属于挖掘者(Digger)的特征以及诊断上中性的特征。大多数刺激在检查后都具有一个表明其不属于的类别的诊断性特征。然而,一半的GT项目却不具有任何表明其不属于的类别的诊断性特征(参见Regehr & Brooks, 1993, p. 102)。因此,这些GT项目更有可能位于与正确分类判断相关联的向量空间区域中。人们可能对这些刺激之间的细微差异并不敏感,尤其是考虑到Regehr和Brooks观察到许多受试者报告说仅依赖一两个特征来进行分类判断。该模型没有注意力机制,无法对特征赋予不同的优先级,这可能是我们在GT条件下观察到其表现更准确的潜在原因。再次强调,根据这些因素调整模型可能会改善我们观察到的模型与数据的拟合程度。
7.3 理论理论:实验3
除了原型和范例观点的持续发展外,概念的结构类似于它们所指代类别的直觉理论这一观点,已经成为一个越来越受欢迎的研究目标(Keil, 1989; Murphy & Medin, 1985; Rogers & McClelland, 2004)。推动这一发展的基本观点是,个体拥有关于因果关系、本质和本体论区别的信念,这些信念似乎影响了他们对概念的使用(Keil, 1989; Murphy & Medin, 1985; Prinz, 2002; Rogers & McClelland, 2004)。例如,BIRD(鸟)指代一个连贯的类别,并以这种方式对实体进行分组,是因为大多数鸟类共享的许多特征(如飞行、翅膀、羽毛和中空骨骼)通过一组或一组以上的解释相互关联:鸟类能够飞行是因为它们有翅膀、羽毛以及中空骨骼;鸟类飞行是因为这样做有助于它们觅食和躲避天敌(Murphy, 2002; Rogers & McClelland, 2004)。在分类任务中,这种效应表现为受试者使用解释性推理将对象与类别匹配。
为了对这种简单效应进行解释,我们模拟了Lin和Murphy(1997)的实验2。在这个实验中,两组受试者被赋予了不同的人工类别的功能描述,然后被要求对相同的图像集进行分类。结果显示,受试者根据他们收到的类别描述,关注图像的不同特征。因此,背景知识被证明对受试者在基于图像的分类任务中的表现有影响。
在实验的训练阶段,20名受试者被平均分为两组(A组和B组)。每组都得到了一组三个训练样本的不同解释性描述,每个样本由四个不同的特征组成,涉及八个不同的类别。类别描述的设计使得每个训练样本所呈现的四个特征中,一个被描述为功能上至关重要的,两个被描述为功能上可选的,一个被描述为功能上无关的。因此,以图10中所示的样本为例,A组的参与者得到了以下描述:
昆因岛的猎人使用图克(tuk)来捕捉邦杜(Bondu),这是一种在昆因国人们喜欢食用的动物。要用图克捕捉邦杜,抓住图克的手柄(3)。一旦发现邦杜,将环(1)套在邦杜的脖子上,然后迅速拉动末端的绳子(4)以收紧环。手柄前面的盖子(2)可以保护你的手免受动物的咬伤或抓伤。(第1156页)
相比之下,B组的参与者得到了以下描述:
昆因岛的人们使用图克来喷洒杀虫剂。三角形的瓶子(2)装有杀虫剂。当(3)被拧开时,杀虫剂通过软管(4)流出。环(1)用于将图克挂在墙上。(第1156页)
当一个受试者学会了所有八个类别的训练样本和类别描述后,受试者需要回忆每个类别的描述性信息,并回答关于如何最好地照顾每个类别中的物品的问题。在受试者无错误地完成这一回忆过程后,他们被允许进入实验的迁移阶段。
在迁移阶段,每位受试者被要求尽可能快速且准确地对一组新的物品进行分类。首先,在计算机屏幕上显示一个类别标签(例如,“Tuk”)持续1秒,随后出现一个图像。然后,受试者需要做出“是”或“否”的判断,之后进入下一个项目。重要的是,每次类别标签出现后所呈现的图像在与训练阶段提供的类别描述的一致性上有所不同。实验使用了四种类型的图像。第一种是“原型”图像,它们包含了类别描述中提到的所有四个特征。第二种是“与A组一致”的图像,这些图像缺少一个对A组受试者来说是功能上可选的特征,但对于B组受试者来说是功能上至关重要的特征。第三种是“与B组一致”的图像,这些图像缺少一个对B组受试者来说是功能上可选的特征,但对于A组受试者来说是功能上至关重要的特征。最后一种是“对照”图像,这些图像缺少对A组和B组受试者来说都是功能上至关重要的特征。
20名受试者每人对所有八个类别的每种图像类型的三个图像进行了测试。图像以随机顺序呈现,每位受试者总共进行了96次试验(即3×4×8)。Lin和Murphy的研究结果表明,原型图像引发了非常高比例的肯定判断,而与给定受试者的类别知识一致和不一致的图像引发的肯定判断逐渐减少。对照图像引发的肯定判断非常少。
为了模拟这个实验,我们假设每个模拟参与者已经学习了一个语义指针,该指针将类别描述编码为一组简单规则。这些规则的作用是确定某个特定特征是否对属于正在考虑的类别很重要。例如,A组参与者可能学到的一条规则是“如果这个物品是图克(Tuk),那么它应该有一个环(loop)”。这些规则的语义指针按照(2)的结构如下:
为了运行一个完整的实验,我们创建了20个模型实例,并在相同的刺激集上测试每个实例。为了提高运行时间,我们只在每个类别中测试每个模型实例对每种迁移类型的刺激,总共进行次试验。每次试验中的刺激向量是通过将考虑中的刺激类型中存在的每个特征对应的向量相加生成的。例如,属于图克(Tuk)类别的一个一致的刺激将被编码为:
其中 分别对应于图克(Tuk)类别描述中提到的环(loop)、护手(guard)、手柄(handle)和绳子(string)。实验中使用的八个不同类别中,每个类别的特征对应的向量都是随机生成的。
图11报告了这个实验的结果,表明模型的表现与Lin和Murphy(1997)中报告的人类表现相当接近。
总体而言,这些结果表明,该模型能够逐步应用编码在一组规则中的知识以执行基于规则的刺激分类。当一个刺激符合这些规则时,模型非常有可能判断该刺激属于正在考虑的类别。当一个刺激在较小程度上符合这些规则时,模型判断该刺激属于正在考虑的类别的可能性就会降低。因此,该模型对给定刺激与编码在一组规则中的简单知识库的一致性具有适当的敏感性。我们认为这些结果是模型在分类过程中解释简单基于规则的知识效应能力的一个非常初步的证明。关于知识基础概念处理的可能扩展和改进的讨论在下一节中呈现。
7.4 模型总结
我们提供了一个统一的过程模型,并将其应用于涵盖三种不同概念理论的三个实验结果。一些评论可以帮助澄清我们认为这些模拟的意义所在。
首先,它们表明语义指针可以以定性上不同的方式被操作和解压缩。在一个感知任务中,语义指针被用于将刺激与类别标签在一次性的过程中匹配,这本质上是一种模式识别。相比之下,在一个推理任务中,语义指针被用于促进一系列计算,以逐步、基于规则的方式分析刺激。
其次,这些模拟概括了我们在模拟的研究中报告的实证发现。通过改变单一参数 r ,我们能够复制这些研究中报告的感知分类模式,涵盖一系列新的刺激。因此,该模型可以用来生成关于人类行为的新预测。
第三,在每次实验试验中,单个语义指针被用于编码所有到达分类判断所需的类别信息。该模型因此展示了语义指针如何为研究概念现象提供一个统一的框架。
对我们模型的一个潜在批评是,它未能真正解释知识基础方法旨在处理的概念现象类型。这些方法强调因果和解释性推理在分类中的作用,而我们在实验3中应用的规则本质上执行的是加权特征比较,因此似乎不太可能有任何这样的推理发生。然而,规则足以以推理的形式提供解释,并且当它们与感知-运动操作相关联时,可以表达因果规律(Thagard,2012)。要解释这一点,在任何适当的推理理解中,推理可以被描述为心理状态之间的转换。这种转换可以自然地以规则或动作的形式捕捉,复杂的推理形式涉及复杂的规则和动作,而简单的推理形式涉及简单的规则和动作。在这种理解下,很明显,我们的模型正在执行一种简单的推理。因此,真正的问题是模型所展示的效应的程度,而不是种类。如果承认模型在种类上捕捉了知识效应,那么这种批评就失去了大部分力量。
此外,特征比较与基于规则的分类的存在并不矛盾。例如,考虑Rips(1989)的经典研究,其中参与者被要求判断一个直径为3英寸的物体更有可能是披萨还是硬币。由于硬币的直径是固定的,受访者通常会回答该物体更有可能是披萨,即使它与硬币更相似。这一结果通常被认为表明存在可以覆盖更典型相似性评估过程的基于规则的分类过程。然而,需要注意的是,关于硬币的相关背景知识只能通过特征比较来应用:必须评估刺激物体的直径,并将其与已知的硬币直径进行比较。因此,完全有可能用我们的模型来解释这种效应。关于硬币的一组软规则可以按照公式(2)编码到语义指针中,其中一条规则可以非常强烈地惩罚任何足够大直径的刺激的连贯性得分。当然,解释更复杂的效果是未来工作的一个重要目标,但鉴于已经使用语义指针实现了复杂推理任务(如汉诺塔谜题)的模型(Stewart & Eliasmith,2011),我们声称提供了一个处理知识效应的良好起点是合理的。
对我们模型的另一个潜在批评是,它所提供的所有解释性洞见都归因于语义指针的数学结构。虽然可以使用抽象于神经实现的基于向量的模型获得良好的分类性能(例如,Knapp & Anderson,1984),但这些模型并未描述我们模拟中存在的那种时间动态。这些动态可以用来对(a)不同任务之间的反应时间差异和(b)任务执行期间神经活动的时间和解剖定位进行大致预测。例如,我们的模型预测,在执行实验3中的任务时,与执行实验1或2中的任务相比,基底神经节和丘脑中的神经活动会更多,因为执行了更多的动作。同样,模型预测在实验3中,运动系统活动的增加应该比实验1或2更晚发生,因为由任务向量启动的较长动作序列导致执行运动路由的动作被延迟。一般来说,该模型预测涉及对语义指针进行更多操作的任务比涉及较少操作的任务需要更长时间,其他条件相同的情况下。
最后的一个问题是,该模型目前预测在涉及相同实验任务的不同条件之间没有反应时间(RTs)的差异。例如,在实验3中,模型生成分类判断所需的时间并不取决于正在分类的刺激类型(即,原型和对照刺激的分类时间大致相同)。这种行为与Lin和Murphy(第1160页)的观察结果相冲突,他们发现与不符合类别描述的刺激相比,符合类别描述的刺激的反应时间更快。然而,重要的是要注意,这些RT差异可能是由于我们没有明确模拟的因素造成的。例如,可能的情况是,编码在语义指针中的规则的应用也会导致引发特定运动行为的过程。在我们的模型中,原型刺激往往比其他刺激更快地达到高于阈值的连贯性得分,尽管反映这一点的分类判断直到从存储在记忆中的语义指针中解码出所有四条规则后才会通过运动缓冲区传递。如果运动启动与连贯性得分的值成比例发生,那么也许可以解释这些RT差异。还值得注意的是,在Regehr和Brook的结果中,在实验1C中没有观察到不同刺激条件之间的显著RT差异(见第100页)。总体而言,尽管在单一任务中解释不同条件之间的差异在我们的建模框架内仍有待进一步探索,但该框架目前确实对不同任务中神经活动的时间和解剖定位做出了有趣的预测。我们认为后一点是我们的建模框架所提供的主要洞见,并认识到在该框架内进一步研究反应时间数据的必要性。
8. 总体讨论
值得反思语义指针框架的一些更一般的属性。如前所述,该框架提供了一种相对直接的策略,用于解释各种概念功能。这种策略的第一步是假设某个感兴趣现象背后的语义指针的结构。下一步是假设一组机制,这些机制操纵、压缩和解压缩这些语义指针以产生该现象。最近的研究表明,这种策略可以用来激励一种新的认知架构(Eliasmith, 2013)。最近的文章还使用语义指针来解释启动效应、意图、情感、创造力和意识(Schröder & Thagard, 2013; Schröder, Stewart, & Thagard, 2014; Thagard & Schröder, 2014; Thagard & Stewart, 2011; Thagard & Stewart, 2014)。
与这种广泛的应用一致,语义指针框架合理地满足了我们对概念理论的五个标准。在分类方面,我们能够用我们的模型解释一系列重要的实验结果,并推导出相关结果的预测。此外,我们的模型所执行的推理和感知评估表明,它有能力以统一的方式解释涉及规则和记忆的分类行为(参见Sloman, 1996; Smith, Patalano, & Jonides, 1998)。还可以扩展到涉及更多分类现象的情况。例如,Eliasmith(2013)描述了使用语义指针对手写数字图像进行分类的模拟,其准确率达到了人类水平。同样,Hunsberger, Blouw, Bergstra和Eliasmith(2013)在实验1和2中描述的任务中实现了人类水平的分类表现,同时使用了一个层次化的视觉网络,该网络以刺激的原始图像作为输入。
为了实现递归绑定,我们使用卷积来定义如公式(1)和(2)中描述的表示方案中的那种结构丰富的语义指针。这些方案也可以修改以解释简单自然语言表达式的形成。例如,Eliasmith(2013)证明,可以使用语义指针对简单句子进行编码,这些指针将单词的表征与其所占据的语法角色的表征绑定在一起,Stewart, Choo和Eliasmith(2014)提出了使用这种相同架构解析简单自然语言句子的方法。研究语义指针在自然语言处理任务中的应用是一个重要的进一步研究课题。
通过使用LIF(漏电积分-发放)神经元以及基底神经节、丘脑和皮层等解剖区域之间生物学上合理的连接模式,满足了神经实现标准。此外,由于感知和推理处理是在模型的不同子系统中完成的,该模型与表明抽象和具体概念在不同神经系统中被处理的证据一致(Shallice & Cooper, 2013)。尽管如此,我们神经实现的某些方面仍需进一步研究。例如,目前没有直接证据表明大脑在概念处理过程中使用了卷积操作。但由于假设这种操作带来了众多的解释优势,我们认为这是一个合理的假设。
在范围方面,我们模型中使用的不同语义指针编码了不同种类的表征,将这些差异推广以解释高度复杂和抽象的概念是相当直接的。例如,Eliasmith(2013)描述了操纵语义指针的技术,这些指针包括从成年人词汇量中提取的数百个绑定元素,同时仍然符合已知的解剖学约束。类似地,Crawford, Gingerich和Eliasmith(2013)展示了使用语义指针对整个WordNet图进行可扩展编码的方法。
关于表征内容,还需要多说一些。先前的研究表明,NEF(神经工程框架)与所谓的语义两因素理论兼容(Eliasmith, 2000, 2003)。两因素理论从外部原因(例如,驱动神经元群体活动的刺激)和计算角色(例如,神经群体对其他群体产生的后续影响)两个方面描述心理表征的内容。因此,以一个神经群体表征听觉图像为例,刺激被编码为神经脉冲,这指定了因果因素,而脉冲的解码(以恢复传递给其他神经元的信号)则指定了计算因素。这两个因素共同定义了表征的内容,并大致指定了它的外延和内涵。对于通过压缩众多表征构建的语义指针,相关的因素将由其他神经群体中的脉冲模式来支撑。这些群体中的活动可能反过来更直接地受到感知刺激的驱动,这将因果地贡献于构建的语义指针的内容。当然,理论细节需要进一步完善,但追踪神经活动模式之间的功能关系的一般策略为识别任意复杂语义指针的内容提供了一种合理的方法。
总体而言,尽管仍有许多工作要做,以扩展语义指针框架以解释更复杂的概念现象,但它比现有方法有明显的优势。首先,其神经计算的详细程度超过了大多数(如果不是全部的话)其他解释。其次,它为一系列分类现象提供了一种合理的统一解释。第三,它对概念绑定和自然语言表达式形成提供了机械性的描述。在更哲学的层面上,语义指针框架有工具来解释不同种类的概念以及概念的语义内容。在心理学文献中,语义和范围的讨论常常被忽视或搁置,而哲学家(尽管有少数例外,如Prinz, 2002)对概念处理的实证研究关注相对较少。最后,我们认为该框架的主要贡献在于,它提供了一种通用的表征方案和生物学上合理的机制,可以用这些机制来实现通常被认为在本质上根本不同的概念功能(例如,Machery, 2009)。我们在这里建模的现象范围显然有其局限性,但应该清楚的是,语义指针提供了一种单一的表征格式,能够描述所有主要类型的概念处理。将这种表征格式应用于更广泛的现象是未来工作的一个重要方向。
9. 结论
回到我们的引言部分,我们认为语义指针为当前概念研究中所面临的问题提供了一个有希望的解决方案。由于该框架不需要依赖多个共指代的表征结构来解释类别知识,因此避免了多元论的问题。在我们所有的模拟中,一个语义指针(加上用于解压缩等的处理机制)就足以解释使用概念进行分类所涉及的所有认知过程。由于一个单一的语义指针能够以这种方式全面支持概念处理,因此声称“概念”这一术语指代一组不相关的表征和过程是没有意义的。我们建议,如果我们的方法具有任何说服力,那么概念将会长期存在。
注释
1. 专注于分类模拟还有三个其他原因。首先,篇幅限制使得一篇文章无法对众多概念现象进行建模。其次,分类是一个典型的概念任务,因此吸引了来自不同学科背景的广泛研究者的兴趣。第三,大多数现有的概念实证研究都集中在分类研究上,因此我们有丰富的数据可以与我们的结果进行比较。对于那些研究兴趣有限的任务,模型与数据的比较是不可行的。
2. 神经工程框架(NEF)从两个方面定义心理表征:一是将刺激编码为神经脉冲模式,二是将脉冲序列解码为它们所代表的物理变量(Eliasmith, 2003)。举一个非常简单的例子,脑干中的两个区域——舌下前核(NPH)和腹内侧前庭核(VN)——包含具有调谐曲线的神经元,这些曲线描绘了水平眼位与脉冲活动之间的关系(Eliasmith & Anderson, 2003, 第44—49页)。因此,NPH和VN中的神经元共同“编码”了眼位的测量值为神经脉冲模式。解码过程涉及为每个神经元的反应分配一个最优权重(根据解码表征的维度,可以是一个标量或向量),并对相关群体和时间内的所有加权反应进行求和。在NPH和VN中,这个求和结果是对眼睛位置的估计。关于这些编码和解码关系的更详细数学定义,请参阅补充材料的A部分。
3. 还值得注意的是,这种单一的绑定网络可以计算任意两个输入向量的循环卷积,而NEF具备资源,可以通过使用生物学上合理的赫布学习规则来解释如何学习实现这种绑定网络的权重(Stewart, Bekolay, & Eliasmith, 2011)。
4. 获得向量的伪逆是一个简单的线性变换,因此可以在神经群体之间的连接上计算。将语义指针与向量的伪逆进行卷积,可以提取语义指针中绑定到该向量的任何项目的近似值。
5. 具体来说,第一个原型的向量是随机生成的,而第二个和第三个原型的向量是随机生成向量与第一个向量的和。
6. 在Posner和Keele(1968)的论文中,训练和高失真刺激是通过7.7比特失真规则生成的,而低失真模式是通过5比特失真规则生成的。由于失真值是彼此的倍数,我们使用“基础失真水平”等于sigma来拟合模型,并使用标准差为7.7/5倍sigma的值来生成训练和高条件下的刺激模式。
7. 为了减少模型的运行时间,没有进行涉及完全随机刺激的试验,因为这些刺激没有正确性的衡量标准。
8. 完整的特征维度和值如下:身体(角形或圆形);腿部(长或短);腿的数量(2条或6条);斑点(有或无);脖子(长或短)。
9. 这里还需要进一步说明的一点是,区分概念获取和概念使用是很重要的。在Lin和Murphy的实验中,是在概念获取过程中,利用关于环的收缩与杀死邦杜之间因果关系的知识,来优先考虑图克(Tuk)上环的存在。在使用概念进行分类时,这些因果关系不需要直接考虑。由于我们并不打算对概念获取进行全面解释,因此在我们的模型中省略这些因果推理是合理的。
10. 我们选择450毫秒的模拟窗口并没有特别的意义,只是这个窗口为所有三种分类任务的完成提供了足够的时间,同时最小化了总的模拟时间。此外,我们的研究中并没有隐含反应时间应该在450毫秒左右的预测,因为模型排除了大量的感知和运动处理过程,这些过程需要纳入对反应时间的精确估计中。
11. 这是一个过度简化的说法。为了避免因误表征而产生的问题,使用各种神经活动触发因素之间的统计依赖性来指定相关的因果因素。详情请参阅Eliasmith(2000)。
原文链接: https://onlinelibrary.wiley.com/doi/pdfdirect/10.1111/cogs.12265
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.