重磅：建模各种依赖概念信息的推理机制：统一框架，常识的构建|维度|相似性

分享至

Reasoning with Concepts: A Unifying Framework

使用概念进行推理：一个统一的框架

https://link.springer.com/content/pdf/10.1007/s11023-023-09640-2

摘要

在过去的几十年中，认知科学已经识别出几种在推理中使用概念知识的基本形式。尽管在理论和实证方面取得了显著进展，但目前仍缺乏一个统一的框架来理解概念在推理中的使用方式。本文认为概念空间理论能够填补这一空白。我们的策略是展示如何使用从概念空间理论中得出的原则来建模各种明显依赖于概念信息的推理机制，包括基于相似性、典型性和诊断性推理的机制。我们的第一个主题分析了期望在归纳推理中的作用及其与我们概念结构的关系。第二个主题是研究自然语言中使用泛化表达与常识推理之间的关系。我们提出，泛化的强度可以通过概念空间中属性与原型之间的距离来描述。第三个主题是基于类别的归纳推理。我们证明概念空间理论可以作为这种推理类型的全面模型。最后一个主题是类比推理。我们回顾了该领域的部分观点，提出了一个类比关系的分类体系，并展示了如何用概念空间中的距离来建模这些关系。我们还简要讨论了该模型对人工系统中概念推理的启示。

关键词：类比推理·基于类别的归纳推理·概念空间·期望·泛化表达·推理·相似性·典型性

1 引言

概念通常被理解为“思想的构建块”（例如，Fodor，1983；Pinker，2007）。因此，人们认为它们在解释理性思维中起着核心作用。然而，心理学和哲学中的概念理论很少整合推理理论，反之亦然。结果是，没有任何科学或哲学理论能够系统地解释概念是如何参与推理过程的。

这种研究领域的分离可以追溯到经典逻辑，其基于这样一种观点：论证有效性的理论可以不依赖于概念内容的理论。换句话说，逻辑被认为是“主题中立的”，因为它认为少数逻辑运算符的语法就足以构建一个理性推理的理论（参见MacFarlane，2000）。在心理学中，这种传统的影响力体现在通常被称为“演绎主义范式”（或“推理的经典观点”）中。这种观点认为，推理是通过将抽象规则应用于命题结构的信息来运作的，类似于一个证明理论系统（例如，Rips，1994；Smith等人，1992）。然而，许多人类推理形式显然是基于概念的，并且依赖于超出经典逻辑范围的语义机制。此外，实验心理学已经证明，我们推理的问题的主题内容会影响所使用的策略和处理的流畅性；这一点已被证明难以与语法范式调和（参见Pollard & Evans，1987；Kellen & Klauer，2020）。

尽管在理论和实证方面取得了显著进展，但一个能够解释概念如何用于推理的统一模型仍然难以捉摸。本文利用概念空间理论（Gärdenfors，2000，2014）作为一个全面的框架，用于分析认知科学中探索的各种基于概念的推理。我们方法的基本前提是，推理利用的是概念表征的结构属性，而不是语言的语法属性——正如经典观点所假设的那样。概念空间使我们能够模拟心理学文献中推理分析的几个关键概念，如原型、相似性、典型性和诊断性。这些定义在一系列心理学领域的适用性突显了我们方法的统一力量。

我们提议的关键动机与所谓的“推理心理学的新范式”（参见Tessler & Goodman，2019；Oaksford & Chater，2020）一致，该范式使用贝叶斯模型（以及概率）来检验推理和理性的各个方面。然而，我们的方法在几个关键方面有所不同。首先，新范式主要关注条件句在一般领域推理中的使用。相比之下，概念空间方法侧重于依赖于语言的非逻辑术语而不是句子结构的特定领域的推理类型。其次，新范式没有深入探讨概念的性质或它们在推理中的作用，而本文提出的框架则弥合了这两个研究领域。最后，我们认为并非推理中使用的所有机制都可以用概率模型来建模。例如，我们将在关于泛化的部分中展示，概率模型在处理某些情况时会失败。同样，概率模型也不能有效地适应类比推理。此外，人们在推理时经常违反概率的基本原则。一个经典例子是“琳达问题”（Tversky & Kahneman，1982），它展示了所谓的合取谬误。Osta-Vélez，M. & Gärdenfors，P.（2022a）展示了如何可以用基于相似性的期望而不是概率来分析这个例子。

我们的分析将从考察利用概念的原型结构的推理过程开始。由于Rosch（1975）和Barsalou（1985）的开创性工作，现在普遍接受大多数自然类别具有原型结构。这种语义表征的特征对于分类等认知任务尤为重要，但它也在不确定性的推理中发挥作用。我们的第一个主题将是一个基于对概念的期望的推理模型。需要注意的是，我们的期望概念是非概率的。

我们的第二个主题涉及泛化表达在概念形成和推理中的作用。泛化是“X是Y”（例如，“老虎有条纹”）或“X导致Y”（例如，“鲨鱼会杀人”）形式的陈述，它们一直难以用传统逻辑工具进行分析。文献中的许多提议都遇到了问题。我们建议不应从真值条件的角度来处理泛化，而应将它们视为表达可能因强度而异的期望的句子。这使它们能够传达有关类别的结构信息，并与事实知识结合以得出实际结论。为了量化泛化表达的强度，我们建议使用典型性概念，我们将其定义为概念空间中属性与原型之间的距离。

我们的第三个研究主题集中在归纳推理上。哲学家们对归纳进行了广泛研究，但它仍然对基于逻辑的方法构成挑战。一种突出的基于概念的推理形式是基于类别的归纳，这是一种利用对概念关系的知识来估计将一个属性从一个类别投射到另一个类别的可能性的推理机制。例如，因为狗具有某种属性，所以推断狼也具有该属性似乎是合理的，因为这两个类别之间的相似性很强。在过去的几十年中，心理学家已经确定了这种机制的几个特征，并提出了各种形式模型来解释它。在我们的分析中，我们回顾了一些关键提议，并认为概念空间理论可以作为建模基于类别的归纳的统一框架。

我们最后的主题围绕类比展开，这是一种基本的认知机制，通过识别看似不同的知识领域之间的相似性来组织我们的概念知识。类比被广泛认为在推理中发挥着关键作用（例如，Bartha，2010；Hofstadter & Sanders，2013）。然而，关于类比的文献相当多样化，提出了各种理论。在我们的分析中，我们回顾了该领域中一些最重要的提议，并提出了一个包括类比关系分类体系的综合模型。我们提出的模型提供了一个新的视角，用于通过概念空间中的距离概念来理解和建模类比。这种方法为理解类比推理及其潜在的认知过程提供了一个统一的框架。

本文中我们考察的四种基于概念的认知机制传统上一直被使用不同的方法分别研究。然而，本文的一个中心主题是展示它们之间存在着紧密的联系，它们都依赖于相似性、典型性和诊断性。我们认为，通过使用概念空间作为建模工具，我们可以更好地理解这些相互关系。我们提出的模型为这些不同的机制提供了统一，使我们能够对概念推理产生新的预测。

实现：

2 推理中期望的作用

从经典逻辑的视角来研究推理，会使我们陷入两个无根据的假设：第一，推理是句子（或命题）之间的关系；第二，论证的有效性完全取决于前提和结论的形式结构，与其含义或推理所处的语境无关（参见Gärdenfors，1992）。这导致我们从纯粹的语法角度来理解推理，而与语义概念毫无关联（例如，Bonatti，1994）。句子中谓词的内容被认为完全无关紧要（例如，Fodor & Pylyshyn，2015）。简言之，经典逻辑假定形式与内容之间存在明确的区分，并将推理描绘为信息上保守的，即论证的结论中的信息包含在前提中。

然而，日常推理显然不仅仅建立在明确前提的逻辑形式之上。由于我们大多数的决策都是在不确定性下做出的，我们的推理机制几乎无法承担信息保守的代价（参见Oaksford & Chater，2009）。我们必须不断冒险，并以富有成效的方式运用我们的背景知识来补充前提中的明确信息。我们的一项主要论点是，这些背景知识的很大一部分是关于概念结构及其相互关系的知识。

这种背景知识的运用的一种特定表现形式就是我们对世界的期望。例如，如果我们看到一个苹果是红色的，我们就会期望它是甜的；或者如果我们转动汽车的点火钥匙，我们就会期望发动机会启动。一般来说，我们对世界的期望对于引导我们在日常生活中的推理和行动至关重要，它们直接建立在我们的背景知识结构之上。

在逻辑传统中，这种期望被应用到所谓的非单调逻辑中。Gärdenfors（1992）和Gärdenfors与Makinson（1994）认为，非单调逻辑的大部分可以借助对作为论证中隐藏前提起作用的期望进行分析而归结为经典逻辑。其指导思想是，当我们试图确定一个结论C是否从一组前提P中得出时，我们在推理中所使用的背景信息不仅包含P中的前提，还包括关于我们在特定情境下期望的信息，从而使我们得到一个更大的假设集合。这些期望可以被表达为默认假设，即关于什么是正常或典型的陈述。它们不仅包括我们的知识作为极限情况，还包括其他被认为足够合理而可以作为推理基础的信念，只要它们不引起不一致性。因此，期望是可反驳的，也就是说，如果P中的前提与某些期望相冲突，我们在确定C是否从P中得出时就不会使用它们。期望基本上与逻辑论证中的明确前提以相同的方式使用；不同之处在于，期望一般来说比前提更易被反驳。

这种方法的局限性在于，它既没有说明期望是如何产生的，也没有说明如何衡量它们在论证中的强度。我们将论证说，关于概念结构以及属于一个概念的事物的典型性的知识可以用来填补这些空白。为此，我们接下来引入概念空间理论作为建模这种知识的工具。

3 概念空间作为建模框架

3.1 概念空间的基础

概念空间（Gärdenfors，2000，2014）作为一种语义学研究项目被开发出来，它使用几何方法来研究概念的结构及其相互关系。这种方法基于两个关于概念和属性的构成和结构的核心观点：（i）它们由质量quality维度的簇构成，其中许多质量quality维度是由感官输入（如颜色、大小和温度）产生的；（ii）它们具有几何或拓扑结构，这种结构是各个维度特定结构整合的结果。

质量quality维度可以是整体的或可分离的。当不能单独为一个对象在一个维度上赋予一个值而不同时在另一个维度上赋予另一个值时，这些维度就是整体的（Maddox，1992）。例如，不能单独为一个音调的音高赋予一个值而不同时为响度赋予一个值。当质量quality维度不是整体的时候，它们被称为可分离的。

我们将“域”定义为一组整体的维度，这些维度与其他所有维度都是可分离的。例如，人类对颜色的感知属性由三个基本的颜色感知参数构成：色调、饱和度和亮度（Gärdenfors，2000，2014）。任何颜色感知都可以映射到这些维度的某些特定值上。更一般地说，不同的颜色可以被描述为这三个参数可能值的区域（见图1）。

该理论的一个核心标准是自然属性（如颜色）对应于单个域中的凸区域（Gärdenfors，2000：71）。当对于区域中的每一对点x和y，它们之间的所有点也都位于该区域内时，该区域就是凸的。这样，该标准就假设“介于……之间”的概念对于相关域是有意义的。

“概念空间”这一核心概念被定义为一个或多个域的集合，这些域具有一个表示属性、概念及其相似性关系的距离函数（度量）。距离函数可以不同；最常见的是欧几里得距离，但在不同的情境下，曼哈顿距离和极坐标距离也可能适用（参见Shepard，1964；Johannesson，2002；Gärdenfors，2014）。

概念和对象之间的相似性被定义为空间内它们距离的单调递减函数（Shepard，1987）。这使得我们的相似性概念与Tversky（1977）的相似性概念不同，后者的相似性是基于比较两个对象所共有的属性数量与它们不同的属性数量。

3.2 属性和概念

自然语言中的许多谓词，尤其是由名词表达的那些，不能在单个域内定义，而是作为属性的簇来定义。这一事实促使我们将谓词分为属性和概念。属性是单个域中的凸区域，而概念是在一组相互连接的域内的凸区域（Gärdenfors，2000：第4.2.1节）。对于大多数概念而言，构成它们的域可以通过不同的方式相互关联。例如，在“水果”这一概念中，大小和重量，或者成熟度、颜色和味道等属性是共变的。这些共变关系产生了对于利用语义属性的推理程序至关重要的期望。

以一个基本的水果概念空间为例，该空间由颜色、味道、成熟度、质地和形状这五个水果属性域组成。“水果空间”将是这五个域的笛卡尔积。而“苹果”这一概念将占据这些域中特定的子区域，这些子区域对应于这些水果的可能属性以及这些域区域之间的相关性，如图2所示。

以这种方式表示概念的一个重要优势是，它使我们能够以一种自然的方式解释类别的原型结构（Gärdenfors，2000；Lakoff，2008；Rosch，1975，1983）。如果概念被定义为n维空间内的凸区域，那么每个区域内的某个点可以被解释为该属性或概念的原型。反过来，给定一组原型p1、p2……pn以及一个欧几里得度量，可以通过将空间划分为凸区域来限定一组n个概念，使得对于每个点x∈Ci，当i≠j时，d(x,pi) 沃罗诺伊镶嵌 Voronoi tessellation，其二维示例如图3所示。因此，假设在受分类的子空间上定义了一个度量，那么一组原型将通过这种方法产生对该子空间的唯一划分，将其划分为凸区域。

在这个框架内，对象被视为概念的实例，并映射到空间中的点，而概念则被表示为区域（点的连通集合）。这使得我们能够表示分级成员关系和典型性的程度（Rosch等人，1975；Hampton，2007），也就是说，我们可以根据对象相对于原型的位置，将它们在空间中表示为类别中更典型或不太典型的实例。以这种方式表示典型性在分类（Gärdenfors，2000，2014）和归纳推理（Gärdenfors & Stephens，2018；Osta-Vélez & Gärdenfors，2020）等过程中具有认知经济性方面的诸多优势。正如我们将要论证的，这一事实对于表示期望至关重要。

3.3 语境、领域显著性与动态概念空间

任何概念理论都必须解释的一个重要现象是，心理相似性是一种可变的度量，取决于语境（Goodman, 1972）。特别是，正如 Nosofsky（1986）所注意到的，概念相似性会因对比较概念特定领域的关注而被调节。例如，苹果通常被认为比枣更类似于西红柿。然而，在选择甜点的语境中，“甜度”是一个显著特征，相似性判断预计会发生变化。语境效应在心理学文献中已被广泛研究（见 Goldstone 等, 1997；Keßler 等, 2007），并且几何相似性模型常因其难以解释这些效应而受到批评（Tversky, 1977；参见 Decock 和 Douven, 2011 的综述）。然而，概念空间模型并不存在这些缺陷（Johannesson, 2000; 2002）。心理相似性的语境敏感特性通过加权距离度量来解释。例如，在欧几里得度量的语境下，距离度量将包括显著性权重 ，这些权重调整了概念空间中第 i 维的显著性：

当赋予某个权重 较大的值时，概念空间会沿着该维度被放大，这意味着在确定类别之间的相似性时，第 i维将变得更加重要，因为当 较高时，较大的距离（即不相似性）会被施加更高的惩罚（Gärdenfors, 2000: 20）。正如我们将在后文展示的，这一加权距离函数将在解释基于案例的归纳中语境的作用时发挥核心作用。

4 典型性与诊断性

接下来，我们将展示概念空间如何凭借其特定的度量结构，使我们能够对典型性和诊断性进行建模。这些是概念分析以及基于概念的推理中的核心概念。

4.1 生成预期

我们首先展示如何通过概念空间来建模预期。我们认为，预期在很大程度上依赖于概念的原型结构。在本文中，我们仅分析关于推理对象属性的预期，而不考虑对象之间的关系。

生成预期的底层方法源自格莱斯（Gricean）最大信息量原则的一个版本（Grice, 1975）。例如，如果你被告知某个对象 x 应该被归类为鸟，但你不知道 x 是哪种鸟，那么你会预期 x 具有鸟类的所有典型属性：x 有翅膀、有喙、筑巢、会唱歌、会飞等等。最大信息量原则要求，如果这些关于 x 的预期未被满足，你的信息提供者应该传达更具体的信息。

此外，当新信息被加入时，预期会被重新调整。例如，在得知 x 是一只鸟之后，如果你进一步得知它是一只鸵鸟，你将不再预期它会飞或会唱歌。相反，一些新的预期会被添加进来，比如 x 很大、跑得很快、踢得很有力。

4.2 典型性标准

这种对预期的分析可以使用概念空间进行形式化。一个概念 M 的表示C(M) 可以被视为 n 个域的笛卡尔积的一个子集：

4.3典型性测量

4.4 诊断性

这一诊断性的概念基于以下原则：某一类别的某些属性可以作为关键区分因素，将其与同一对比类别中的其他类别区分开来（参见 Tversky, 1977）。例如，考虑鸟类中“有翅膀”这一属性。这一属性具有高度的诊断性，因为它显著地将鸟类与其他通常没有翅膀的动物类别（如哺乳动物或爬行动物）区分开来。这类属性在概念结构中扮演了重要角色，因为它们信息量最大，并在分类过程中减少了不确定性和模糊性。

在我们的模型中，我们通过考虑直接上位类别的原型来处理对比类别的影响。我们可以用概念空间中的典型性来定义诊断性，如下所示：

需要注意的是，在典型性和诊断性度量中，我们并不统计实例的数量，而是基于与原型的相似性。换句话说，我们的模型不是概率性的。概率模型无法为预期排序提供正确结果，因为某些可能的属性可能是非典型的。例如，典型的乌龟是成年乌龟，但乌龟在成年之前死亡的概率非常高。

5 泛型

Generics

概念的原型结构不仅在不确定性推理中表现出来，还体现在日常交流中，特别是在我们使用泛化句（generic sentences）高效传递关于世界的信息时。泛化句的形式为“Fs 是 Gs”，例如“鸭子会下蛋”、“法国人喜欢葡萄酒”或“老虎是凶猛的”。这类句子在日常交流和认知中占据核心地位，并长期以来吸引了心理学家、哲学家和语言学家的关注（例如 Gelman, 2010；Krifka 等, 1995；Leslie & Lerner, 2016）。

表面上，泛化句似乎涉及某属性在实体群体中的普遍性。然而，当我们分析它们在日常认知中的使用时，发现统计因素的作用微乎其微。例如，人们通常认为“鲨鱼会杀人”这一陈述是有效的。然而，因鲨鱼导致的人类死亡非常罕见，许多种类的鲨鱼对人类完全无害。同样，“狮子有鬃毛”这一泛化句通常被认为是有效的，即使它只适用于一个相对较小的子类（成年雄狮）。

由于我们的大部分世界知识来源于泛化句，它们在认识论上具有重要意义（Gelman, 2021）。然而，它们特别难以分析，因为它们通过相同的语言形式表达了各种截然不同的信息。已有一些尝试对其进行解释（例如 Cohen, 2004；Pelletier & Asher, 1997；Sterken, 2015b），但它们都面临问题（参见 Leslie, 2008）。一些模型是概率性的（例如 Tessler & Goodman, 2019；van Rooij & Schultz, 2019），但正如我们在引言中所解释的，有强有力的论据反对使用概率模型来解释概念推理。

以下经典例子是一个归谬法，表明简单赋予真值条件是行不通的：

(1) 鸟会飞。

(2) 企鹅不会飞。

(3) 企鹅是鸟。

这个悖论在于，这三句话都是有效的泛化句通用句子，但如果将它们解释为通用句子，则无法同时为真。

对于逻辑学家来说，典型的回应是说 (1) 和 (2) 并非真正的全称句，而是隐含了类似“典型情况下，鸟会飞”或“通常情况下，企鹅不会飞”的意思。基于这种直觉，许多人假设泛化句的“深层结构”通过一个隐藏的操作符（称为“Gen”）结合了两个谓词，该操作符指向某种量化的副词，如“典型地”、“一般地”或“通常地”。许多人认为，明确 Gen 的含义是确定泛化句真值功能结构的关键（例如 Pelletier & Asher, 1997），但 Leslie（2008）令人信服地表明，目前没有对 Gen 的语义做出令人满意的描述。

我们认为，从泛化句在概念推理中的功能性角色角度分析其意义，比从真值功能角度分析更有成效。

我们的提议并不是将泛化句视为可以单独评估的陈述。相反，我们采取一种认知方法，聚焦于它们与推理中作为预期功能的其他陈述之间的互动（如前一节所分析的内容，参见 Leslie, 2008；Prasada 等, 2013）。更具体地说，我们的主张是：(i) 泛化句具有可以通过其与编码概念知识的大量命题簇的关系来评估的强度程度；(ii) 它们在归纳推理中特别重要。

在文献中，关于应该区分多少种泛化句类型一直存在讨论。例如，Leslie 等（2011）和 Prasada 等（2013）建议至少有五种类型。我们提出了一种新的分类，区分了两种主要类型的泛化句：(a) **属性泛化句**，涉及对象的特征属性；(b) **诊断性泛化句**，涉及概念的诊断性。

我们的分析基于对经典“知识-什么”和“知识-如何”（Ryle, 1949）区别的进一步细化，并增加了“知识-什么”的分类（Gärdenfors & Stephens, 2018）。“知识-什么”关注的是代理与描述世界的命题之间的关系，而“知识-如何”关注的是代理的能力、倾向和行动。相比之下，“知识-什么”关注的是分类能力，特别是了解类别与属性之间的关系。

“知识-什么”可以细分为关于类别的三种信息：定义属性、特征属性和偶然事实（也可参见 Keil & Batterman, 1984 和 Gärdenfors & Stephens, 2018）。这三种信息可以通过一个关于“蜘蛛网”类别的例子来说明：

定义属性蜘蛛网是由蜘蛛身体分泌的一种蛋白质纤维制成的。
特征属性蜘蛛网用于捕捉昆虫。
偶然事实地窖里有大量的蜘蛛网。

一个类别的定义属性指的是与其词汇对应物“核心”意义相关的信息。特征属性指的是关于该类别的普遍知识，即通常适用于该类别的属性（可能有例外）。当特征属性以句子形式表述时，定义属性与特征属性的区别对应于科学哲学中关于定义性句子和规律性句子的区别（Hempel, 1965）。然而，我们并不假设定义属性和特征属性之间有一条明确的界限。偶然事实包含关于某个类别特定实例的信息。

诸如“蓝鲸吃浮游生物”和“老虎身上有条纹”这样的泛化句被用来表达类别“鲸鱼”和“老虎”的一些特征属性。像“老虎是哺乳动物”这样的句子则是定义性的。相比之下，像“蓝鲸可以在好望角附近看到”和“老虎可以在喜马拉雅山麓找到”这样的事实全称句表达了关于世界的偶然事实，这些事实并不属于概念的特征属性。

5.1 属性泛化句表达概念之间的关系

Property Generics Express Relations Between Concepts

属性泛化句的形式为“As 是 B”或“As 拥有 B”，其中 A 表示一个类别（由名词或名词短语表达），B 表示一个属性（通常借助形容词表达）。我们认为，这些泛化句并不捕捉任何关于该属性与名词所指对象类别的统计事实，而是表达该属性对于名词所代表的概念具有特别的相关性。在大多数情况下，这些泛化句传递的是关于某一属性的典型性或诊断性的信息。例如，考虑泛化句“狮子有鬃毛”。尽管事实上大多数狮子并没有鬃毛（只有成年雄狮才有），但这一泛化句通常被接受，因为拥有鬃毛既是“狮子”这一类别的典型特征，也是其诊断性特征。

现在，将“狮子有鬃毛”与偶然性的句子“狮子在后院”进行比较。它们在推理上是不同的：“狮子在后院”是向上蕴含的（参见 Huang, 2011），即，如果我们将“狮子”替换为其上位概念（例如“动物”），它仍然为真。这显然不适用于“狮子有鬃毛”，因为“动物有鬃毛”并不成立。

众所周知，泛化句和偶然全称句generics and accidental universals behave 在语言行为上表现不同，正如 Lawler（1973）所指出的：

(D) 蓝鲸吃浮游生物。

(E) 一只蓝鲸吃浮游生物。

(F) 蓝鲸可以在好望角附近看到。

(G) 一只蓝鲸可以在好望角附近看到。

(4) 描述了蓝鲸的一个特征属性。它可以被替换为不定单数形式 (5)。泛化句表达了“蓝鲸”这一概念与“以浮游生物为食”这一属性之间的关系。相比之下，(6) 是一个偶然全称句。对此的检验是，它不能被替换为不定单数形式 (7)。

关于我们提出的属性泛化句的第二个主张是，其意义取决于背景知识的结构以及语用因素。在文献中，泛化句通常被作为孤立表达来分析。我们改变了视角，将泛化句视为必须与其他预期一起评估的预期（参见 Leslie, 2012）。我们认为，属性泛化句（作为表达“知识-什么”的句子）涉及谓词属性的语义域与句子中类别的兼容性关系。简而言之，泛化句关注概念或多或少的典型属性：某一属性对概念越具有典型性，相应的泛化句就越强。根据可用信息的不同，泛化句可能会以不同方式与背景知识相互作用，并在推理中以不同方式使用。令人惊讶的是，文献中尚未有尝试具体说明我们对类别结构的知识如何与我们对谓词属性的知识相互作用。

其背后的理由与第 4.1 节中解释的一致：当将对象 x 归类为 C 时，可以利用因归入 C 而对 x 应具有的属性的预期来生成泛化句。这些预期将遵循由概念的原型结构决定的排序，并且对格莱斯（Grice）的交际原则敏感。例如，如果你被告知某个对象 x 应该被归类为鸟，但你不知道 x 是哪种鸟，那么正如之前所述，你会预期典型的属性可以应用于 x 。格莱斯的最大信息量原则表明，如果你的对话者没有传达更具体的信息，则可以认为这些泛化属性适用于 x 。因此，我们将属性泛化句“Fs 是 G”解释为“与原型相似的 Fs 具有属性 G”。

格莱斯语用原则加上预期排序的原型组织结构，告诉我们哪一组泛化句更适合某些信息。换句话说，可以根据泛化句的强度建立一个排序，这个排序将反映预期集中典型属性的内部排序。例如，比较以下两个有效的泛化句：

(8) 大象有象鼻。

(9) 大象是灰色的。

“有象鼻”比“灰色”更能代表大象的特征属性。我们可以很容易接受白色、黑色甚至粉红色的大象的存在，但没有象鼻的大象则被视为一种“残缺”的大象，比非灰色的大象更不常见。根据我们的典型性度量，非灰色的大象比没有象鼻的大象更具典型性。这在图 4 中得到了说明，其中度量 分别表示“灰色”和“有象鼻”的典型性。

这一方法的主要预测是，属性泛化句的强度将是该属性在概念空间中典型性程度的正函数。一般规则是，某一属性对特定类别越典型，相应的泛化句就越强。这一规则解释了为什么实例的比例并不能决定泛化句在论证中的有用性。例如，“书是平装本”虽然可能性很高，但这一泛化句并不涉及特征属性。

这种关于泛化句如何在推理中使用的分析最重要的结果是，它不需要任何额外的语言或逻辑操作符。特别是，不需要“Gen”或默认操作符。相反，我们假设泛化句可以根据其在适当概念空间中的预期强度进行排序。

5.2 诊断性在泛化句中的作用

概念可以被理解为以具有横向和纵向维度的层级结构组织起来（Rosch, 1983）。横向维度涉及同一抽象层次上概念之间的对比关系。例如，狗、猫、狮子和马处于对比关系中，因为任何属于其中一个概念的对象会自动被排除在其他概念之外。这种关系发生在概念被包含在同一个上位类别的划分中时（在我们的例子中是“哺乳动物”）。上下位关系则编码在纵向维度中。我们将概念 M 的对比类别称为集合 CC(M) ，它包含与 M 不同但共享其直接上位类别的概念。

许多泛化句被发现表达了对某一概念具有诊断性的属性。例如：

(10) 狮子有鬃毛。

该泛化句表达的是：

狮子与其他猫科动物不同，它们有鬃毛。

换句话说，在对比类别 ( CC(lion) = {老虎、猎豹、美洲豹、豹等} 中，“有鬃毛”对狮子具有诊断性。

在我们的模型中，我们通过考虑直接上位类别的原型来处理对比类别的影响。当一个属性最大化某一类别与其对比类别之间的差异时，它就具有诊断性，从而加速分类（Tversky, 1977）。我们在第 4.3 节中提出的诊断性度量确保，对于一个类别相对于其对比类别的两个同样显著的属性，典型性程度较高的属性将具有更高的诊断价值。

我们预测，包含诊断性属性的泛化句比非诊断性属性的泛化句更容易被接受，因为学习或确认这些属性对代理的概念系统具有积极的认知效应。例如，(10) 应被视为比“狮子有胡须”更具信息量，因为“有鬃毛”包含了特定于该类别的信息，并有助于将其与其他类别区分开来，而“有胡须”是 CC{lion} 中所有成员共有的，可以从上位类别“猫科动物”的特征知识中推断出来。

现在，某些属性可能对某一类别具有诊断性，同时却并非典型甚至罕见。例如，考虑以下泛化句：

(K) 法国人吃马肉。

尽管马肉在大多数法国人的饮食中并不典型，但它在该国少数地区很常见；那么为什么 (11) 被认为是一个可接受的泛化句呢？答案是，(11) 中的属性相对于的诊断性价值补偿了其较低的典型性程度。换句话说，“吃马肉”这一属性对于法国人来说比 CC{Frenchmen} 中的任何其他类别更符合预期。

基于这些观点，我们提出，形式为“ M 是 R ”的泛化句是一个有效的诊断性泛化句，如果 R 对 M 具有高诊断性价值（相对于假定的上位类别 N 。这一标准使我们能够捕捉到以下直觉：具有典型性和诊断性价值的泛化句比具有非典型但有诊断性价值的泛化句更强。例如，“法国人说法语”比“法国人吃马肉”更强。

上述分析表明，在评估泛化句时有两个因素在起作用。第一个因素与泛化句中属性的典型性程度有关，第二个因素则与其以诊断性价值形式提供的信息贡献相关。为了说明两者的区别，将 (10) 与泛化句“狮子有骨头”进行比较。尽管后者非常强，但它可能显得显而易见，因为其中的信息对于任何熟练的语言使用者来说是“推理可得的”。也就是说，关于“狮子”类别的最低限度知识足以让你推断出这个泛化句。另一方面，(10) 包含了无法从“狮子”的上位类别推断出的信息，并且有助于在对比类别中明确该类别。

与属性泛化句不同，诊断性泛化句无法通过 Lawler（1973）的测试：泛化句“法国人吃马肉”并不等同于“法国人吃马肉”，同样，“狮子有鬃毛”也不同于“一只狮子有鬃毛”。这一观察结果支持了这两种泛化句确实不同的观点。

在文献中（Leslie, 2008；Prasada 等, 2013；Sterken, 2015a；van Rooij, 2019），所谓的“引人注目的属性泛化句”被提出作为一种特殊类型的泛化句。以下是两个例子：

(12) 蜱虫传播莱姆病。

(13) 鲨鱼杀人。

我们的提议是，使它们有效的并不是它们涉及引人注目的事件，而是它们属于诊断性泛化句。尽管携带莱姆病的蜱虫很少，但这在蜱虫中的发生率仍高于CC{ticks} 中的任何其他类别（上位类别可能是“虫子”——蜱虫不是昆虫而是蛛形纲动物）。事实上，蜱虫可能是唯一携带这种疾病的动物。基于这一分析，我们拒绝将“引人注目的属性泛化句”视为一个独立类别的提议。

5.3 泛化句的功能

一个基本的语用学问题是：泛化句的用途是什么？简而言之，我们的回答是，它们的主要作用是表达不同强度的预期，这些预期可以用于我们在本书中提出的各种推理形式。我们推测，儿童在早期就学会了利用泛化句生成的预期进行推理，但我们尚未发现与此立场相关的实证研究。

泛化句Generics似乎在教学中，特别是在所谓的“自然教学法”中扮演了核心角色。自然教学法是指父母和其他人在日常情境中的教学方式（Csibra & Gergely, 2009）。当孩子还小的时候，我们就会告诉他们类似这样的话：“猫喵喵叫，狗汪汪叫，牛哞哞叫”。10 在学校里，他们后来会学到像“老虎有条纹”、“铜能导电”和“民主国家有言论自由”这样的泛化句。这类属性泛化句是一种展示各类别特征属性的方式（Leslie, 2008）。学习类别主要通过它们的特征属性完成。11 至于包含显著属性的诊断性泛化句，例如“狗咬人”，它们则充当行动中谨慎行事的指南（Sterken, 2015a）。

Mattos 和 Hinzen（2015）认为，自然教学法是语言的主要功能之一。他们写道，人类有一种“通过交流获取不同类型信息的特定能力——分别是关于种类的知识和关于特定事件、行为及事态的知识，我们在这里简单称之为‘关于事实的知识’”（Mattos & Hinzen, 2015: 7）。他们还指出，儿童比学习关于事实的知识更早学习关于种类的知识。

6 基于类别的归纳推理

6.1 基于类别归纳推理的特性

在一篇开创性的文章中，Rips（1975）研究了一种归纳推理类型，它利用关于个体类别的信息来估计属性在它们之间的投射概率。例如，“狗有籽骨；因此，狼也有籽骨”依赖于“狗”和“狼”类别之间的概念相似性，而不是论证的逻辑形式或某些其他以命题编码的属性。特别是，Rips 发现类别之间的相似性是这种推理的指导原则，并提出自然类别的原型结构在判断归纳论证的强度时也起到了作用。

这种过程被称为基于类别的归纳推理（Category-Based Induction, CBI），由于其在处理不确定性中的作用，对我们认知生活至关重要：它使我们能够通过利用概念系统中存储的与未知概念 M 相似的事物信息来推理 M 。可以说，这是概念如何构成归纳推理的最清晰例子（Feeney, 2017: 167）。理解 CBI 的运作方式，尤其是这种推理形式利用了我们概念系统的哪些特征，可以为概念在推理中的作用这一普遍问题提供启发。在本节中，我们将讨论 CBI 的一般特性，并展示概念空间如何对其进行建模。

CBI 论证由泛化句（例如，“狗有籽骨”或“熊喜欢洋葱”）构成，这些句子既出现在前提中也出现在结论中。我们将形式为“X 具有属性 R；因此，Y 具有属性 R”的推理简写为“X ➝ Y”。这种简化的理由是，在几乎所有的研究中，受试者通常对属性 R 知之甚少或一无所知，因此它不会影响论证的强度。12

CBI 论证可以根据两个主要标准进行分类：根据其前提的数量，以及结论是否与前提处于相同的概念层次或某个上位类别。当前提和结论类别处于相同概念层次时，该论证被称为“具体的”，例如 robin ➝ crow。当论证涉及概括（向更高层次的概念“跳跃”）时，则称为“一般的”，例如 table ➝ furniture。

实证文献表明，CBI 中使用最稳健的标准是类别之间的相似性（Rips, 1975; Carey, 1985; Osherson 等, 1990; Lopez 等, 1992）。这可以表述为：我们对两个类别 X 和 Y 之间属性投射的预期是 X 和 Y 相似性的正函数。例如，“鸵鸟具有属性 R，那么鸸鹋也具有属性 R”的论证通常被认为比“鸵鸟具有属性 R，那么蓝鸦也具有属性 R”更强，因为鸵鸟与鸸鹋的相似性高于与蓝鸦的相似性。

CBI 论证前提中的类别典型性对属性投射的预期也有积极影响。例如，“知更鸟具有酶 E；因此，鸵鸟具有酶 E”的推理通常被认为比“企鹅具有酶 E；因此，鸵鸟具有酶 E”更强，因为知更鸟比企鹅更典型地属于鸟类。Hampton 和 Cannon（2004）表明，结论中包含高度典型类别的论证（如 chicken ➝ robin）被认为比包含非典型结论类别的论证（如 chicken ➝ vulture）更强。

这种典型性效应还产生了所谓的“不对称性”，即根据前提中类别的典型性程度，交换前提和结论中的类别通常会改变属性投射的预期。例如，“奶牛具有酶 E；因此，水獭具有酶 E”的论证被认为比“水獭具有酶 E；因此，奶牛具有酶 E”更强，因为奶牛比水獭更典型的哺乳动物。

另一个重要方面是，受试者在进行推理或判断此类论证的强度时，通常会假设前提共享一个共同的上位类别。有时，这个上位类别明确出现在结论中；其他时候，它只是被隐含地考虑。实证文献研究了与这种隐含的上位类别相关的四个重要现象：同质性、单调性、非单调性和前提多样性。

同质性指的是这样一个观点：结论中的类别越抽象且越不均匀，论证就越弱。例如，“知更鸟是 S，蓝鸦是 R；因此，所有鸟类都是 R”的论证被认为比“知更鸟是 R，蓝鸦是 R；因此，所有动物都是 R”更强。这并不令人惊讶。正如我们之前所说，当我们评估涉及概括的论证或进行推理时，我们会面对不同程度的不确定性。结论中的类别越抽象，我们需要从前提中获得的信息就越多以覆盖它。

一种可能的解释方式是通过参考相似性和典型性作为使用类别的两个主要标准。基本层次的类别更加同质，因此我们更容易在其成员之间应用相似性标准。而抽象类别则更加多样化且不均匀，因此比较其成员的相似性更为复杂（例如，“动物”类别包括高度不同的子类别，如大象和海星）。同样，基本类别具有清晰的原型，而我们很难为抽象类别构建原型（参见 Ungerer 和 Schmid, 2006: 第 2 章的解释）。在这个意义上，作为使用类别的标准，典型性在基本层次类别中比在抽象类别中更强。

单调性指的是这样一个事实：只要添加的前提类别包含在隐含的上位类别中，就会增强论证的强度（Osherson 等, 1990）。例如，形式为 (robin & hawk) ➝ bird 的论证比形式为 (robin & hawk & pigeon) ➝ bird 的论证更弱。然而，如果我们在前提中添加一个不属于隐含上位类别的类别，则论证会变得更弱。这被称为“非单调性”。例如，包含类别 (peacock & crow) ➝ bird 的论证比从 (peacock & crow & rabbit) ➝ bird 的论证更强。

最后，实证研究表明 CBI 中存在“多样性效应”（Feeney & Heit, 2011; Osherson 等, 1990）：像“马有尺骨动脉，海豹有尺骨动脉；因此，所有哺乳动物都有尺骨动脉”的论证被认为比“马有尺骨动脉，牛有尺骨动脉；因此，所有哺乳动物都有尺骨动脉”的论证更强。前提中的类别越不相似，论证往往越强。理解这一现象的一个有趣方法基于“类别覆盖”的概念（Osherson 等, 1990）。正如我们之前提到的，当进行或评估类别归纳时，我们（根据处理的是具体还是一般论证，隐式或显式地）将某个包含所有前提类别的上位类别作为参考。论证的强度在某种程度上取决于前提中的类别如何覆盖这个上位类别。例如，像马和牛这样的相似类别对上位类别的覆盖范围小于像马和海豹这样的不同类别。在这个意义上，覆盖范围可以用相似性来描述。

6.2 在概念空间中建模 CBI

其中 a 和 b 是正的常数，且 a > b 。这一假设表明，前提典型性对预期的贡献大于结论典型性，因为根据文献，前者比后者更为普遍。 a 和 b 的具体值必须通过关于 CBI 判断的实证数据来确定。

接下来，根据 Shepard（1987）提出的泛化通用定律，该定律声称相似性是距离的指数递减函数，我们可以对公式 (i) 取对数并得到：

现在，公式 (2) 捕捉了单前提具体论证的基本思想，即类别间的属性投射预期由三个因素的加权和决定：前提-结论相似性、前提典型性和结论典型性。

到目前为止，所提出的模型仅涉及空白属性的论证。然而，有强有力的证据表明，CBI 论证的感知强度可能受到代理对论证中属性的知识以及属性与类别之间可能的因果关系的影响（参见 Rehder 等, 2001；Coley 等, 2005）。出于篇幅原因，我们在此不详细讨论这一问题。然而，在 Osta-Vélez 和 Gärdenfors（2020）中，我们指出了通过调整空间距离函数中某些维度的权重来建模这一问题的可能方法。

6.3 实验证据

关于基于类别的归纳推理，有大量的实验证据（参见 Heit, 2000; Feeney, 2017）。Osta-Vélez 和 Gärdenfors（2020）表明，我们的模型可以解释这些实验结果的绝大部分。然而，大多数实验仅报告了定性结果。一旦底层概念空间的度量被估算出来，我们的模型还可以进行定量预测。Douven 等（2021）提出了一项研究，明确测试了我们模型的一些预测。实验中使用的刺激物并非对象的描述，而是从 Douven（2016）中的 49 张图片生成的对象，这些图片看起来像杯子、花瓶和碗，并且按照宽度和高度两个维度以 7×7 的方式组织。这些对象之间的心理距离已在 Douven（2016）中被仔细确定。因此，对象空间的距离函数已经可用。

该实验测试了从我们的模型中生成的两个假设：(i) 受概念空间中前提对象与结论对象之间距离以及这些对象对投射属性的典型性影响的邻近性论证强度是可以预测的。(ii) 提及两个体现邻近性推理的条件句的真值评分也可以基于完全相同的基础进行预测。

为了测试第一个假设，参与者被随机展示从空间中 49 个对象中选出的 12 对对象。对于每一对对象，参与者被要求假设左侧的容器是花瓶，然后指出这是否让他们有理由相信右侧的容器也是花瓶。回答需在 7 点李克特量表上给出。对于第二个假设，参与者被展示了相同的 12 对对象。在这一部分，参与者被要求评估一个条件句的真值，例如“如果左侧的容器是花瓶，那么右侧的容器也是花瓶。”然后，他们被要求指出他们认为这句话是真还是假，但也提供了“两者都不是”的选项。

结果为两个假设都提供了强有力的支持：前件-后件相似性与感知到的论证强度以及真值程度密切相关。更多细节请参见 Douven 等（2021）。

7 类比

到目前为止，我们已经分析了相对直接利用相似性的推理机制；但我们的认知还有更复杂的方式来利用这种关系。类比是其中一个典型的例子。例如，考虑以下句子：

(N) 猎豹就像赛车。

如果 (14) 被理解为表达类别之间的直接“总体”相似性（如“豹子像猎豹”），那么任何熟练的语言使用者都会觉得这句话没有意义。然而，在一种解释下，(14) 是有意义的，即相似性关系被理解为聚焦于两类之间共享的显著特征（速度）；换句话说，如果它被解读为一种类比。

从语义和认知的角度来看，类比例句非常特殊：它们的作用不是传达关于世界状态的信息，而是通过指出看似遥远的知识领域之间的相似性关系来丰富和构建我们的概念知识。在这个意义上，它们具有一种与抽象类别组织和形成特别相关的认知功能（参见 Gentner & Hoyos, 2017）。

尽管关于类比的文献浩如烟海，但尚无通用框架能够将类比机制解释为利用概念相似性的认知过程家族的一部分。本节将展示概念空间如何填补这一空白。特别是，我们将论证类比是一种依赖于维度显著性的领域特定机制，并可以被描述为一种搜索过程。

在过去的几十年中，两种类比结构占据了研究的主要注意力：直接类比和组合类比。前者将一个单独的源与一个单独的目标进行比较，如 (14)。后者则根据每对元素之间的某种显著关系比较两对对象或类别。例如，句子“脚对于腿就像手对于手臂”是一种组合类比，因为脚与腿之间的显著（部分-整体）关系对称于手与手臂之间的部分-整体关系。然而，在本节中，我们将聚焦于组合类比。我们将使用符号 ( A:B::C:D ) 来表示一种组合类比，其中 ( A:B ) 对 ( C:D ) 进行比较。

7.1 维度显著性

我们在此提出的方法基于两个观察结果。首先，我们认为组合类比需要在概念结构理论的框架下进行分析。其次，我们主张在大多数情况下，类比相似性依赖于**维度显著性**，更具体地说，依赖于识别一个或多个可以作为类比中类别比较框架的维度（领域）。这些维度对于给定类别的显著性程度与类比的“质量”或“恰当性”相关。这个最后的观点相当直接。请考虑以下类比：

(O) 狗:小狗::猫:小猫

(P) 甜:苹果::酸:柠檬

(Q) 热:暖::冷:凉

(R) 兔子:狮子::金枪鱼:鲨鱼

每个类比都涉及将第一对类别之间的显著语义关系投射到第二对类别中。这种关系依赖于识别类别的一维或多维属性，这些属性可以作为“类比因子”。在 (O) 中，类比因子是年龄维度；在 (P) 中是味觉领域；在 (Q) 中是温度维度；在 (R) 中是大小和凶猛程度维度。类比因子通常是差异性的：它选择了一个维度，在该维度上，第一对类别的值存在显著差异。评估类比关系时的一个挑战在于，从构成所涉及类别的众多维度中识别出哪些维度更能承载类比关系。例如，在 (R) 中，大小可能是类比因子的良好候选者，但颜色显然不是。在我们的方法中，那些可能成为潜在类比因子的优先维度是第一对类别中最显著的维度。这种显著性因素在基于命题的计算实现中很难建模。

这种方法的一个直接预测是，类比的处理速度将与类比因子的显著性程度正相关，并与可被视为潜在类比因子的维度数量负相关。例如，(Q) 是一个直接的类比，因为只有一个维度将其四个类别联系起来；而 (R) 提供了多个可能的维度作为潜在类比因子，因此具有更高的类比复杂性。尽管经典方法倾向于寻找高度通用的类比模型（Gentner, 1983; Holyoak & Thagard, 1989），我们的观点则偏离了这一思路，认为类比是概念特定的。我们的立场是，类比利用了与其中出现的词语相关的表征结构的属性。由于不同的词类代表不同种类的概念（Gärdenfors, 2014），我们需要一种能够整合不同子模型的理论。与逻辑学和计算机科学中的传统方法（所有谓词都被同等对待）不同，我们旨在表明，将它们划分为不同的概念角色将产生更有成效的计算系统，表现为不同的搜索过程。

7.2 类比作为一种搜索

从计算的角度来看，我们提出类比可以被理解为一种搜索过程，即一种解决问题的策略，它包括在数据库中搜索满足问题特定条件的元素。我们将类比问题的组成部分描述如下：

搜索空间：词汇表 L 中的一组概念。

初始状态： A:B::C:X （其中 X 未知）。

目标条件：在 L 中找到（至少）一个元素 X ，使得 A:B 中的语义关系在 C:X 中得以复制。

搜索算法：在分析初始状态中的语义关系类型后定义。

最终状态：满足目标条件的一个概念（或概念的偏好顺序）。

在此框架下，解决（或验证）类比的过程首先通过识别 A:B 中的语义关系，并根据 C 限制搜索空间来开始。例如，类比“红色:苹果::黄色:X”涉及水果类别以及颜色维度中的典型属性。X 的搜索空间将是水果的概念空间，而目标条件将由那些黄色作为典型颜色的水果类别满足。16 第二步是具体化搜索算法，这将取决于需要复制的语义关系类型。一旦确定了其类型，该算法将应用于受限的搜索空间，寻找满足目标条件的一个或多个类别：即找到一个元素以完成 ( A:B ) 和 ( C:X ) 之间的“语义对称性”。

一个重要的点是，这种语义关系可以有多种类型。我们区分以下几种类型：(i) 分类（维度）关系（例如，金枪鱼:鲨鱼或热:冷），(ii) 属性-类别关系（例如，黄色:柠檬），(iii) 基于事件的关系（例如，开门:关门），以及 (iv) 部分-整体关系（例如，脚:腿）。在 Osta-Vélez 和 Gärdenfors（2022b）中，我们提出了几种基于概念空间的搜索算法，这些算法模拟了这些类比类型背后的推理过程。在本节中，我们将仅限于描述其中的两种算法。

7.3 基于类别的类比

最早的类比模型之一由 Rumelhart 和 Abrahamson（1973）提出，他们表明可以将类比相似性表示为多维空间中类别之间的语义距离的函数，这些类别被表示为空间中的点。特别是，他们主张形式为 ( A:B::C:D ) 的类比必须遵循“平行四边形规则”，即类别 A 和 B 之间的向量距离必须等于（或高度相似于）类别 C 和 D 之间的向量距离。

在一系列实验中，Rumelhart 和 Abrahamson 使用 Henley（1969）提出的三维哺乳动物空间（见图 6 中的一些示例）表明，当呈现类似猴子:猪::大猩猩:X 的类比问题，并给出兔子、老虎、牛和大象作为 X 的选项时，受试者会根据平行四边形规则对四个选项进行排序。该模型预测牛是首选答案。他们的实验清楚地支持了这一模型。

我们提出了一种广义版本的平行四边形模型，该模型遵循引言中描述的半算法方法。其基本思想是，进行向量比较的概念空间并不是固定的，而是取决于在每个具体类比中被视为类比因子的维度。

在我们的模型中，基于类别的类比 ( A:B::C:D ) 中的类别是共同概念空间 ( M ) 中的凸区域，因为它们都处于相同的概念层次。为了简化起见，我们假设每个类别都有一个精确的原型，由空间中的一个点表示。对于类别 X ，我们将该点称为。以下描述了搜索算法的主要步骤。

让我们通过一个简单的例子来说明这一过程。考虑不完整的类比 mouse:wolf::rabbit:X，以及一个包含河马、水牛、大象和大猩猩类别的简化搜索空间。 M 将是 Rumelhart 和 Abrahamson（1973）使用的哺乳动物空间（见图 6），而中用作比较框架的维度将是大小和凶猛程度，因为类别 mouse 和 wolf 在这些维度上存在显著差异。图 6 中的人性化维度较不显著，因此不会成为的一部分。然后，在加权概念空间中，将确定一个点 y ，作为以兔子原型为起点的向量的终点，该向量等价于由老鼠和狼的原型形成的向量。假设原型的位置如图 7 所示，水牛的原型是该类比的最优解，因为它比中任何其他原型更接近 y 。

类比并非全有或全无，而是具有不同程度的恰当性或合理性。例如，在基于类别的类比中，与最优选择（在加权概念空间中）非常接近的类别也可能构成良好的解决方案。此外，可能选择不同的维度集合作为类比因子，从而生成多种可能合理的类比。我们认为，在大多数情况下，会有一组特别显著的维度产生最强的类比关系。然而，提供一个系统化的标准来找到这组维度相当复杂，因为它强烈依赖于受试者对特定语义领域的知识，以及扎根于说话者群体中的语义直觉。最终，为给定类别找到显著维度集是一个实证问题。

7.4 基于属性的类比

Rumelhart 和 Abrahamson（1973）模型的一个重要局限性在于，它只能处理相同概念层次上的类比。请考虑以下两个例子：

(19) 苹果:红色::香蕉:黄色。

(20) 鱼:游泳::鸟:飞翔。

(19) 和 (20) 是合理的类比，但它们无法用平行四边形模型来分析。我们如何比较一种颜色与一种水果，或者一种动物与一种运动方式？从形式化的角度来看，无法比较来自不同概念空间的两个向量。

我们将像 (19) 和 (20) 这样的类比称为基于属性的类比。自然地，由于这些类比中术语对之间的语义关系不同于基于类别的类比，通过搜索算法解释它们需要采取不同的方法。特别是， X 的搜索空间将是与类比 C -部分类别共同属性相关的词汇项集合。

我们对基于属性的类比的提议非常直接：我们认为，一个类比的强度取决于两个因素：第一，识别与该对术语中的属性相对应的维度；第二，识别该属性对于该对术语中的类别的典型性程度。换句话说，我们通过检查每对术语中的属性是否来自同一维度，并借助我们的典型性条件来评估这些类比的恰当性，同时确认这些属性对于该对术语中的类别是否有类似的预期。从这个意义上来说，像 (20) 这样的类比必须被认为比变体 **鱼:游泳::鸟:行走** 更强，因为即使鸟能够行走，飞翔对于该类别来说比行走更典型（参见 Osta-Vélez 和 Gärdenfors, 2022b）。

给定一个类比 A:B::C:X ，其中 A 和 C 是类别， B 是 A 在维度 D 中的属性，选择 X 时给出最强类比关系的是维度 D 中的另一个属性，其典型性程度比 D 中任何其他属性的典型性程度更接近 B 的典型性程度。我们预测，如果在 D 中有多个属性对于类别 C 具有与 B 相同的典型性程度，则该类比将比那些不存在这种情况的类别弱。例如，类比狮子:米色::乌鸦:黑色必须被认为比狮子:米色::狗:棕色更强，因为除了棕色之外，还有其他几种颜色对于“狗”这一类别同样典型。

我们方法的一个重要贡献是对语义相似性在类比中的作用进行了详细分析。基于命题的观点，如 Gentner（1983）或 Thagard（Thagard 等, 1990）的观点，也依赖于语义相似性，但忽视了维度和显著性的调节作用。我们表明，关注概念结构而非命题结构在解释类比多样性以及设计建模算法方面具有明显优势。

8 结论

在哲学领域，基于概念的推理并未受到太多关注，因为这种推理并不符合“论证的有效性仅取决于前提和结论的形式结构”这一假设。相比之下，在心理学中，关于基于概念的推理的研究一直是活跃的领域，产生了大量的实验研究。然而，这些研究以相当零散的方式发展，使用了不同的理论框架和建模工具。因此，澄清推理与概念之间的关系变得必要。鉴于这种关系的复杂性及其展开所涉及的多种机制，在统一理论的框架内处理这一任务将是有益的。

作为统合这些领域的提议，并基于理性推理利用概念结构的属性而非语言的句法属性这一观点，我们提出了一个基于概念空间的框架。通过概念空间提供的距离度量，我们可以将典型性建模为到原型的距离，将相似性建模为点之间的距离。这些度量在我们考虑的所有推理类型中都发挥了核心作用。通过利用这些度量，我们的模型能够做出新的定量预测，这是以往的心理学模型无法实现的。在这里，我们重点讨论了预期、泛化句、基于类别的归纳推理以及组合类比，但概念空间的一般框架也可以应用于其他相关领域，如直接类比、隐喻和因果推理。该模型还使得比较不同子领域的预测和结果成为可能，例如泛化句与基于预期的非单调推理之间的关系。

我们认为，我们的模型相较于早期方法具有显著优势，因为它提供了更强的解释深度。其他方法通常只关注推理的某些计算方面，并假设概念信息的心理表征具有特定的格式，而没有进行批判性评估；而我们的模型不仅解释了概念为何具有其结构，还解释了推理机制如何在这些结构上运作。这种详细程度为我们提供了对人类推理和决策背后机制的更全面理解。

我们的方法可以通过心理学中一些成熟的实验范式进行实证检验。这些范式包括：归纳任务，用于考察参与者根据特定实例或类别进行概括的能力（例如 Heit, 1998）；特征列举，要求参与者列出某一概念的属性，特征的频率和顺序可以揭示其对概念的理解（例如 Sloman 等, 1998）；以及范例评分和典型性判断，涉及根据对象与先前例子或原型实例的相似性对其进行分类和评分（例如 Verheyen & Égré, 2018）。此外，空间排列任务要求参与者根据感知的相似性对物品进行物理排列，从而提供概念关系的空间表征（参见 Richie 等, 2020），而多维尺度分析（MDS） 使用基于相似性判断的距离统计技术来可视化概念空间的结构，从而对概念的相似性和差异性进行稳健分析（例如 Rips, 1975）。总体而言，这些多样化的范式为测试本文提出的模型的有效性和适用性提供了严格的实证框架。

在这篇综述中，我们并未直接考虑模型的计算应用。然而，开发此类应用的可能性是我们提出基于概念空间距离度量模型的动机之一。由于已经存在概念空间的计算模型（Adams & Raubal, 2009; Chella 等, 2001; Gärdenfors, 2014; Lieto, 2021; Wheeler 等, 2022），我们对不同形式的基于概念推理的描述原则上可以被计算实现。第一步是描述领域结构，这主要涉及指定其几何和拓扑结构。第二步是提供关于所得空间如何划分为概念的信息。通过使用原型和 Voronoi 分割，可以高效地完成这一任务。通过概念空间表示信息需要涉及向量的计算，基于相似性的推理，而不是基于规则符号方法中的树搜索机制。开发此类概念空间的计算实现可能有助于创建超越逻辑形式主义或神经网络系统的新自动化推理形式，这对于模拟基于概念的常识推理非常有用。

实现：

原文链接： https://link.springer.com/content/pdf/10.1007/s11023-023-09640-2

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.