用范畴论刻画类比:相关论文思想深度调研 1. Types of Relations: Defining Analogies with Category Theory(2025年5月,ArXiv)
知识域表示为范畴: Claire Ott 和 Frank Jäkel 在这篇论文中提出,用范畴(Category)来形式化知识领域,以便严格定义类比arxiv.org。具体来说,每个知识域被表示为一个小范畴 $\mathcal{C}$,包含对象(如实体集合、真值集合等)和态射(对象间的映射,表示属性或关系)themoonlight.io。例如,他们以经典类比“太阳系 vs. 氢原子”作为示例构造两个域范畴:对象包括实体集合 $E$(如行星/电子等)、布尔值集合 $B={\text{true}, \text{false}}$(表示关系是否成立),以及单位对象 $1$ 等;态射则刻画具体的知识内容:每个具体实体 $e\in E$ 对应一个态射 $e:1\to E$,一元属性对应态射 $a:E\to B$,$n$元关系对应态射 $r: E^n \to B$(其中 $E^n$ 是 $n$ 重笛卡尔积,表示 $n$元实体组)themoonlight.iothemoonlight.io。通过范畴的乘积构造,可以将关系的论元组合表示为对象(例如二元关系的论域 $E\times E$),关系本身作为从论域到布尔值的态射表示themoonlight.io。这种表示方法保证了域内结构信息得以明确表示:包括实体、属性,以及实体之间的各种关系及其真值themoonlight.io。此外,作者引入了关系对象化(objectification of relations)的思想,利用范畴论中的指数对象来提升关系为对象themoonlight.io。比如,$B^E$ 表示所有从实体集合 $E$ 到布尔值的态射之集合(相当于所有一元关系的类型),$B^{E\times E}$ 表示所有二元关系的类型。这使得“关系上的关系”(高阶关系)也能被建模为对象间的态射,例如定义一个态射 $\text{causes}: B^{E\times E}\times B^{E\times E} \to B^{E\times E}$ 来表示“因果”是两个二元关系之间的关系themoonlight.io。通过这种方式,高阶关系(如关系的组合、关系之间的关系)也能纳入类比映射的讨论范围。论文中的太阳系/氢原子案例中,域范畴包含了对象 $B^{E\times E}$(二元关系类型)甚至 $B^{B^{E\times E}\times B^{E\times E}}$(关系之间关系的类型)等,用于表示例如“引力导致公转”等更复杂的知识themoonlight.iothemoonlight.io。
类比映射为函子: 在该框架下,类比被定义为两个范畴之间的一个(部分)函子 $F: \mathcal{C} \to \mathcal{D}$,其中 $\mathcal{C}$ 是基础域(base domain),$\mathcal{D}$ 是目标域(target domain)arxiv.orgthemoonlight.io。函子必须保持范畴结构的映射:也就是说,它不仅映射对象之间的对应,还要映射态射(关系)并保持复合和恒等结构themoonlight.io。作者强调结构保真(structure-preserving)的要求,具体包括: (1) 恒等态射和复合保真,保证 $F(id_X)=id_{F(X)}$ 且 $F(f\circ g)=F(f)\circ F(g)$; (2) 对象映射的单射性,即基础域中不同的对象在目标域中映射为不同对象themoonlight.io; (3) 真值保持,即将基础域的真和假映射为目标域的真和假(因此 $1$ 和 $B$ 这两个特殊对象也对应映射)themoonlight.io; (4) 乘积保持,确保基础域中关系的论域结构在映射后仍对应目标域中的相应论域(例如 $F(X\times Y)=F(X)\times F(Y)$,保证 $n$元关系被映射为目标域中的 $n$元关系)themoonlight.io; (5) 指数(关系对象)保持,即若基础域中将关系当作对象(指数对象),那么函子需将其映射到目标域中对应的关系对象上(形式化地:$F(Y^X)=F(Y)^{,F(X)}$)themoonlight.io。通过这些约束,类比映射函子确保了关系对应关系、类型对应类型:例如,若基础域中“太阳吸引火星”命题为真,而类比映射将“太阳”对应到“原子核”,“火星”对应到“电子”,那么就要求目标域中对应的“原子核吸引电子”也为真themoonlight.io。这些约束使得类比如函子能够严格捕捉两个领域间结构上的相似性和差异themoonlight.io。在太阳系-氢原子的示例中,作者构造了满足上述性质的函子,将太阳系范畴中的对象(如 Sun, Planet 等以及关系 attracts, revolves around 等) 映射到氢原子范畴中对应的对象(Nucleus, Electron 等和相应关系)themoonlight.io。由于太阳系中存在“更热”这一关系而氢原子中无对应关系,为满足结构保真,他们通常会使用部分函子(partial functor)——即只映射参与类比的子范畴 $\mathcal{C}' \subseteq \mathcal{C}$themoonlight.io。这样可以忽略掉在目标域找不到对应的部分(如“太阳比行星更热”这一性质)arxiv.org。总之,函子观点提供了类比映射的精确定义:类比即在不同知识范畴之间保持结构的映射themoonlight.io。
类比的“核心”和“融合”: 基于上述函子定义,作者进一步利用范畴论的极限/余极限结构来刻画类比的公共核心和混成融合部分themoonlight.iothemoonlight.io。具体而言,给定类比函子 $F: \mathcal{C}\to \mathcal{D}$,其核心 (core)被定义为相对于 $F$ 的拉回范畴(pullback category)$\mathcal{C} \times_{\mathcal{D}} \mathcal{D}$themoonlight.io。这个拉回范畴的对象是形如 $(C, D)$ 的对,其中 $C$ 是基础域 $\mathcal{C}$ 的对象,$D$ 是目标域 $\mathcal{D}$ 的对象,并且满足 $F(C)=D$;其态射则是成对的 $(f, g): (C_1,D_1)\to(C_2,D_2)$,其中 $f: C_1\to C_2$ 属于 $\mathcal{C}$,$g: D_1\to D_2$ 属于 $\mathcal{D}$,并且 $F(f)=g$themoonlight.io。直观地说,核心范畴包含了类比中能一一对应的那部分结构:也就是基础域和目标域真正对齐的对象和关系集合themoonlight.io。这一核心捕捉了两个领域共享的抽象结构,忽略了各自独有的细节。例如,在太阳系–氢原子的类比中,核心范畴将包含“行星对应电子”“太阳对应原子核”以及“引力吸引”“公转”这些两域共有的关系匹配,但不会包含“更热”这种仅存在于太阳系的关系arxiv.orgarxiv.org。与此对应,类比的融合 (blend)被定义为一个推送范畴(pushout)$\mathcal{C} +{\mathcal{C}} \mathcal{D}$themoonlight.io。直观而言,融合范畴可以看作将基础域 $\mathcal{C}$ 和目标域 $\mathcal{D}$ 沿着它们的公共核心粘合在一起所得到的新范畴themoonlight.io。在该推送中,凡是基础域和目标域中通过 $F$ 对应的对象和态射都被“辨识”为同一个,从而合并;而各域中那些未匹配的部分则也被保留在新范畴中themoonlight.io。也就是说,融合结果包含了两域的并集结构:共享部分合而为一,剩余各自独有的部分也包含在内themoonlight.io。例如,对于太阳系–氢原子的类比融合,如果我们将太阳≡原子核、行星≡电子这样对应匹配,那么推送所得的blend范畴中,这对匹配的对象将合并为一个“混成”对象,且其上同时带有来自太阳和原子核的属性;同时,原太阳系中特有的“更热”关系和原氢原子中特有的其他关系如果没有匹配对象,也会出现在混成范畴中,连接着相应的对象themoonlight.iothemoonlight.io。这种blend结构正是Goguen提出的概念融合(conceptual blending)的形式化体现。通过 pullback 和 pushout,作者能够明确地区分类比中共同的对应部分和整合出的新知识结构themoonlight.iothemoonlight.io。值得注意的是,对于只映射了子范畴的部分函子情形,他们给出了类似定义:核心是 $\mathcal{C}' \times{\mathcal{D}} \mathcal{D}$,而融合是将基础域的该子范畴 $\mathcal{C}'$ 与目标域 $\mathcal{D}$ 做推送得出的范畴themoonlight.io。总的来说,这套范畴论工具为分析类比提供了强大的框架:核心揭示类比的精髓(共同结构),融合则展示类比如何生成新知识结构themoonlight.iothemoonlight.io。
总结与意义: 该论文的贡献在于提供了一种基于范畴论的精确定义,为类比的表示、发现和评估提出了统一框架themoonlight.io。通过将知识表示提升到范畴层次,类比被视为函子映射,从而可利用范畴论丰富的理论工具(如极限、伴随等)来刻画类比过程中的各要素arxiv.orgthemoonlight.io。特别是,作者展示了如何将类型理论(如布尔类型、乘积类型、指数类型)融合进知识表示,确保复杂关系(包括高阶关系)也能参与类比映射themoonlight.io。这种方法强调了结构相似性在类比推理中的核心作用,即类比不仅在于找哪些对象对应,而且要求对应关系下结构关系保持不变themoonlight.io。该框架为将来开发自动化类比发现算法提供了坚实基础,论文最后也指出可以进一步扩展到更丰富的域类型并实现计算工具themoonlight.io。
2. Structural Similarity: Formalizing Analogies Using Category Theory(2025年9月,MDPI Logics)
知识域表示为有色多重图: 相较于第一篇侧重类型范畴的抽象表示,Claire Ott 在这篇期刊文章中采取了一种图论结合范畴的方法,将知识域表示为着色的有向多重图(colored directed multigraph)mdpi.commdpi.com。每个知识领域的图包含节点(表示实体或概念)和有向边(表示实体之间的二元关系);此外,每条边携带一个颜色标签,用于区分关系的类型或性质mdpi.com。颜色并非指真实颜色,而是广义的标签,例如在太阳系–氢原子的例子中,用不同标签表示“吸引”“环绕”“更大质量”“更热”等不同关系类型mdpi.com。通过这样的着色,多重图不仅表现出领域内部的结构,还显式指明了哪些关系在不同域之间可被视为“相同或相似”mdpi.com。值得注意的是,在结构映射理论(Structure Mapping)中,对象自身的属性通常不作为主要匹配依据,关系结构才是关注焦点mdpi.com。因此,该表示方法突出关系的角色:如果两域中有边的颜色相同,表示这两种关系类型被认为可以对应;反之,不同颜色表示关系类型的不同mdpi.com。举例来说,太阳系域的“太阳吸引行星”边和氢原子域的“原子核吸引电子”边都标记为“吸引”(相同颜色),表明它们在类比中被看作对应关系;而“太阳比行星更热”在太阳系中有边,但氢原子中没有对应的“更热”关系边(或者颜色不匹配),因此这条边在后续将无法匹配到目标域对应部分mdpi.com。作者采用图的形式,一方面限制了讨论在一元和二元关系(因为图的边天然表示二元关系,节点自身的循环边可表示一元属性);另一方面,这种形式具备直观的可视化优势,便于演示类比过程中的结构对应。对于更高阶或 $n$元关系,作者说明可以在更一般的范畴框架下处理(正是参考了Ott和Jäkel的范畴方法)mdpi.com;但在本工作中,他们聚焦于二元关系情形,以图范畴为基础展开讨论。
类比映射为有色图态射: 作者将类比形式化为有色多重图范畴中的态射(morphism)mdpi.commdpi.com。首先,需要定义有色图范畴:其对象是上述的着色有向图,其态射则是结构保留的图映射mdpi.com。一个态射包括三部分映射函数mdpi.com:(1)节点映射 $\varphi_N$:将基础域图的每个节点映射到目标域图的某个节点;(2)边映射 $\varphi_E$:将基础图的每条边映射到目标图的一条边,并且要保持源、靶一致,即如果基础图中边 $e$ 从节点 $u$ 指向 $v$,那么映射后的目标边 $\varphi_E(e)$ 必须从 $\varphi_N(u)$ 指向 $\varphi_N(v)$mdpi.com;(3)颜色映射 $\varphi_C$:将基础图的边颜色映射为目标图中的边颜色mdpi.com。颜色映射需要保持同色约束:如果基础域中两条边颜色相同,则它们映射后的边在目标域中也应有相同的颜色(当然具体可对应不同颜色,但要保证等价类对应)mdpi.com。这种三重映射确保类比映射尊重节点对应关系、边关系结构以及关系类型标识的一致性mdpi.com。形式上,可以认为该范畴的态射定义了两个有色图之间的结构同态:它既是图同态(保持连接关系),又额外保持了颜色等价类。因为每个有色图都有恒等映射且映射可复合(逐点复合节点、边、颜色函数),满足范畴公理mdpi.com,因此所有有色图构成一个范畴 $ColoredGraph$,类比就是其中的一个态射。用该表示,类比就是一种把基础域的实体及关系结构映射到目标域的规则,对应关系类型也相匹配mdpi.com。在太阳系到氢原子的例子中,这种映射意味着:两个行星节点必须映射为不同于太阳节点的目标节点(因为氢原子只有一个电子,不存在自环对应关系)mdpi.com;标记为“吸引”的边由于在两域中都是双向存在,因此只能互相对应映射,而标记为“更热”的边在氢原子图中无对应,只能被映射为某种不匹配的边或忽略mdpi.commdpi.com。由此可见,不是任意的图态射都是“良好类比”——一些映射可能违背直觉(例如强行映射“更热”边到一个无意义的边)。因此,作者接下来利用范畴论工具来筛选出结构相似度高的映射,甚至允许部分映射(即不要求覆盖图中所有元素),以更合理地定义类比。
利用积和拉回寻找共同结构: 为了找到良好的类比映射,论文借助积(product)和拉回(pullback)这两个范畴概念来识别两域的公共结构,即“潜在对应部分”mdpi.commdpi.com。首先,笛卡尔积概念被引入有色图范畴中:给定两个图,对它们做范畴论意义下的积,将产生一个新的图,其节点集是两图节点集的笛卡尔积,边集是两图边集的笛卡尔积,颜色集也对应组合mdpi.com。积图的直观含义是所有可能的节点-节点配对和边-边配对都包含其中,因此它囊括了两个图之间一切可能的对应关系组合mdpi.com。然而,直接使用积往往过于庞大且包含很多不合意义的匹配(例如颜色不符的边配对也在其中)mdpi.com。因此,作者引入拉回作为一种对积的约束筛选mdpi.com。拉回一般定义为范畴中的“受限积”,可以通过一个“中间对象”$M$及两个态射 $f:X\to M$, $g:Y\to M$ 来限定 $X$ 和 $Y$ 的积只包括满足一定条件的部分mdpi.com。在类比场景中,作者选择了一个特殊的中间图 $M$ 来指导拉回:这个中间图包含一个节点,以及每种在两域中出现的关系类型各一条自环边mdpi.com。例如,对于太阳系和氢原子两图,中间图 $M$ 将有1个节点和4条环(分别代表“更大质量”“吸引”“环绕”“更热”等颜色)mdpi.com。然后定义两个态射:$f: M \to$ 太阳系图 和 $g: M \to$ 原子图,将 $M$ 中每条彩色环边映射到两域图中对应颜色的边集合mdpi.com。这样构造的拉回 $P = \text{pullback}(f,g)$ 本质上产生了同时嵌入两域且颜色匹配的组合图mdpi.com。直观来说,$P$ 包含那些颜色相同的边配对(及对应的节点对)——也就是满足“关系类型可对应”的潜在匹配。结果,拉回图 $P$ 将两个领域所有颜色对齐的可能类比“叠加”在了一起mdpi.com。例如,在得到的拉回图中,看不到太阳系里的“更热”边(Sun–planet)了,因为在氢原子图中没有对应的“更热”关系可与之配对mdpi.com。同样地,如果某种关系类型仅存在于一侧领域,拉回图中就不会出现相应配对边,这实际上刻画了类比的共同核心部分(类似于前一篇论文中的核心概念)mdpi.com。当然,拉回图往往仍然比较复杂,因为它综合了所有满足颜色匹配条件的映射情形。作者进一步指出,可以从拉回图中析取出具体的匹配子图:每选定一种节点对应关系(例如选定“太阳对应原子核”、“金星对应电子”这一组匹配),在拉回图中就能找到相应的子图代表这一具体类比映射mdpi.com。在太阳系–氢原子例子里,有三个节点(太阳、金星、火星)需要对应到两个节点(原子核、电子),共有有限的匹配组合可选。拉回图展示出其中可能的六种子图(对应不同的节点匹配方案)mdpi.com:其中有的子图几乎没边(表示匹配方案下没有关系可对应),有的则包含多条边。特别地,有两种子图包含了4 条边(即几乎涵盖所有关系对应),它们对应的匹配是“太阳↦原子核,某一行星↦电子”mdpi.com。作者指出,这两个子图保留的结构最多,因此代表了最好的类比映射mdpi.com。这与结构映射理论的思想一致:评价类比好坏的关键在于能对应的关系数量和结构深度,匹配的关系越多、层级越丰富,类比就越有意义mdpi.com。通过这种方法,作者在范畴框架下系统地搜索并评估了两域之间可能的类比映射,以结构相似程度为依据进行筛选。
通过推送实现概念融合: 在确定一个良好的类比映射后(例如选择上述子图中结构最丰富的一种匹配),作者进一步使用推送(pushout)操作来实现两域知识的概念融合mdpi.commdpi.com。推送是拉回的对偶概念,它可以将两个对象沿某公共部分合并。这里选择的公共部分就是选定的类比对应子图(可看作基础域子图 $S'$ 和目标域子图 $T'$ 以及它们之间的同构映射)mdpi.com。将基础域整体和目标域沿这个匹配子图做推送,得到的新图就是类比混成域mdpi.com。融合结果图包含了匹配子图(共同结构)以及两域各自其余的全部节点和边mdpi.com。简单来说,凡是在类比映射中对上的节点对,推送后会合并为单一节点;对应上的边对则合并为单一边;而基础或目标中未参与匹配的节点和关系则都会被带入新图中原封不动保留mdpi.com。在太阳系–氢原子融合例中,若选定“太阳≅原子核,金星≅电子”这一映射(对应前述4边子图之一),推送所生成的混成图会把“太阳/原子核”合并为一个新节点,把“金星/电子”合并为一个节点,并保留“火星”作为额外节点mdpi.com。由于“火星”在基础域没有对应目标域的节点,融合图中会出现一个与“火星”相连的新结构,表示在混成概念里可能存在“双电子”或多个行星的情况mdpi.com。另外,所有原太阳系和原氢原子中的边关系也出现在融合图中:凡是匹配上的如引力、环绕等在合并节点之间出现,凡是一方独有的如“更热”或其他关系,也相应连在各自节点上(如果合并节点涉及,则现在连到合并后的节点)mdpi.commdpi.com。推送混成的结果是一个兼具两个原始领域特性的全新图结构,体现了类比如何衍生出“同时具有两者属性”的新概念mdpi.com。作者将此视为对认知科学中概念混成理论的形式化支持:新领域的产生并非简单拼凑,而是通过共享结构的融合孕育出新概念(如类比“太阳系-原子”可能启发“双电子原子”或“多行星核模型”等想法)mdpi.com。
方法特点与总结: 这篇论文突出结构相似性(structural similarity)在类比推理中的作用,通过范畴论工具将其形式化mdpi.commdpi.com。核心思想是不仅要找出两域中有哪些部分可以对应,更要保证这些对应下关系结构和类型标签都尽可能吻合mdpi.commdpi.com。作者的方法为自动类比寻找提供了一种系统化流程:先利用积和拉回来生成所有合法的对应结构,再依据匹配的关系数量筛选最佳映射,最后通过推送生成融合概念mdpi.commdpi.com。这一系列步骤严格地保持并利用了关系的结构信息,避免了不顾关系类型乱配的情况。例如,通过颜色标签约束,确保只有相同类型的关系才会被尝试对应,从而体现类比是在结构层面相似而非仅名称巧合mdpi.com。相比第一篇论文,该方法暂未涉及高阶关系(只讨论了图中的一元/二元关系),但作者明确提到可以结合类型范畴的方法来拓展表达能力mdpi.com。总体而言,两篇论文异曲同工:都使用范畴理论来刻画类比,将类比视为结构保留的映射,并利用范畴构造(如拉回、推送)来提取共有结构和生成新知识结构themoonlight.iomdpi.com。第一篇提供了更通用的类型论视角,能处理更复杂的关系类型;第二篇则聚焦于易于可视化的图结构,强调关系着色来衡量结构相似度,并给出了发现类比映射和概念融合的具体程序mdpi.commdpi.com。两种方法共同表明,范畴论为类比推理提供了一种强有力的统一语言,能够形式化地定义“两个领域为什么类比”、类比的核心对应是什么,以及类比如何启发新概念的产生。这不仅对认知科学中理解人类类比有益,也为人工智能中实现类比推理提供了新思路,奠定了在知识表示和推理中应用范畴理论的基础arxiv.orgmdpi.com。
参考文献:
Claire Ott, Frank Jäkel. Types of Relations: Defining Analogies with Category Theory. arXiv preprint arXiv:2505.19792, 2025arxiv.orgthemoonlight.io.
Claire Ott. Structural Similarity: Formalizing Analogies Using Category Theory. Logics 3(4):12, 2025mdpi.commdpi.com.
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.