ENTROPY AS A TOPOLOGICAL OPERAD DERIVATION
作为拓扑运算导数的熵
https://arxiv.org/pdf/2107.09581
![]()
摘要
我们揭示了信息论、代数和拓扑学之间一个微小的联系——即香农熵与拓扑单形Operad的导子之间的对应关系。本文首先简要回顾Operad及其表示的基本概念,并以拓扑单形和实数轴为主要示例。接着,我们在范畴论框架下给出了Operad导子的一般性定义,该导子以Operad上的阿贝尔双模为取值。主要结论表明:香农熵定义了拓扑单形Operad的一个导子,并且该Operad的每一个导子都存在某一点,在该点上它由香农熵的常数倍给出。我们证明这一结论与Faddeev于1956年提出的著名熵刻画定理以及Leinster近期提出的变体形式相容,且本质上高度依赖于这些结果。
1. 引言
在本文中,我们阐述信息论、代数和拓扑学之间一个简洁的联系。为引出核心思想,考虑函数 d : [ 0 , 1 ] → R ,其定义为:
![]()
![]()
![]()
尽管 d 不是线性的,但这可能会促使人们思考:在何种设定下香农熵本身能成为一个导子?下面我们将通过展示香农熵与拓扑单形Operad的导子之间的对应关系来描述这样一个设定。
1.1 研究动机.近期研究表明,信息论与代数拓扑的交汇处是一片沃土。2015年,Baudot和Bennequin在[BB15]中引入了信息上同调的工具,他们构造了一个特定的上链复形,其中熵代表1次中的唯一上圈。同年,Elbaz-Vincent和Gangl从代数的角度研究熵,并指出所谓的1次信息函数"行为非常类似于某些导子"[EVG15]。再往前推几年,2011年,Baez、Fritz和Leinster在[BFL11]中给出了熵的一个范畴论刻画,该成果近期由Parzygnat在[Par20]中推广到了量子领域。在准备2011年那项成果时,Baez在非正式文章[Bae11]中评论说,在某种Operad语境下,熵的行为似乎类似于一个导子——我们将在下文中验证并明确阐述这一观察结果。上同调的思想在Mainiero近期的工作中也有所探索,他发现熵出现在与量子态相关的特定上链复形的欧拉示性数中[Mai19]。综上所述,人们会感觉到熵的行为在某种程度上类似于"某个量的微分",其中涉及一个类似(上)边界算子的 d d。本文也遵循这一思路。值得注意的是,一旦几个简单的定义准备就绪,相关的数学推导就变得相当直接。即便如此,我们仍认为这一联系值得分享,哪怕仅仅是为了让人们得以窥见熵的另一个代数和拓扑面向。
![]()
![]()
![]()
这个等式(等式(2))暗示了熵可能是一个导子,尽管其右侧第一项中明显缺少一个“ q ”。作为进一步的引子,Baez在非正式文章[Bae11]中探讨了等式(2)的一种代数解释,文中提醒读者,香农熵是概率分布配分函数关于玻尔兹曼常数(视为形式参数)的导数。在该文中,等式(2)通过短短几行推导便由此计算得出。这促使人们去寻找一个Operad导子的一般框架,使得等式(2)成为其中的一个实例。这正是我们下面要阐述的内容。
第3章回顾了Operad及其表示的定义。我们将重温拓扑单形的集合如何如[Lei21]那样具备Operad结构,以及实数集 R 如何导出它的一个表示。在第4章中,我们定义了任意Operad O 上的阿贝尔双模 M ,以及取值于 M M的 O 的导子的概念。在这些定义的基础上,等式(2)将在命题1中得到推广,而主要结论也将随之迅速得出。
定理.香农熵定义了拓扑单形Operad的一个导子,并且该Operad的每一个导子都存在某一点,在该点上它由香农熵的常数倍给出。
3. 背景:Operad 及其表示
![]()
![]()
一般来说,将一个 m 元运算与一个 n n元运算进行复合有 n n种方式,且复合后的运算的元数总是 m + n − 1 。这种复合还应满足一些合理的结合律和单位元公理。所有这样的运算及其复合方式构成的集合就称为一个 operad。这个概念起源于范畴论 [Lam69],并已在代数拓扑和同伦论中得到广泛应用 [May72, BV73, LV12, Val12, Sta04],同时在物理学中也有应用 [Mar96, MSS02]。Operad 可以在任何对称幺半范畴中定义。为便于下文阐述,我们假设所有范畴 C 都是具体的(即每个对象都有其底层的集合),这样我们就可以引用给定 C 中对象的元素。实际上,我们心中需要牢记的主要例子是拓扑空间范畴。
![]()
尽管定义形式看起来有些繁琐,但其概念本身是简单的。例如,图 2 展示了第 (i) 项中列出的结合律要求。
![]()
![]()
![]()
![]()
![]()
这种同时复合的过程由图 3 右侧的树形图说明。正如群通过考虑其表示而变得生动具体,当每个抽象的 n n元运算被映射到某个特定对象上的具体 n n元运算时,Operad 也同样变得鲜活起来。这种指派传统上被称为 Operad 的代数,但我们更倾向于使用更具描述性的名称:表示。
定义 2.设 O 是在集合范畴中的 Operad。 O 的一个表示,或称为 O -表示,是一个集合 X 连同函数
![]()
![]()
4. 单形 Operad 的导子
有了这些基本定义,当前的目标是定义一个从拓扑 Operad Δ Δ出发的映射 d d,它满足莱布尼茨法则的适当版本,
![]()
等式 (4) 中展示的结合律要求——以及其背后的直观——与图 2 所示的定义 operad 的结合律要求完全类似。这里唯一的区别在于,三个运算中可能有一个来自双模而非 operad 本身。以下是我们需要牢记的主要例子。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
作为结语,定理 1 中 Faddeev 对熵的刻画可以像 [Lei21](定理 12.3.1)那样,用范畴论和 Operad 的语言重新表述。我们在此略去了这部分语言,但诚邀读者在 Leinster 著作的第 12 章中探索完整的范畴论故事。
原文链接:https://arxiv.org/pdf/2107.09581
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.