★置顶zzllrr小乐公众号(主页右上角)数学科普不迷路!
从直觉上来说,我们能够想象一个一维实体,它永远只能在一条无限延伸的直线上移动;也能想象一个二维生物,它注定只能生活在一个平坦的平面上。而三维生物无需我们刻意想象,因为这正是我们感知宇宙的方式。然而,驱动现代世界运转的计算能力,却在五维、十维乃至数千维的抽象空间中蓬勃发展。高维数学究竟是如何帮助我们处理和解读信息,又如何揭示那些支配着从生物学到人工智能等万事万物的隐藏规律的呢?
作者:Benjamin Skuse(HLF海德堡桂冠论坛科普记者)2026-1-28
译者:zzllrr小乐(数学科普公众号)2026-2-1
超越感知的维度
我们不妨先区分宇宙的维度与维度的其他定义方式,这是一个不错的切入点。如果讨论的是前者,那么核心问题便是:我们是否真的生活在一个三维宇宙中?抑或这只是我们感知方式的局限所致?左与右、前与后、上与下,这是我们仅有的移动方向,也是我们感知到三维世界的原因。但阿尔伯特·爱因斯坦(Albert Einstein)的出现改变了这一切。他提出的狭义相对论与广义相对论将时间纳入了考量范畴。尽管我们只能感知到时间的单向流逝,其体验方式与三维空间维度截然不同(从数学角度而言亦是如此),但相对论将空间与时间整合为一个整体,即时空(spacetime)。
数学家赫尔曼·闵可夫斯基(Hermann Minkowski)的研究让时空的数学表达变得具象化。他证明,若将空间与时间置于近乎平等的地位,狭义相对论便能得到简洁优美的阐释。这一统一视角催生了闵可夫斯基空间(Minkowski space)的概念——这是一个四维空间,时间被视为第四个坐标。
这项研究为将时空视为单一四维结构奠定了基础。在数学术语中,这种结构被称为流形(manifold),它并非一成不变,而是会受到质量或能量的影响。当靠近黑洞这类大质量天体时,空间会被实实在在地拉伸,时间亦是如此。换句话说,这个四维流形的维度会发生几何扭曲。
一个多世纪前,相对论带来的启示让公众意识到,我们所处的宇宙或许拥有三个以上的维度,也让人们深刻理解到,我们感知到的事物并非存在的全部。但更多的突破性发现还在后面。
超立方体(左)与立方体(右)示意图

展示超立方体(左)与立方体(右)折叠和展开过程的动画。
图源:Christopher Thomas(wikimedia)
在爱因斯坦向世界提出广义相对论后不久,德国数学家特奥多尔·卡鲁扎(Theodor Kaluza)与瑞典物理学家奥斯卡·克莱因(Oskar Klein)意识到,这个理论中还缺少了关键的一环:另一个空间维度。两人论证指出,倘若宇宙是五维而非四维的,那么五维形式的爱因斯坦方程将可以分解为三组四维方程,分别是:描述引力的爱因斯坦原始场方程、描述电磁力的詹姆斯·克拉克·麦克斯韦方程(James Clerk Maxwell’s equations),以及一个全新的标量场方程。
这个新增的第四空间维度可以蜷缩成一个极小的闭合环路,其半径远小于任何可测量的距离——这也解释了为何我们无法感知到它的存在。但与此同时,它却可能对我们周遭的世界产生深远影响,堪称是实现引力与电磁力统一的“秘诀”。
这一理论便是著名的卡鲁扎-克莱因理论(Kaluza–Klein theory)。它在数学层面精妙绝伦,但在物理层面却存在缺陷:该理论无法准确预测粒子的属性,也未能涵盖另外两种基本作用力(强核力与弱核力)以及诸多基本粒子。尽管如此,它却是首次严肃尝试证明,我们所感知到的基本作用力,或许只是高维几何结构的一种表现形式。如今,这一理论的思想遗产依然延续,催生出一系列试图通过多个蜷缩空间维度来统一基本作用力与粒子的理论,例如弦理论(string theory)与M理论(M-theory)——后者由1990年菲尔兹奖得主(Fields Medallist)爱德华·威滕(Edward Witten)首次提出。
四维广义相对论、五维卡鲁扎-克莱因理论,以及十维、十一维的弦理论与M理论都表明,我们宇宙的几何结构,或许远比我们能感知到的更为奇特。但这些理论所涉及的维度,在数学家与统计学家研究的高维范畴中,还处于较低的水平。那么,为何人们要涉足这些高度抽象的领域呢?
定义数据
当我们描述某个N维空间内一个点的位置时,高维数学的作用就变得易于理解了。前文提到的那个在无限直线上移动的一维生物,只需一个坐标(x)就能确定其位置;平面上的二维生物需要两个坐标(x,y);而我们人类,若只考虑空间位置,用三个坐标(x,y,z)即可定位,若要同时描述时空位置,则需要四个坐标(x,y,z,t)。
一维、二维与三维生物示意图
![]()
从左至右依次为一维、二维与三维生物的示意图。
本图在谷歌双子座(Google Gemini)的协助下制作完成。
高维空间中的点,其实只是拥有更多的坐标而已。当我们不再将维度视为宇宙的构成要素,而是从其他角度定义维度时,高维空间的价值便凸显出来。我们可以将维度定义为某一空间内所包含的属性或变量的数量,而非构成现实的不同层面。例如,金融模型师想要追踪并预测某一资产的风险,就可以将该资产视为N维风险空间(N-dimensional risk space)中的一个点,其中N代表多种变量,如当前价格、波动率、利率等。
另一个典型例子是人口普查数据。政府的人口普查数据库包含数百个关于人口(年龄、性别、种族、职业等)和家庭(住房类型、产权状况、卧室数量等)的变量。这样一来,每个人就成为了数据库这个N维空间中的一个点,N对应的是普查中测量的数百种不同特征。
在这两个例子中,想要获取有价值的洞见,关键在于发现并分析隐藏在高维数据中的低维模式与结构。金融模型师可以运行算法,在高维风险空间中寻找一个超平面(hyperplane),以此将安全投资与高风险投资进行最优划分。统计学家则可以将原始变量整合为主成分(principal components)——这些主成分能够反映不同群体在社会经济地位上的主要差异,进而构建出基于区域的贫困指数(deprivation index)。
高维数学的重要性还体现在一个当下的热门领域中,那就是大语言模型(large language models, LLMs)。这类模型的发展得益于约书亚·本吉奥(Yoshua Bengio)与杨立昆(Yann LeCun)等研究者数十年来在人工智能、机器学习与自然语言处理领域的深耕——两人均是2018年ACM图灵奖(ACM A.M. Turing Award)得主。事实上,倘若没有高维数学,大语言模型便无从运转。
![]()
约书亚·本吉奥与杨立昆分别出席2019年与2022年海德堡获奖者论坛
图源:海德堡获奖者论坛基金会HLFF / Flemming
大语言模型完全通过向量数学(vector mathematics)处理文本。模型会将每个“标记(token)”(可以是单词、子词或标点符号)转换为一个高维向量,其维度通常在512至4096之间,同时还会将标记在序列(句子)中的位置编码为另一个向量。模型的运算主要由自注意力机制(self-attention mechanism)驱动:该机制通过计算高维向量之间的点积(dot product),来衡量所有标记之间的语义关联,进而生成一系列新的高维向量,这些向量包含了给定序列的上下文信息。最终生成的输出向量会被映射到词汇空间(vocabulary space)——该空间的维度等于模型词汇表中可能存在的标记数量。最后,模型会通过一个函数筛选出合适的标记,完成文本生成。
复杂性的形态
当大型数据集包含本身就是高维向量的数据点时,数据分析与洞察的难度便会大幅提升。例如在单细胞核糖核酸测序(single-cell RNA sequencing)技术中,每个单细胞都被表示为一个向量,其维度对应数万个基因的表达水平。想要理解如此庞大而稀疏的空间,需要采用一种截然不同的方法。
如果我们将这个空间视为一个巨大的数据云(data cloud),忽略其中具体的坐标信息,就能退一步,从宏观上把握数据的“形态”。这种方法被称为拓扑数据分析(Topological Data Analysis, TDA),它能够刻画高维数据流形(manifold)的全局结构与连通性。这类分析方法源于现代拓扑学,其理论基础包括1982年菲尔兹奖得主丘成桐(Shing-Tung Yau)关于弯曲空间的几何分析,以及1986年菲尔兹奖得主迈克尔·弗里德曼(Michael Freedman)在流形结构领域的深刻洞见。
拓扑数据分析借助持久同调(persistent homology)技术识别拓扑特征——这些特征是数据形态的固有属性,即便数据被拉伸、压缩或进行连续变换,它们也不会发生改变。通过该技术,我们可以量化那些在不同尺度下都稳定存在的结构,包括聚类、环路与空洞等。这些结构的存在,往往预示着那些用其他方法难以发现的深层规律。
拓扑数据分析的一个极具影响力的应用领域是癌症基因组学(cancer genomics)。研究人员利用该技术,发现了其他方法未能识别的乳腺癌患者亚群,这些亚群具有特定的疾病预后特征,这一发现为精准治疗奠定了基础。此外,拓扑数据分析还被用于识别基因组标记(genomic markers),这些标记可用于预测患者的治疗反应,并对预后情况进行高精度评估。
无限的循环
当我们的研究超越这些已经极高的维度时,便会回到一切的起点:探究现实与宇宙的本质。在创立相对论的同时,爱因斯坦也是现代物理学另一大支柱——量子力学(quantum mechanics)的核心奠基人之一。量子力学描述了原子与亚原子尺度下物质与光的行为规律。在这个尺度上,对物理现象的数学描述需要满足空间域的连续性,同时还要遵循叠加原理(principle of superposition)——即在被观测之前,波或量子粒子等物理系统可以同时处于所有可能的状态。
这些特性导致量子系统具有无穷多的潜在自由度(degrees of freedom),也就是无穷多的维度。而这种复杂性,就需要借助泛函分析(functional analysis)这一数学分支来处理。泛函分析将函数视为无穷维空间中的点或向量,而希尔伯特空间(Hilbert space)正是量子态所处的一种特殊无穷维向量空间。事实上,由著名通才约翰·冯·诺依曼(John von Neumann)严格构建,并经著名数学家伊斯雷尔·盖尔范德(Israel Gelfand)与1962年菲尔兹奖得主拉尔斯·霍尔曼德(Lars Hörmander)进一步推广的无穷维希尔伯特空间框架,构成了量子力学的数学基石。倘若没有泛函分析与希尔伯特空间理论,我们便无法准确定义量子态、量化概率,也无法描述亚原子世界的连续动态变化。
正如我们所看到的,人类日常感知的局限,恰恰是获得真正洞见的起点。如今,我们不再局限于对三维世界的观察,而是掌握了构建和探索任意维度空间的数学语言,这让我们在众多领域与应用中,都获得了全新而深刻的认知。
参考资料
https://scilogs.spektrum.de/hlf/how-high-dimensional-mathematics-rules-our-world/
小乐数学科普近期文章
·开放 · 友好 · 多元 · 普适 · 守拙·![]()
让数学
更加
易学易练
易教易研
易赏易玩
易见易得
易传易及
欢迎评论、点赞、在看、在听
收藏、分享、转载、投稿
查看原始文章出处
点击zzllrr小乐
公众号主页
右上角
置顶加星★
数学科普不迷路!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.