AI做出四大顶刊级研究，数学家们为什么不安？|高斯|高维|代数|数论

分享至

5月21日凌晨，OpenAI宣布[1]，他们的内部通用推理模型自主给出了单位距离问题全新的下界构造，推翻了数学界长期的猜想。

审核结果的专家、菲尔兹奖得主蒂莫西·高尔斯（William Timothy Gowers）说，这是AI首次独立解决数学核心未解问题的“里程碑时刻”。

撰文 | 嘉伟

历史传奇数学家的猜想和绝妙思路

1946年，传奇数学家保罗·埃尔德什（Paul Erdős）在《美国数学月刊》（The American Mathematical Monthly）上发表了一篇影响深远的论文。在这篇论文中，他提出了两个即便跨越了80年，仍让无数数学家头疼不已的“数点”问题。这两个问题看上去并不复杂，只关乎空间中有限个点之间的距离分布：

1. 最多“撞车”的距离（单位距离问题unit distanceproblem）：如果你在纸上随机画下n个点，其中任意两点连线，某一个特定的距离——比如恰好相距1厘米——最多能同时出现多少次？换句话说，我们怎样排列这些点，才能让相距1厘米的点对（成对的点）最多？此时，点对的数量u(n)又是多少？

2. 最少种类的距离（不同距离问题distinct distances problem）：同样是这n个点，它们两两连线会产生各种各样的长度。那么，这些长度的种类（不同数值的个数）最少能有多少种？怎样摆放这些点，才能让整个点集产生的距离数目最单调、最匮乏？

他的思路非常精彩有趣。

最简单的构造方法是取一个中心点，把其余n-1个点全部放在同一个圆周上。如此一来，中心点到所有圆周点的距离都相等。

于是立刻得到u(n)≥n – 1。

另一方面，如果所有点之间都能两两等距，那么相同距离的总数将达到n(n-1)/2。小于0.5n^2。如此轻易就能得到它的上下界。

但二维欧氏平面有严格的几何限制。在平面里，最多只能有3个点两两等距，即正三角形。因此“所有点彼此等距”在二维中根本不可能实现。

于是问题变成u(n)真正的增长速度，究竟更接近n，还是更接近0.5n^2？

埃尔德什发现，如果想让某个距离重复很多次，最自然的候选构型是整数格点（square lattice）。也就是棋盘一样的网格。

传统认为最优构造是“重缩放的方格网格”。| 图源：OpenAI

原因并不只是“排列整齐”，而是网格背后隐藏着数论结构。

最简单的整数网格，相当于用单位正方形铺满平面，每个点和它周围的邻居可以贡献4个单位距离。但是，如果把铺满平面的正方形边长定为一个无理数，则每个点可以和邻居贡献更多的单位距离！

数论就此介入！

关键就在于一个整数能否写成两个平方数之和。这是代数数论里非常经典的费马平方和理论。现在是高中数学竞赛里的常用定理：

一个整数如果能写成两个整数的平方和，当且仅当在其标准素因数分解中，所有形如4+3的素因子的指数都是偶数。

于是，在足够大的网格中，某些特殊距离会反复出现。因为所谓单位距离是人为定义的，我们可以调整系数，把出现次数最多的特殊距离值定为单位距离。

因此长期以来，人们怀疑网格可能已经接近最优构型。

2010年，数学家拉里·古斯（Larry Guth）和内茨·卡茨（Nets Katz）发表论文，证明了平面上n个点最少也必须产生约n∕(logn)种不同距离。

埃尔德什曾经在若干场合里承认，这是他个人最喜欢的未解难题。为了解答这两个问题，乃至更一般的平面点集距离问题（例如探讨点集构成的整数距离或有理数距离），埃尔德什和他那个时代的数学家发展出了一套极其优雅的理论。虽然现有工具还无法攻克单位距离猜想——实际上80年里的进展十分有限——但在长期探索过程中大家逐渐意识到，这些看似只需“数数”和“排列点”的“简单”问题，不单单是趣味数学问题里的珍宝，它们具有极高的理论价值，与数学的不同分支之间存在着引人入胜的联系。就如同现代“图染色理论”是当初为了解决四色猜想而发展起来的，现代组合几何学里也有围绕此类中心问题而构建的理论体系。所以，它们是具有核心地位的开放问题。

随着时间的流逝，这些问题从普通的未解难题，逐渐进入了组合学、数论和几何学著名猜想的行列——它们很容易陈述，却始终可望而不可即。这有点像是“运气守恒”——起步阶段异常顺利，但在随后的漫长岁月里步履维艰。菲尔兹奖得主陶哲轩曾经评论道：“这简直是衡量我们的数学有多可悲的指标。”

现在 AI对人类数学的传承与发展

时间快进到今年。

5月，OpenAI的一个内部模型在执行其他任务时，意外找到了突破单位距离猜想的线索。

经过研究人员的调试，同时OpenAI又投入惊人的算力支持，最终在5月21日宣布，他们的内部AI通用模型一举推翻了埃尔德什单位距离猜想，给出了新的下界构造。OpenAI的研究人员再三明确，这次是一个通用型的AI 模型，是面向广泛任务，而不是专门为某个领域（比如数学）单独训练的。同时也不存在额外的辅助结构或提示工程，比如把问题拆解成子问题、用外部工具或特殊框架来引导模型推理。

埃尔德什猜测，当n足够大时，单位距离点对数增长的幂指数无限趋近于1，无法跨越任何一个哪怕极其微小的多项式门槛。但AI的结论是，点对数可以是的^0.014倍。这个差异非常之大，直接推翻了这个具有核心地位的经典组合几何学猜想。注意，AI并没有解决单位距离问题本身，而是推翻了埃尔德什推导的单位距离点对数量的量级下界即最优的猜想！

OpenAI请来很多位著名数学家审核这篇论文，同时邀请他们解读和评价。菲尔兹奖得主蒂莫西·高尔斯（William Timothy Gowers）称赞其为人工智能数学的里程碑成就。[1, 6]

毫无疑问，单位距离问题的解决方案是人工智能数学的一个里程碑：如果是人类写论文并提交给《数学年刊》，我会毫不犹豫地推荐接受。此前没有任何人工智能生成的证明能接近这一点。

——蒂莫西·高尔斯

《数学年刊》（Annals of Mathematics）是全球数学界公认的顶级期刊，影响力和审稿标准都处于金字塔尖。当初怀尔斯和合作者证明费马大定理的两篇论文，就是发表在《数学年刊》上。

那么AI为什么能解决人类数学家80年未解的重大问题？我们这一次真的可以知道AI的想法，实际上，OpenAI发布了记录AI思考过程的PDF文档（改写后的思维链摘要）[5]，长达125页（这还是删减版）！

之前介绍过埃尔德什的代数数论思路，比较有趣的一点是，这一次AI竟然继承了埃尔德什的传统，同时借助更复杂的代数数论工具，一举推翻了原始猜想。

历史上，数学王子高斯曾提出伟大的洞见，在更高次的代数数域中，唯一分解定理通常会失效（一个数可能存在多种质数分解方式）：5能写成两个整数的平方和，是因为虽然5是素数，但是在引入虚数单位i的复数域里，5也能分解成5=(1+2i)(1-2i)。

埃尔德什构造法的核心瓶颈在于数字“2”：在高斯整数环中，一个有理素数最多只能分裂成2个共轭因子，因此组合产生的“点对”数受限于2的幂次。

AI提出了一个极为大胆的设想：如果我们不在有理数域上玩这个游戏，而是跳向一个更高的d次代数数域K呢？

如果这个域的整数环满足特定的代数性质，使得一个有理素数在其中能够完全分裂（split completely）为d个不同的理想因子，那么当k 个素数相乘时，理想因子的组合方式将迎来爆炸式增长——能获得dk种组合！

如果能将组合的底数从2彻底解放到d，那么在相同半径的“圆周”上，我们好像就能塞进多得多的代数整数点。这正是AI试图碾压埃尔德什网格纪录的理论原点。

AI和以往的人类数学家一样，自然地“联想”到把高斯整数环替换成一个全实域的虚二次扩张CM域上的整数环。CM域有一个很好的性质：一个元素在某一个嵌入下模长为 1，等价于在所有共轭嵌入下都是1。此时扩张次数d是个偶数。然而，计算后发现，在固定的整数环上，实际得到的单位距离的个数量级恰好就是埃尔德什的原始下界。

这也是以往的人类数学家就此止步之处！因为不确定性带来巨大的潜在试错成本，人类数学家到此为止就会倾向于认为埃尔德什的量级猜想是正确的，而不会继续尝试构造反例。AI的优势则在于，它拥有无限的试错成本。

AI立刻将数域扩张次数推至无穷，此时整数环不再嵌入复数域平面，而是一个高维复数晶格。AI在推理过程中，自己描述这个构造“令人恐惧”。

然而，将这一代数野心付诸几何现实，会遭遇一场毁灭性的物理灾难。我们的物理画布只是2维平面。为了让这些代数点在平面上落脚，我们必须将这d维空间通过典范嵌入（canonical embedding）投影回2维复平面。

一旦进行这种降维投影，高维空间中原本舒展、离散的晶格点就会发生疯狂的局部堆积和重合。这就好比将一个三维的铁丝网拍扁在墙上，铁丝的交点会密密麻麻地挤在一起。在几何上，这意味着点与点之间失去了硬性的“最小距离约束”，点集在平面上变得过于稠密。一旦晶格发生塌缩，我们精心构造的“单位距离”就会在密集的噪声中失效。

为此，AI 动用了代数数论中的顶级重型武器——类域论（class field theory）与戈洛德-沙法列维奇（Golod-Shafarevich）无限塔。

AI 借助Golod-Shafarevich定理，构造了一个由数域一环套一环、走向无穷高维度的代数扩张塔：

这个塔最精妙的代数刚性在于：它可以在分歧（ramification）受到极其严格限制的前提下，让数域的次数d稳步走向无穷。

借助这座无限塔，AI在代数与几何的两端精确地调节着平衡。

在代数端，利用塔的更高层级，确保素数能够充分分裂，让相同距离的重复次数（分子）实现数量级的跨越。在几何端，由于扩张塔的分歧行为受到了局限，AI得以利用类域论的精细估计，严格计算出高维晶格投影到二维平面时的几何密度。它成功确保了在点集扩张的过程中，最小两点间距（分母）衰减的速度被牢牢压制在可控范围内，最终一举否定了埃尔德什和数学界这80年来的长久信念。

因为OpenAI并没有给AI的构造绘制图片，《拉马努金杂志》副主编Alvaro Lozano-Robled在ChatGPT 5.5 Thinking帮助下提供了一个图片示例（左图），被各大媒体，包括《自然》期刊引用，但其实这个图片是错的。即便是其修正版（右图），也是无“意义”的。AI的实际构造完全无法绘制，只在n为10的1957151次方才有意义。| 图源：Alvaro Lozano-Robled

根据AI的思维链文档，从一开始，它就在考虑构造反例，而非证明埃尔德什的猜想。原因可能有二，一是AI具有非凡的直觉，意识到猜想并不成立；二则是更合理的推测，AI习惯上喜欢寻找反例，因为后者更容易成功，检索所有可能性是更适合“机器”的推理的方式。虽然这一次的成果，无论如何也不能把它归于力大砖飞、暴力破解的范畴。

值得一提的是，完成这一壮举的团队中有毕业于清华大学的青年学者陈立杰。他中学时代就是国内信息学竞赛界的传奇少年。16岁拿下全国青少年信息学奥林匹克竞赛（NOI）的金牌，保送清华（但他本人没选择保送，而是打算参加国际信息学竞赛IOI）；18岁以世界第一的成绩，斩获IOI金牌。

2017年，他进入MIT攻读博士，师从计算复杂性泰斗Ryan Williams。2025年，他和合作伙伴把元数学思想引入计算复杂性领域，出乎所有人意料地证明：许多复杂性理论中的不同定理（如回文判定的下界）与鸽笼原理等价。

鸽笼原理或抽屉原理（pigeonhole principle）是数学中最基础、最常用、也最有力量的工具之一：

如果把+1只鸽子放进个鸽笼里，那么至少有一个鸽笼里会有两只鸽子。

陈立杰现在是加州大学伯克利分校电气工程与计算机科学系的助理教授，今年年初加入OpenAI的研究部门。根据离散数学领域里的“带头大哥”、数学家Gil Kalai的说法[3]，这次用AI构造单位距离猜想的反例，并把AI证明梳理成人类可读的文件[4]，这些工作就是由陈立杰主导完成的（虽然论文署名是OpenAI）。

加州大学伯克利分校电气工程与计算机科学系的助理教授陈立杰丨图源：
https://chen-lijie.github.io/

陈立杰说：“我今年一月初开始在OpenAI从事推理相关工作，正是因为我相信人工智能将对数学和一般科学产生巨大影响。但我没想到，一个数学领域重大开放问题的解决方案竟然在五月就出现了。”

影响众说纷纭

过去半年里，人工智能在数学研究中的表现，已经开始让许多人产生一种此前几乎不可想象的感觉：也许，“数学”并不像我们曾经以为的那样，是人类智能最后的堡垒。

这种震动，并不只是因为 AI 能够完成一些竞赛题、计算题，或者辅助形式化证明。真正令人不安的，是它开始触碰那些长期以来被视为“需要数学直觉”的领域：构造、猜想、研究路线、甚至理论框架本身。

此时，相信“AI只能吐出训练数据的平均值”这类观点已经完全站不住脚了。如果推广这个教训：所有其他关于某种本质的人类活动将永远超出AI能力范围的论点，也同样可能是自我安慰。

现在，很多人开始支持这种想法：很多大型语言模型（LLMs）是“被管理不当的天才”，只需一点引导就能释放它们全部的能力。当庞加莱去世时，“最后一位精通全部领域的数学家走了”。在那之后，每个人要么是代数学家，要么是分析学家，要么是组合学家。现在AI则可能是现代数学里的第一位全领域的数学家。

Writely（即Google Docs）、以及其他7家初创公司的联合创始人Steve Newman表示：

我认为我们正在逐渐发现，人类其实并不擅长数学。长臂猿会对奥运会攀岩选手嗤之以鼻；因为人类的身体并非为攀岩而生。同样，越来越多的证据表明，对于高等数学而言，我们的大脑可能也远非最优配置。

这绝对没有对数学家不敬的意思。我曾两次获得国际数学奥林匹克（IMO）银牌；我的聪明程度，刚好足以让我认识到有些人的智力要远超于我。但现在看来，数学似乎处于莫拉维克悖论（Moravec’s paradox）的中点位置：介于国际象棋（计算机早前已经超越了我们）和烹饪（要实现通用能力，可能还需要很多年）之间。数学对人类来说相当困难，因此看来计算机将会在这方面超越我们。

AI在数学领域仍然存在重大的弱点。例如，AI系统尚未表现出识别有趣研究方向的能力，也无法提出能作为后续研究基础的新概念。但它们在某些方面已经开始展现出超人类的水平。而一旦AI在某个领域开始超越人类，我们都知道接下来会发生什么。

莫拉维克悖论是人工智能研究中一个非常反直觉、但极其重要的观察：对人类来说最困难的任务（如数学、逻辑推理），对计算机反而容易；对人类来说最容易的任务（如走路、识别物体、抓东西），对计算机反而极难。它由机器人学家 Hans Moravec于1980年代提出，后来经其他学者进一步阐述。

在采访中对AI证明单位距离猜想给予了很高评价的高尔斯，在更私人的场合下表示：“AI的数学潜力让我想起了童话故事Jeremy Fisher里的一句话‘a much worse thing happened’——只是把原文里的 ‘worse’（更糟）换成‘disturbing’（更令人不安）更贴切。”

今年早些时候，多伦多大学的助理教授、算术代数几何学家Daniel Litt自问道：模型在数学研究的各个方面都会对人类拥有绝对优势吗？（也就是说，不仅仅是证明定理，还包括品味、创造力、理论构建、哲学思辨等错综复杂、难以捉摸的无形特质。）在足够长的时间尺度上，答案大概是肯定的，但其中有些技能似乎既难以衡量，又难以训练。除了好奇心之外，人类还能贡献什么？很可能在数学研究技能中存在一条“长尾”，在未来的一段时间内，人类将在这些技能上继续保持优势。就像大多数其他职业一样，中期来看，很可能会存在许多无法自动化的瓶颈[5]。

尽管AI在单位距离猜想上取得了令人振奋的突破，但在攻克重大难题方面，人类向来不乏辉煌的战绩。至少在当下，AI依然停留在组合现有工具的阶段，尚未展现出从无到有构建新颖理论的能力。

在数学的世界里，还有无限多更有趣的未解问题存在。比如说，现在单位距离问题相当于回到了原点，我们仍未知道n足够大的时候，其单位距离点对个数的量级是多少。

参考来源

[1] An OpenAI model has disproved a central conjecture in discrete geometry | OpenAI

[2] An explicit lower bound for the unit distance problem，https://arxiv.org/html/2605.20579v1

[3] Amazing: Erdős’ Unit Distance Problem was Disproved! It was achieved by AI! | Combinatorics and more

[4] Planar Point Sets with Many Unit Distances，https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf

[5] Rewritten Chain of Thought for the Solution to the Unit Distance Problem。
https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf

[5] Mathematics in the Library of Babel — Daniel Litt

[6] REMARKS ON THE DISPROOF OF THE UNIT DISTANCE CONJECTURE ，https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf

注：本文封面图片来自版权图库，转载使用可能引发版权纠纷。

特别提示

1. 进入『返朴』微信公众号底部菜单“精品专栏“，可查阅不同主题系列科普文章。

2.『返朴』提供按月检索文章功能。关注公众号，回复四位数组成的年份+月份，如“1903”，可获取2019年3月的文章索引，以此类推。

版权说明：欢迎个人转发，任何形式的媒体或机构未经授权，不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.