菲尔兹奖得主：GPT 5.5 Pro 证明了数学博士论文题目|数论|数学家|多项式|人工智能

菲尔兹奖得主：GPT 5.5 Pro 证明了数学博士论文题目

分享至

越来越多的数学家开始公开谈论人工智能如何迅速地为他们的领域带来真正的价值。

最新一位发声者是世界上最具权威性的专家之一。剑桥大学数学家、菲尔兹奖（数学界的最高荣誉）得主蒂莫西·高尔斯撰文称，ChatGPT 5.5 Pro 独立完成了一项研究，他将其描述为“一篇组合数学博士论文中完全合理的一章”。而这一切仅用了大约两个小时，且完全无需他提供任何数学输入。

发生了什么

高尔斯决定用数学家梅尔文·纳坦森在一篇关于加法数论的论文中提出的一系列开放性问题来检验这个模型。这些问题涉及：对于给定大小的集合，如何构造h重和集——即从集合A中抽取的h个元素的和的集合——以及此类集合的最小“直径”（在数轴上的分布）需要是多少。

纳坦森之前已经证明，对于两个元素的集合，总能在 0 到 2^k − 1 的区间内找到一个集合。他问这个指数界限是否可以改进。

ChatGPT 5.5 Pro 思考了 17 分 5 秒，然后构造出一个证明二次上界的解——已知该上界本质上是最优的。Gowers 指出，关键步骤与 Nathanson 的直觉相同，但更进一步：该模型没有使用 2 的幂作为底层 Sidon 集，而是使用了一个更高效的 Sidon 集，其元素大小仅为二次方。Gowers 询问是否可以将论证形式化为 LaTeX 预印本；两分 23 秒后，它就完成了。

更难的问题

戈尔斯随后更进一步。他要求该模型与麻省理工学院学生艾萨克·拉贾戈帕尔（Isaac Rajagopal）的工作进行交互。拉贾戈帕尔最近刻画了一般h的所有可达和集大小的集合，但他的构造依赖于元素呈指数级增长的几何级数。隐含的挑战是：能否将对k 的指数依赖性简化为多项式依赖性？

16 分 41 秒后，ChatGPT 5.5 Pro 返回了一个论证，声称对于任何α > 1/2，该论证将界限从k 的指数级改进为k^α 的指数级。Gowers 将由此产生的预印本转发给了 Nathanson，Nathanson 又将其发送给了 Rajagopal，Rajagopal 表示这看起来是正确的。

随后，戈尔斯要求模型推导出完整的多项式界限。经过两次迭代——一次13分钟的思考和一次9分钟的验证——模型得出了它认为的完整证明。拉贾戈帕尔审阅了最终的预印本，并宣布其“几乎肯定正确”，不仅逐行正确，而且在思想层面也正确。

令人类专家印象深刻的想法

在 Gowers 博客文章的客座专栏中，Rajagopal 对该模型的实际贡献进行了评估。他写道，关键在于用基于h² 分离集的新构造取代了几何级数（其元素呈指数增长） ——h² 分离集是指在一定阶数内不存在任何非平凡加法关系的集合。

事实证明，这类集合可以用多项式大小的元素构建，其构造方法可以追溯到 Singer (1938) 和 Bose-Chowla (1963)。该模型利用这些构造方法，在 Rajagopal 的证明中构建了几何级数分量的替代物——在保留和集基本性质的同时，显著缩小了直径。

Rajagopal 写道：“尽管事后我可以解释其动机，但 ChatGPT 使用h²分离集来控制至多为h 的序关系的想法仍然非常巧妙。据我所知，这个想法完全是原创的。”

他还补充说，这是“经过一两周的思考后，我会非常自豪地想出的那种想法”。

难以忽视的模式

这一结果并非凭空而来。人工智能在数学领域的成就一直在稳步提升，尽管发展速度并不均衡。

早期的尝试很容易被忽视。当 OpenAI 的研究人员声称 GPT-5 已经“解决”了十个埃尔德什问题时，事实证明该模型只是在文献中找到了现有的解决方案——这一尴尬的发现招致了 DeepMind 的 Demis Hassabis 的公开批评和Meta 的 Yann LeCun 的嘲讽。

但事情仍在发展。GPT-5.2 Pro 和 Harmonic 的 Aristotle似乎自主解决了 Erdős 问题 #728，并用 Lean 生成了一个经受住了形式化验证的证明。不久之后，GPT-5.2 又帮助解决了 Erdős 问题 #281，这是一个自 1980 年以来一直悬而未决的数论难题——陶哲轩称之为人工智能解决未解数学问题的“或许是最明确的例证”。此外，还有一位数学家发现 LLM 完全无济于事——这提醒我们，结果仍然参差不齐，并且取决于具体领域。

高尔斯事件的独特之处在于问题的复杂性和贡献的性质。这并非简单的检索或寻找人类忽略的论据，而是将一个新近发表的理论框架拓展到一个框架作者本人都未曾想到的方向。

这对博士生意味着什么

高尔斯坦率地谈到了这对研究生培养的影响。传统的数学研究路径是，导师会交给一个难度适中、既能保持开放性又不至于让新手轻易取得进展的问题。如今，这条人才培养之路正面临压力。

“如果法学硕士（LLM）只能解决‘简单的问题’，那么这条路就走不通了，”高尔斯写道。“如今，对数学做出贡献的最低标准将是证明法学硕士无法证明的结论，而不是仅仅证明一些至今无人证明过、但至少有人觉得有趣的结论。”

他提出了两点看法。首先，博士生可以而且应该利用法学硕士作为合作者——那些拥有深厚数学直觉的人可能比新手更能有效地运用他们。其次，人工智能的影响在不同领域可能并不均衡。组合数学是问题驱动的；而其他数学领域则涉及更多开放式的探索，人工智能能否在这些领域脱颖而出尚不明朗。

但高尔斯并没有淡化其长远影响。明年开始攻读博士学位的学生最早也要到2029年才能毕业。“我估计到那时，”他写道，“从事数学研究的意义将会发生翻天覆地的变化。”

至今无人解答的问题

如果是人类数学家得出这样的成果，通常会发表。但如果是人工智能得出的成果，情况就不那么明朗了。Gowers 指出，arXiv 禁止发表人工智能作品的政策是合理的，但这仍然存在漏洞。他提出建立一个独立的 AI 生成成果库的想法——由人类数学家审核并认证其正确性，或许还可以借助形式化证明辅助工具。目前尚不存在这样的基础设施。

目前，这些预印本位于一个公共链接中，可以找到但未分类，既不在学术出版系统内，也不完全在学术出版系统外。

信用问题更容易解决。拉贾戈帕尔构建了框架，模型在此基础上发展，高尔斯提出了问题。现在没人能再理直气壮地说这只是个小把戏了。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.