网易首页 > 网易号 > 正文 申请入驻

菲尔兹奖得主:GPT 5.5 Pro 证明了数学博士论文题目

0
分享至



越来越多的数学家开始公开谈论人工智能如何迅速地为他们的领域带来真正的价值。

最新一位发声者是世界上最具权威性的专家之一。剑桥大学数学家、菲尔兹奖(数学界的最高荣誉)得主蒂莫西·高尔斯撰文称,ChatGPT 5.5 Pro 独立完成了一项研究,他将其描述为“一篇组合数学博士论文中完全合理的一章”。而这一切仅用了大约两个小时,且完全无需他提供任何数学输入。

发生了什么

高尔斯决定用数学家梅尔文·纳坦森在一篇关于加法数论的论文中提出的一系列开放性问题来检验这个模型。这些问题涉及:对于给定大小的集合,如何构造h重和集——即从集合A中抽取的h个元素的和的集合——以及此类集合的最小“直径”(在数轴上的分布)需要是多少。

纳坦森之前已经证明,对于两个元素的集合,总能在 0 到 2^k − 1 的区间内找到一个集合。他问这个指数界限是否可以改进。

ChatGPT 5.5 Pro 思考了 17 分 5 秒,然后构造出一个证明二次上界的解——已知该上界本质上是最优的。Gowers 指出,关键步骤与 Nathanson 的直觉相同,但更进一步:该模型没有使用 2 的幂作为底层 Sidon 集,而是使用了一个更高效的 Sidon 集,其元素大小仅为二次方。Gowers 询问是否可以将论证形式化为 LaTeX 预印本;两分 23 秒后,它就完成了。

更难的问题

戈尔斯随后更进一步。他要求该模型与麻省理工学院学生艾萨克·拉贾戈帕尔(Isaac Rajagopal)的工作进行交互。拉贾戈帕尔最近刻画了一般h的所有可达和集大小的集合,但他的构造依赖于元素呈指数级增长的几何级数。隐含的挑战是:能否将对k 的指数依赖性简化为多项式依赖性?

16 分 41 秒后,ChatGPT 5.5 Pro 返回了一个论证,声称对于任何α > 1/2,该论证将界限从k 的指数级改进为k^α 的指数级。Gowers 将由此产生的预印本转发给了 Nathanson,Nathanson 又将其发送给了 Rajagopal,Rajagopal 表示这看起来是正确的。

随后,戈尔斯要求模型推导出完整的多项式界限。经过两次迭代——一次13分钟的思考和一次9分钟的验证——模型得出了它认为的完整证明。拉贾戈帕尔审阅了最终的预印本,并宣布其“几乎肯定正确”,不仅逐行正确,而且在思想层面也正确。

令人类专家印象深刻的想法

在 Gowers 博客文章的客座专栏中,Rajagopal 对该模型的实际贡献进行了评估。他写道,关键在于用基于h² 分离集的新构造取代了几何级数(其元素呈指数增长) ——h² 分离集是指在一定阶数内不存在任何非平凡加法关系的集合。

事实证明,这类集合可以用多项式大小的元素构建,其构造方法可以追溯到 Singer (1938) 和 Bose-Chowla (1963)。该模型利用这些构造方法,在 Rajagopal 的证明中构建了几何级数分量的替代物——在保留和集基本性质的同时,显著缩小了直径。

Rajagopal 写道:“尽管事后我可以解释其动机,但 ChatGPT 使用h²分离集来控制至多为h 的序关系的想法仍然非常巧妙。据我所知,这个想法完全是原创的。”

他还补充说,这是“经过一两周的思考后,我会非常自豪地想出的那种想法”。

难以忽视的模式

这一结果并非凭空而来。人工智能在数学领域的成就一直在稳步提升,尽管发展速度并不均衡。

早期的尝试很容易被忽视。当 OpenAI 的研究人员声称 GPT-5 已经“解决”了十个埃尔德什问题时,事实证明该模型只是在文献中找到了现有的解决方案——这一尴尬的发现招致了 DeepMind 的 Demis Hassabis 的公开批评和Meta 的 Yann LeCun 的嘲讽。

但事情仍在发展。GPT-5.2 Pro 和 Harmonic 的 Aristotle似乎自主解决了 Erdős 问题 #728,并用 Lean 生成了一个经受住了形式化验证的证明。不久之后,GPT-5.2 又帮助解决了 Erdős 问题 #281,这是一个自 1980 年以来一直悬而未决的数论难题——陶哲轩称之为人工智能解决未解数学问题的“或许是最明确的例证”。此外,还有一位数学家发现 LLM 完全无济于事——这提醒我们,结果仍然参差不齐,并且取决于具体领域。

高尔斯事件的独特之处在于问题的复杂性和贡献的性质。这并非简单的检索或寻找人类忽略的论据,而是将一个新近发表的理论框架拓展到一个框架作者本人都未曾想到的方向。

这对博士生意味着什么

高尔斯坦率地谈到了这对研究生培养的影响。传统的数学研究路径是,导师会交给一个难度适中、既能保持开放性又不至于让新手轻易取得进展的问题。如今,这条人才培养之路正面临压力。

“如果法学硕士(LLM)只能解决‘简单的问题’,那么这条路就走不通了,”高尔斯写道。“如今,对数学做出贡献的最低标准将是证明法学硕士无法证明的结论,而不是仅仅证明一些至今无人证明过、但至少有人觉得有趣的结论。”

他提出了两点看法。首先,博士生可以而且应该利用法学硕士作为合作者——那些拥有深厚数学直觉的人可能比新手更能有效地运用他们。其次,人工智能的影响在不同领域可能并不均衡。组合数学是问题驱动的;而其他数学领域则涉及更多开放式的探索,人工智能能否在这些领域脱颖而出尚不明朗。

但高尔斯并没有淡化其长远影响。明年开始攻读博士学位的学生最早也要到2029年才能毕业。“我估计到那时,”他写道,“从事数学研究的意义将会发生翻天覆地的变化。”

至今无人解答的问题

如果是人类数学家得出这样的成果,通常会发表。但如果是人工智能得出的成果,情况就不那么明朗了。Gowers 指出,arXiv 禁止发表人工智能作品的政策是合理的,但这仍然存在漏洞。他提出建立一个独立的 AI 生成成果库的想法——由人类数学家审核并认证其正确性,或许还可以借助形式化证明辅助工具。目前尚不存在这样的基础设施。

目前,这些预印本位于一个公共链接中,可以找到但未分类,既不在学术出版系统内,也不完全在学术出版系统外。

信用问题更容易解决。拉贾戈帕尔构建了框架,模型在此基础上发展,高尔斯提出了问题。现在没人能再理直气壮地说这只是个小把戏了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
曼城深陷所有权危机:曼苏尔遭人权组织投诉,或重演切尔西悲剧

曼城深陷所有权危机:曼苏尔遭人权组织投诉,或重演切尔西悲剧

星耀国际足坛
2026-05-10 22:35:59
重锤!武汉协和医院大扩建!

重锤!武汉协和医院大扩建!

越乔
2026-05-10 22:40:23
他离开司令员岗位,生活急转直下,为了改善生活,让儿女南下打拼

他离开司令员岗位,生活急转直下,为了改善生活,让儿女南下打拼

微野谈写作
2026-05-10 13:00:08
2:1,特朗普再次败诉,美国法院已裁定,他无权对中国加征关税

2:1,特朗普再次败诉,美国法院已裁定,他无权对中国加征关税

近史谈
2026-05-10 13:19:58
全网猜疯!张韶涵诡异造型+争议手势,真加入了传闻中的组织?

全网猜疯!张韶涵诡异造型+争议手势,真加入了传闻中的组织?

TVB的四小花
2026-05-08 10:02:45
5月11日至13日,南海部分海域进行火箭发射,禁止驶入

5月11日至13日,南海部分海域进行火箭发射,禁止驶入

观察者网
2026-05-10 22:23:21
国乒女团为何能赢日本夺冠?孙颖莎拿MVP发言,马琳王曼昱憋眼泪

国乒女团为何能赢日本夺冠?孙颖莎拿MVP发言,马琳王曼昱憋眼泪

体育大学僧
2026-05-10 22:34:26
鲜为人知的白奴贸易:上百万白人被抓到非洲,白人女子沦为玩物

鲜为人知的白奴贸易:上百万白人被抓到非洲,白人女子沦为玩物

抽象派大师
2026-05-02 00:10:00
心理学有个残忍发现:让一个人终身困在焦虑里、无法自拔,从不是缺爱缺安全感,而是这两道“埋在意识底层的心理门槛”

心理学有个残忍发现:让一个人终身困在焦虑里、无法自拔,从不是缺爱缺安全感,而是这两道“埋在意识底层的心理门槛”

心理观察局
2026-05-09 09:10:05
毫无格局!杜锋赛后发言引争议,知名大V怒批,粤迷也不认同

毫无格局!杜锋赛后发言引争议,知名大V怒批,粤迷也不认同

小徐讲八卦
2026-05-10 05:56:53
华为Mate90 Pro Max全面曝光!3nm麒麟+7500mAh固态电池

华为Mate90 Pro Max全面曝光!3nm麒麟+7500mAh固态电池

小柱解说游戏
2026-05-10 03:54:13
浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

魔都姐姐杂谈
2026-03-30 19:25:57
陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

陕西男子3次报警,民警拒不派警,致两家四口被杀,法院咋判的?

就一点
2026-04-29 17:28:35
赖着不走、不达目的绝不返程!美国国会代表团在华超长滞留

赖着不走、不达目的绝不返程!美国国会代表团在华超长滞留

健身狂人
2026-05-10 19:30:43
研究表明:性经验越多的男性,阳痿、早泄勃起等问题越少!

研究表明:性经验越多的男性,阳痿、早泄勃起等问题越少!

灯锦年
2026-05-04 14:09:21
2K高清屏+7600mAh!新机官宣:5月10日,全渠开售!

2K高清屏+7600mAh!新机官宣:5月10日,全渠开售!

科技堡垒
2026-05-10 11:20:45
王瑜任太仓市代理市长

王瑜任太仓市代理市长

上观新闻
2026-05-10 20:34:48
任何一个男人到了六十岁后,只要还对异性怀有欣赏与追求,往往因为这两件事

任何一个男人到了六十岁后,只要还对异性怀有欣赏与追求,往往因为这两件事

心理观察局
2026-05-04 08:51:11
CNN创始人去世,28亿家产没给儿女,全给了野牛和草地

CNN创始人去世,28亿家产没给儿女,全给了野牛和草地

纪中百大事
2026-05-10 09:31:51
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
2026-05-11 00:08:49
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
619文章数 8410关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

头条要闻

儿子车祸受伤生存希望不足0.1% 母亲请中医熬"还魂汤"

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

教育
家居
本地
数码
公开课

教育要闻

请教会你的孩子有能力分辨和说不!

家居要闻

菁英人居 全能豪宅

本地新闻

用苏绣的方式,打开江西婺源

数码要闻

古尔曼:苹果macOS 27将进一步完善液态玻璃设计

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版