网易首页 > 网易号 > 正文 申请入驻

45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误

0
分享至

AI证明数学猜想,这次来真的了。

OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。

论证过程经菲尔兹奖得主陶哲轩验证成立,还被评价为“迄今为止最明确的第一类结果(AI主要贡献)”。


这道题是埃尔德什问题库中的第281号,由传奇数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系。

45年来,这道题一直静静躺在问题库里,等待解答。

直到2025年1月17日,一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。


证明只用到GPT 5.2 Pro

埃尔德什问题网站已收录AI证明结果。

整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。


按陶哲轩的话说,它是“Furstenberg对应原理”的一个变体,这是遍历理论与组合数学交叉领域的标准工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的论证更依赖伯克霍夫定理。


然而真正让陶哲轩印象深刻的不是证明方法本身,而是AI没有犯错。

让我更惊讶的是它避免了错误,比如极限交换或量词顺序的失误,这正是这道题最容易踩的坑。前几代大语言模型几乎肯定会在这些微妙之处栽跟头。

为了验证这份证明,陶哲轩亲自动手,把整套遍历论论证翻译成了组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,重新走了一遍全部推导。

结论:证明成立。

一个意外的发现

正当大家讨论GPT-5.2 Pro的证明时,一位网名KoishiChan的用户在评论区抛出了一个令人意外的发现:

这道题其实有更简单的解法,而且所需的两个定理早在1936年和1966年就已经存在了。

第一个是达文波特(Harold Davenport)与埃尔德什本人在1936年合作证明的密度收敛定理。

第二个是罗杰斯定理,首次发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典结果拼在一起,第281号问题几乎是直接推论。

这就奇怪了。埃尔德什自己就是1936年那篇论文的合著者,而他在1980年提出这道题时,都没有意识到答案近在眼前。


陶哲轩就此事专门写邮件请教了法国数学家特南鲍姆(Tenenbaum)。

特南鲍姆确认“只要满足你提到的两个经典结果(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即得到解决”,但他也猜测“问题的表述可能在某个环节被改动过”。不过目前没有人找到任何其他版本的表述,所以只能按原样处理。

更有意思的是,2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖专家在解决另一道埃尔德什问题时,同样不知道罗杰斯定理的存在,直到特南鲍姆提醒他们才补上了引用。

陶哲轩感慨:“罗杰斯定理没有得到它应有的传播。它只出现在哈尔伯斯塔姆-罗斯那本书里,没有单独发表,文献引用寥寥无几。或许这场讨论能让更多研究筛法和同余覆盖的人注意到这个结果。”

最终现在这道题有了两份证明:一份来自GPT-5.2 Pro的遍历论路径,一份来自KoishiChan挖出的经典文献组合。

陶哲轩确认两者是“不同的证明”,虽然在概念上有些重叠。


如何评估AI数学的真实成功率

消息传开后,各路AI模型纷纷被拉来交叉验证。

Gemini 3 Pro表示证明没有问题。另一位研究者用GPT-5.2 Pro反复检查论证细节,AI认为唯一需要补充严格性的地方在第二步,可以用法图引理绕过遍历论直接完成。

不过陶哲轩指出这里法图引理的方向用反:我刚教完研究生测度论,这类错误见得太多了。

随后又确认其实是对补集应用法图引理,方向没问题,论证成立。

但陶哲轩同时发出了冷静的提醒。他写道:

评估AI工具真实成功率时,最大的统计偏差来自强烈的报告偏差,负面结果几乎不会被披露。 如果某人或某AI公司把工具用在开放问题上但没有进展,他们没有动力报告这个负面结论;即使报告了,也不太可能像正面结果那样在社交媒体上传播开来。 尽管绝大多数集中在难度谱系的简单一端,远不能说明中等难度的埃尔德什问题已经进入AI的射程范围。

他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目,系统记录前沿大语言模型在埃尔德什问题上的正面和负面结果。


数据显示,这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二。

但考虑到问题库里有超过600道未解难题,这个比例仍然意味着一批数量可观且非平凡的AI贡献。


参考链接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

文章来源:量子位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

民进党,极有可能在下一届台湾地区选举后,成为长期一家独大政党

李橑在北漂
2026-04-02 10:22:26
她一生仅一首诗,却可拆成7958首,被誉为千古第一奇诗

她一生仅一首诗,却可拆成7958首,被誉为千古第一奇诗

掠影后有感
2026-03-17 10:32:57
许家印恶贯满盈 若只是经济问题国家不会动他 踩3条红线 或判无期

许家印恶贯满盈 若只是经济问题国家不会动他 踩3条红线 或判无期

念洲
2026-04-28 17:20:35
黑尾酱,彻底消失了?

黑尾酱,彻底消失了?

生如稗草
2026-03-15 08:48:11
颜面尽失!季后赛12进8:山东男篮崩盘,巩晓彬杨鸣:1人太重要

颜面尽失!季后赛12进8:山东男篮崩盘,巩晓彬杨鸣:1人太重要

话体坛
2026-04-28 22:11:33
撒贝宁、张帅获全国五一劳动奖章

撒贝宁、张帅获全国五一劳动奖章

观察者网
2026-04-28 14:16:14
44岁陈震现身北京车展,从网红车评人到无人问津,现状一点都不怨

44岁陈震现身北京车展,从网红车评人到无人问津,现状一点都不怨

林雁飞
2026-04-25 17:14:49
没等到访华邀请,高市准备报复?中方接到美媒消息,日本或掀桌

没等到访华邀请,高市准备报复?中方接到美媒消息,日本或掀桌

泠泠说史
2026-04-27 19:36:35
2859.2克黄金制品被警方扣押三十年 最新进展:双方约定见面沟通赔偿事宜 代理律师:和解的可能性很大

2859.2克黄金制品被警方扣押三十年 最新进展:双方约定见面沟通赔偿事宜 代理律师:和解的可能性很大

每日经济新闻
2026-04-27 18:05:32
超越DeepSeek-V4!罗福莉交出小米最强开源模型,首日适配5家国产芯片

超越DeepSeek-V4!罗福莉交出小米最强开源模型,首日适配5家国产芯片

智东西
2026-04-28 08:39:35
CBA又一伪强队诞生!季后赛关键战遭辽宁吊打,4外援也被打回原形

CBA又一伪强队诞生!季后赛关键战遭辽宁吊打,4外援也被打回原形

老叶评球
2026-04-28 21:55:07
哈佛科学家实锤:太阳系有两个太阳,另一个就藏在奥尔特云里

哈佛科学家实锤:太阳系有两个太阳,另一个就藏在奥尔特云里

观察宇宙
2026-04-28 18:44:39
成都蓉城与申花的比赛还没开踢!足协就给球队送来大礼,值得期待

成都蓉城与申花的比赛还没开踢!足协就给球队送来大礼,值得期待

张丽说足球
2026-04-28 09:01:46
海外市场表现亮眼,洽洽食品上半年营收超27亿

海外市场表现亮眼,洽洽食品上半年营收超27亿

北京商报
2025-08-27 19:34:49
台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

台湾最新民调出炉,蒋万安、郑丽文支持率惊人,民众党大将已表态

老头的传奇色彩
2026-04-27 12:52:27
新婚夜,妻子出上联:昌是日上日,丈夫的下联让妻子哈哈大笑

新婚夜,妻子出上联:昌是日上日,丈夫的下联让妻子哈哈大笑

千秋文化
2026-04-27 19:54:14
世锦赛最新战报:黑球绝杀71-68!头号种子爆冷被5连鞭,艾伦3-5

世锦赛最新战报:黑球绝杀71-68!头号种子爆冷被5连鞭,艾伦3-5

球场没跑道
2026-04-28 20:43:06
离开国家队后,她帮意大利实现八连冠,如今31岁绯闻不断仍是单身

离开国家队后,她帮意大利实现八连冠,如今31岁绯闻不断仍是单身

林轻吟
2026-04-28 14:25:49
北京又要下雨了

北京又要下雨了

美丽大北京
2026-04-28 15:38:11
活久见!重庆一九旬老人过寿,儿子邀请12位美女跳艳舞助兴引争议

活久见!重庆一九旬老人过寿,儿子邀请12位美女跳艳舞助兴引争议

火山詩话
2026-04-28 10:03:39
2026-04-28 22:28:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5499文章数 64624关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

女子花4080元买演唱会门票 想退退不了票还被他人用了

头条要闻

女子花4080元买演唱会门票 想退退不了票还被他人用了

体育要闻

季后赛最新局势:雷霆4-0晋级首队 4队3-1

娱乐要闻

蔡卓妍官宣结婚,老公比她小10岁

财经要闻

中央政治局会议定调,八大看点速览!

汽车要闻

拒绝疯狂套娃!现代艾尼氪金星长在未来审美点上

态度原创

教育
艺术
时尚
家居
房产

教育要闻

现在的家长学历素质越来越高,为什么却反对老师严格管教孩子呢?

艺术要闻

深圳极具未来感的“外星”建筑亮相

她们的人生牛仔裤,链接都在这了

家居要闻

江景风格 流动的秩序

房产要闻

红利爆发!海南,冲到全国人口增量第4省!

无障碍浏览 进入关怀版