网易首页 > 网易号 > 正文 申请入驻

45年数论猜想被GPT-5.2 Pro独立完成证明,陶哲轩:没犯任何错误

0
分享至

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

AI证明数学猜想,这次来真的了。

OpenAI最新模型GPT-5.2 Pro刚刚独立证明了一道埃尔德什猜想。

论证过程经菲尔兹奖得主陶哲轩验证成立,还被评价为“迄今为止最明确的第一类结果(AI主要贡献)”。



这道题是埃尔德什问题库中的第281号,由传奇数学家保罗·埃尔德什(Paul Erdős)与罗纳德·格雷厄姆(Ronald Graham)于1980年共同提出,涉及同余覆盖系统与自然密度的深层关系。

45年来,这道题一直静静躺在问题库里,等待解答。

直到2026年1月17日,一位名叫Neel Somani的研究者把这道题扔给了GPT-5.2 Pro。



证明只用到GPT 5.2 Pro

埃尔德什问题网站已收录AI证明结果。

整个论证在无穷阿德尔整数环上展开,借助哈尔测度和点态遍历定理,结合紧致性论证完成了从逐点收敛到一致收敛的跃迁。



按陶哲轩的话说,它是“Furstenberg对应原理”的一个变体,这是遍历理论与组合数学交叉领域的标准工具。

但GPT-5.2 Pro的用法又有些不同,它比通常的论证更依赖伯克霍夫定理。



然而真正让陶哲轩印象深刻的不是证明方法本身,而是AI没有犯错。

  • 让我更惊讶的是它避免了错误,比如极限交换或量词顺序的失误,这正是这道题最容易踩的坑。前几代大语言模型几乎肯定会在这些微妙之处栽跟头。

为了验证这份证明,陶哲轩亲自动手,把整套遍历论论证翻译成了组合学语言,用哈代-利特尔伍德极大不等式替代伯克霍夫定理,重新走了一遍全部推导。

结论:证明成立。

一个意外的发现

正当大家讨论GPT-5.2 Pro的证明时,一位网名KoishiChan的用户在评论区抛出了一个令人意外的发现:

这道题其实有更简单的解法,而且所需的两个定理早在1936年和1966年就已经存在了。

第一个是达文波特(Harold Davenport)与埃尔德什本人在1936年合作证明的密度收敛定理。

第二个是罗杰斯定理,首次发表于1966年的哈尔伯斯塔姆-罗斯专著《序列》第五章。把这两个经典结果拼在一起,第281号问题几乎是直接推论。

这就奇怪了。埃尔德什自己就是1936年那篇论文的合著者,而他在1980年提出这道题时,都没有意识到答案近在眼前。



陶哲轩就此事专门写邮件请教了法国数学家特南鲍姆(Tenenbaum)。

特南鲍姆确认“只要满足你提到的两个经典结果(达文波特-埃尔多斯定理和罗杰斯定理),问题就能立即得到解决”,但他也猜测“问题的表述可能在某个环节被改动过”。不过目前没有人找到任何其他版本的表述,所以只能按原样处理。

更有意思的是,2007年菲拉塞塔、福特、科尼亚金、波默朗斯和余等五位顶尖专家在解决另一道埃尔德什问题时,同样不知道罗杰斯定理的存在,直到特南鲍姆提醒他们才补上了引用。

陶哲轩感慨:“罗杰斯定理没有得到它应有的传播。它只出现在哈尔伯斯塔姆-罗斯那本书里,没有单独发表,文献引用寥寥无几。或许这场讨论能让更多研究筛法和同余覆盖的人注意到这个结果。”

最终现在这道题有了两份证明:一份来自GPT-5.2 Pro的遍历论路径,一份来自KoishiChan挖出的经典文献组合。

陶哲轩确认两者是“不同的证明”,虽然在概念上有些重叠。



如何评估AI数学的真实成功率

消息传开后,各路AI模型纷纷被拉来交叉验证。

Gemini 3 Pro表示证明没有问题。另一位研究者用GPT-5.2 Pro反复检查论证细节,AI认为唯一需要补充严格性的地方在第二步,可以用法图引理绕过遍历论直接完成。

不过陶哲轩指出这里法图引理的方向用反:我刚教完研究生测度论,这类错误见得太多了。

随后又确认其实是对补集应用法图引理,方向没问题,论证成立。

但陶哲轩同时发出了冷静的提醒。他写道:

  • 评估AI工具真实成功率时,最大的统计偏差来自强烈的报告偏差,负面结果几乎不会被披露。
  • 如果某人或某AI公司把工具用在开放问题上但没有进展,他们没有动力报告这个负面结论;即使报告了,也不太可能像正面结果那样在社交媒体上传播开来。
  • 尽管绝大多数集中在难度谱系的简单一端,远不能说明中等难度的埃尔德什问题已经进入AI的射程范围。

他推荐了Paata Ivanisvili和Mehmet Mars Seven发起的一个开源项目,系统记录前沿大语言模型在埃尔德什问题上的正面和负面结果。



数据显示,这些工具在埃尔德什问题上的真实成功率大约只有百分之一到二。

但考虑到问题库里有超过600道未解难题,这个比例仍然意味着一批数量可观且非平凡的AI贡献。



参考链接:
[1]https://www.erdosproblems.com/forum/thread/281
[2]https://x.com/neelsomani/status/2012695714187325745
[3]https://mathstodon.xyz/@tao/115911902186528812

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
冷门市场!有价无市的三位球星!

冷门市场!有价无市的三位球星!

篮球盛世
2026-01-19 15:10:34
这些离谱谣言该停了:英国没地铁?美澳遍地饥民?

这些离谱谣言该停了:英国没地铁?美澳遍地饥民?

老马拉车莫少装
2025-12-20 07:06:48
牛女士道歉后续:爷爷转账100删除孩子联系方式,有人跑单位去闹

牛女士道歉后续:爷爷转账100删除孩子联系方式,有人跑单位去闹

阿纂看事
2026-01-17 09:52:50
“中俄巩固主导地位,新建数量占全球90%”

“中俄巩固主导地位,新建数量占全球90%”

观察者网
2026-01-19 15:05:09
这就是毛主席父亲的真实容貌,都看看吧,这可不是演员扮演的!

这就是毛主席父亲的真实容貌,都看看吧,这可不是演员扮演的!

老踲系戏精北鼻
2026-01-19 14:22:37
南非宣布进入“国家灾难状态”

南非宣布进入“国家灾难状态”

财联社
2026-01-19 01:50:47
京城某央企总部食堂餐食

京城某央企总部食堂餐食

微微热评
2026-01-19 12:21:25
国家统计局:2025年,全国居民人均可支配收入43377元,比上年名义增长5.0%,扣除价格因素,实际增长5.0%

国家统计局:2025年,全国居民人均可支配收入43377元,比上年名义增长5.0%,扣除价格因素,实际增长5.0%

每日经济新闻
2026-01-19 10:13:21
陈幸同突然更新美照,却因为突然取关周启豪,陷入分手疑云

陈幸同突然更新美照,却因为突然取关周启豪,陷入分手疑云

凤幻洋
2026-01-19 17:28:07
澳洲一家人日本旅游破防:到处被嫌弃,只有7-11收留我们!

澳洲一家人日本旅游破防:到处被嫌弃,只有7-11收留我们!

新欧洲
2026-01-18 20:59:29
“一看就是穷人房间”,女儿吐槽家境而不自知,父母不是滋味

“一看就是穷人房间”,女儿吐槽家境而不自知,父母不是滋味

泽泽先生
2026-01-18 21:29:44
人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

小熊侃史
2026-01-18 07:20:09
迪亚斯勺子点球被扑,90分钟吹哨后摩洛哥主帅对其表达不满

迪亚斯勺子点球被扑,90分钟吹哨后摩洛哥主帅对其表达不满

懂球帝
2026-01-19 09:17:13
一波未平一波又起!闫学晶的账还没有算清,49岁李湘又“塌”了

一波未平一波又起!闫学晶的账还没有算清,49岁李湘又“塌”了

真的八卦小学弟
2026-01-19 19:00:08
王菲没想到,李亚鹏2天收1400万后,海哈金喜凭一举动迎口碑暴涨

王菲没想到,李亚鹏2天收1400万后,海哈金喜凭一举动迎口碑暴涨

寒士之言本尊
2026-01-19 16:16:28
报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

皮蛋儿电影
2026-01-16 22:51:50
广东多地发布人事任免

广东多地发布人事任免

上观新闻
2026-01-19 15:09:07
网友调侃最快护士该请马俊仁执教,张水华呆萌反问:马俊仁是谁?

网友调侃最快护士该请马俊仁执教,张水华呆萌反问:马俊仁是谁?

杨华评论
2026-01-19 00:45:03
CCTV5直播,上海久事VS北京首钢,古德温PK杰曼,大白边VS马帝昂

CCTV5直播,上海久事VS北京首钢,古德温PK杰曼,大白边VS马帝昂

体坛小快灵
2026-01-19 15:05:13
兰州一滑雪场缆车突发停电困住104名游客,每人赔7千!亲历游客:有小孩冻晕被抱走

兰州一滑雪场缆车突发停电困住104名游客,每人赔7千!亲历游客:有小孩冻晕被抱走

潇湘晨报
2026-01-18 21:44:24
2026-01-19 21:32:49
量子位 incentive-icons
量子位
追踪人工智能动态
12032文章数 176360关注度
往期回顾 全部

科技要闻

这一仗必须赢!马斯克死磕芯片"9个月一更"

头条要闻

特朗普给挪威首相发信息:不再有义务只考虑和平

头条要闻

特朗普给挪威首相发信息:不再有义务只考虑和平

体育要闻

错失英超冠军奖牌,他却在德甲成为传奇

娱乐要闻

吴磊起诉白珊珊诽谤,白珊珊称被盗号

财经要闻

公章争夺 家族反目 双星为何从顶端跌落?

汽车要闻

徐军:冲击百万销量,零跑一直很清醒

态度原创

家居
旅游
本地
数码
公开课

家居要闻

隽永之章 清雅无尘

旅游要闻

四川广元昭化古城:千年文脉在守护与创新中焕发新生|文化中国行·巴风蜀韵

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

数码要闻

海信发布E8S系列RGB-Mini LED电视:RGB真彩背光,12999元起

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版