网易首页 > 网易号 > 正文 申请入驻

留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题

0
分享至

AI进军数学界的速度太快了。

OpenAI前脚刚用内部模型突破埃尔德什的80年单位距离问题,谷歌DeepMind后脚就解决一个同样卡了人类56年的埃尔德什数学难题——

最新发布AlphaProof Nexus,一套由Gemini驱动的智能体框架,一出手就是9个埃尔德什开放问题


除了这9道,它还顺手证明了OEIS整数序列百科里的44个猜想、搞定了一道搁置15年的代数几何难题、还改进了凸优化领域里一个沿用已久的理论边界。

推理成本呢?每道题几百美元,整套证明代码也全都开源放在了GitHub上。


这篇论文共有20位作者,其中的Aja Huang,也是2016年AlphaGo的核心研究员。

56年没人做出来的题,AI 给了什么答案

AlphaProof Nexus解决的这几道题,咱挑三道最有意思的说说。

Erdős ,1970年提出,悬置56年

这道题问的是:你能不能找出一个无限大的整数集合,满足两个听起来很别扭的条件:

第一,任意从中挑三个不同的数字a、b、c,a永远不能整除b加c的和。

第二,这组数不能太零散,在自然数里要保持一定的密度。

简单理解就是,这群数字之间,既不能一个数整除另一个数,也不能一个数整除另外两个数的和,同时数字还要分布得相对密集,不能只挑寥寥几个数投机取巧。

从1970年开始,就没人能给出这个集合的完整构造,各种局部进展有,但始终拼不成一个整体解。


AI的解法是用中国剩余定理把大问题拆成许多个独立的区块,每个区块内部用三项等差数列的回避集来满足约束,然后把所有区块拼回一个完整的无限集。


Erdős ,1996年提出,30年没有定论

这道题听着就更奇怪了。

想象两个数字集合:第一个集合里全是“在三进制下只由数字0和1组成的整数”,第二个集合里全是“在四进制下只由数字0和1组成的整数”。把这两个集合里所有数字两两相加,得到一个新集合。

问:这个新集合里的数字在自然数中出现的频率(数学上叫下密度)是不是正的?

直觉上你可能会觉得,两种集合包含的数字本来就不算很多,加起来应该也挺稀疏的。

但稀疏到什么程度?是彻底稀到密度归零,还是多少保持一点正密度?

这中间的差别非常微妙,1996年提出后一直没定论。

AI的答案是:密度为零。


证明思路是log₄除以log₃是无理数。这意味着3的幂次和4的幂次可以以任意精度彼此逼近。

利用这一点,AI构造了一个归纳性稀疏化论证:不断找到两个几乎对齐的尺度,让密度以0.99的比率一步步衰减,直到彻底归零。

一个纯数论的性质,解决了一个组合几何的问题。

Erdős ,1992年提出,卡了人类34年。

这是个平面几何题,AI证明了存在这样一个无限扩展的平面点集:

你从中任意挑出有限个点,总能发现其中大部分点是不共线的——

随便截一段,看起来都挺正常,但当你试图把这个无限集合拆分成有限个“绝对没有任何三点共线”的子集时,办不到。

一个集合的每个有限局部都正常,但整体顽固得不可拆分。这种全局与局部的张力,是组合几何里最难的那一类问题。

AI把完全图的每条边映射到平面上一个点,用二次多项式编码坐标,再拉上无穷Ramsey定理完成证明,把一个几何问题翻译成了图论和逻辑的语言。

除了这三道,还有六道分别在整除集构造、范德瓦尔登数间隙、西顿集孤立点、集合拆分密度等领域。


同时,AlphaProof Nexus还在OEIS整数序列百科里证明了44个开放猜想,在代数几何那边解决了一道希尔伯特函数对数凹性的15年悬案,凸优化那边改进了一个锚定梯度下降法的理论边界。


菲尔兹奖得主陶哲轩曾经提醒过,AI目前解决埃尔德什问题的实际成功率大约在1-2%,这次谷歌的系统挑战了353道题,解开9道,比例刚好对上了。

用几百美元算力换一道56年难题

AlphaProof Nexus的架构核心用一句话就能说清楚,Gemini 3.1 Pro生成Lean语言证明步骤→Lean编译器逐行检查→报错直接反馈给模型→模型根据报错修改→再检查→循环到全部通过。


好家伙,这有点像平时写代码,只不过现在Debug的是数学定理……


在这套框架里,DeepMind设计了四个Agent

最简单的Agent A是同时启动多个独立子Agent,先靠Gemini 3.1 Pro梳理解题思路,动手编写证明代码。

写完立刻交给编译器核验,一旦报错,错误信息就会传回模型,让它不断修改、重试,直到通关。

全程没有额外辅助工具,纯靠写代码+查错循环。


Agent B多了一样东西,AlphaProof。

AlphaProof是DeepMind之前专门为奥数级别题目训练过的强化学习证明工具。

当Agent A模式在某个小步骤上反复卡住、编译器反复报错也修不过来时,Agent B可以调用AlphaProof做一次强化学习驱动的树搜索,专门攻击这个局部难点。

Agent C引入了进化算法的思路。

前面两种Agent的子Agent都是各自独立工作的,互不交流。

Agent C是所有子Agent共享一个证明草图种群,每一个子模块都会产出不同的证明草稿。

然后由另一个模型从合理性、清晰度、新颖性三个维度给每一份草稿打分,用Elo评分系统排名。

高分草稿会相互组合,衍生出新解法,低分草稿直接淘汰,整个种群在证明空间里做进化搜索。

Agent D是全功能完全体,进化筛选思路+专项工具攻克难点+大模型逻辑推理,三股力量在一个框架里协同,也是这次批量破解难题的主力。


这么看下来,我以为最强的Agent D应该会碾压一切,Agent A只当个对照组。

结果没想到论文里表明最简单的Agent A,同样能解出全部9道题

没有进化算法,没有AlphaProof,就一个LLM循环加编译器反馈的Agent A,只是在难题上更费钱一点。


研究团队把原因归为两个:

  • 一是Gemini 3.1 Pro本身的能力已经足够强了;

  • 二是Lean编译器的那层实打实的纠错反馈,对AI的引导作用,远比人们预想的更大。

这个结果或许也在预示着,未来随着大模型能力持续升级,复杂的多工具组合系统,可能不再是刚需,只用大模型+专业校验工具这套简单循环,就能搞定大多数数学难题。

而且这套方案的优势也体现在成本上,单题仅需几百美元。

埃尔德什生前为这些难题设置了悬赏,只是他不会想到——

解开这些谜题的可能不是人类智慧,而是算力。

论文地址:https://arxiv.org/abs/2605.22763v1
Github地址:https://github.com/google-deepmind/alphaproof-nexus-results

参考链接:
[1]https://x.com/pushmeet/status/2058936037754224998
[2]https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

文章来源:量子位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

老婆出轨后,我去找对方老婆,谁料他老婆:给你套房,但有个条件

千秋文化
2026-05-29 19:56:40
还敢去全季酒店过夜吗

还敢去全季酒店过夜吗

不正确
2026-05-28 23:04:54
再创历史新高!证监会副主席刘浩凌:去年A股公司分红总额2.55万亿

再创历史新高!证监会副主席刘浩凌:去年A股公司分红总额2.55万亿

每日经济新闻
2026-05-30 00:21:19
向太不再隐瞒!曝黄晓明曾当众给她下跪,一句话揭开两人真实关系

向太不再隐瞒!曝黄晓明曾当众给她下跪,一句话揭开两人真实关系

林轻吟
2026-05-30 09:37:08
为190元榴莲千里维权商家收到人身威胁言论,称已报警,并起诉“仅退款”买家索赔

为190元榴莲千里维权商家收到人身威胁言论,称已报警,并起诉“仅退款”买家索赔

红星新闻
2026-05-29 22:21:07
曾参演《九品芝麻官》知名男演员刘洵离世,罗家英发文悼念

曾参演《九品芝麻官》知名男演员刘洵离世,罗家英发文悼念

大象新闻
2026-05-30 10:07:04
关志鸥任湖北省委书记,王忠林另有任用

关志鸥任湖北省委书记,王忠林另有任用

新京报
2026-05-30 09:50:19
无缘冲击第25冠!德约遭19岁新星惊天逆转,新科大满贯冠军将诞生

无缘冲击第25冠!德约遭19岁新星惊天逆转,新科大满贯冠军将诞生

全景体育V
2026-05-30 05:28:06
讨论对华新限制措施,内部多国持谨慎态度,欧盟这次会议暴露深层次焦虑

讨论对华新限制措施,内部多国持谨慎态度,欧盟这次会议暴露深层次焦虑

环球网资讯
2026-05-30 06:40:11
巴萨官宣今夏首援 25岁英格兰国脚8000万欧加盟 签约5年+薪水翻倍

巴萨官宣今夏首援 25岁英格兰国脚8000万欧加盟 签约5年+薪水翻倍

我爱英超
2026-05-30 05:17:32
耿同学的北航博导杨昀:论文不让国内看,跟肖飞合作,清华本硕没有一作

耿同学的北航博导杨昀:论文不让国内看,跟肖飞合作,清华本硕没有一作

小小河
2026-05-29 22:41:27
耿同学又爆新料!多所985名校顶刊论文集体沦陷

耿同学又爆新料!多所985名校顶刊论文集体沦陷

网易新闻出品
2026-05-29 19:29:43
41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

41岁夫妻因“房事频繁”双双入院,医生提醒:每周不应超过一个数

医学原创故事会
2026-05-29 23:34:07
为28元外卖恶意投诉骑手,985女白领已被公司开除

为28元外卖恶意投诉骑手,985女白领已被公司开除

不写散文诗
2026-05-29 12:23:12
唐嫣素颜进幼儿园!6岁女儿戴皇冠萌翻全场,罗晋全程冷脸零互动

唐嫣素颜进幼儿园!6岁女儿戴皇冠萌翻全场,罗晋全程冷脸零互动

优墨出品
2026-05-30 08:57:35
突发!世界乒联发文道歉,WTT赛取消原因曝光,亏损没有钱举办,索林很无奈

突发!世界乒联发文道歉,WTT赛取消原因曝光,亏损没有钱举办,索林很无奈

最爱乒乓球
2026-05-30 05:04:56
湖南省农业农村厅党组书记、厅长王建球拟进一步使用

湖南省农业农村厅党组书记、厅长王建球拟进一步使用

汲古知新
2026-05-28 22:51:55
“说着说着,他的手就趁你不注意,他手就捞过来,就很熟练。”武汉女子称报案维权反遭猥亵,多次向相关部门举报、报警

“说着说着,他的手就趁你不注意,他手就捞过来,就很熟练。”武汉女子称报案维权反遭猥亵,多次向相关部门举报、报警

都市快报橙柿互动
2026-05-30 08:18:51
襄阳割麦反转?官方回应“割四赔五”是旧俗,可麦烂地里只是开始

襄阳割麦反转?官方回应“割四赔五”是旧俗,可麦烂地里只是开始

奇思妙想草叶君
2026-05-29 16:32:56
瞒不住了?比亚迪发布4nm芯片被全网扒,大家其实都弄错了重点!

瞒不住了?比亚迪发布4nm芯片被全网扒,大家其实都弄错了重点!

李将平老师
2026-05-29 20:24:30
2026-05-30 10:52:49
算法与数学之美 incentive-icons
算法与数学之美
分享知识,交流思想
5573文章数 64623关注度
往期回顾 全部

科技要闻

英伟达、微软一同发布神秘预告 下周亮相?

头条要闻

茅台经销商电话轰炸企业家"搭售"卖酒:赚有钱人的钱

头条要闻

茅台经销商电话轰炸企业家"搭售"卖酒:赚有钱人的钱

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

向太曝黄晓明曾当众给她下跪

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

数码
时尚
游戏
旅游
军事航空

数码要闻

雷电共享来了!两台电脑秒变一体

aespa治好了我的黑眼圈焦虑

《暗黑破坏神4》S14赛季PTR将于6月3日开启

旅游要闻

怀柔推出“非遗民宿样板间”,京绣、烙葫芦住客亲手做

军事要闻

中方公布参加香会阵容 几大议题受到关注

无障碍浏览 进入关怀版