网易首页 > 网易号 > 正文 申请入驻

断网解题,Claude Mythos推翻Erdős 80年猜想!比OpenAI更短更漂亮

0
分享至


新智元报道


【新智元导读】OpenAI用125页思维链踹开Erdős 80年猜想的门,Mythos如今找到了一条更短更优雅的路。最离谱的是,它拿到第一个可行解就停手了——面对名满天下的开放问题,AI也会紧张。

AI做数学这件事,速度已经彻底「失控」了!

OpenAI前脚刚推翻了一个悬了80年的数学猜想,Anthropic后脚就亮出证明。同一周,DeepMind还一口气啃下了9道同类难题。

就在刚刚,Anthropic研究员Levent Alpoge在上甩出十条推文:

OpenAI花了125页才解开,他周末拿Mythos随手一试。

不仅分分钟搞定,而且路径还更短更简洁!


断网隔离,Mythos开测

这位Levent Alpoge来头可不小。

1992年出生,哈佛本科4.0满分、剑桥Part III、普林斯顿博士(导师是菲尔兹奖得主Manjul Bhargava),2015年拿了Morgan Prize(美国本科生数学研究最高奖),哈佛Junior Fellow,并且解决了希尔伯特第十问题在所有数域上的推广。

2023年GPT-4发布,他立刻被击中了。

对我来说,它瞬间成了人类有史以来创造的最有趣的东西。回到CS!

紧接着,他便加入了Anthropic。


这周OpenAI破解Erdős难题之后,Levent做了一件「显而易见的事」——让Mythos也试试。

为了确保公平,测试条件很严格。

多个Claude Code实例各自独立工作,全程断网,杜绝从OpenAI公开解法里「抄作业」的可能。


结果,模型不止一次找到了和OpenAI类似的解法,但它更偏爱另一条完全不同但更加简洁的路。

更有意思的是,模型明明已经找到了一个能推翻猜想的方案,却在第一个可行答案上就停了下来。

明明往前再走一步,就能拿到更强的结果。但Mythos太紧张了!

面对这道名满天下的开放问题,它不敢相信自己的结论,保守地停在了第一个可行方案上。

看到这,Levent直接乐了:「这种感觉,所有数学家都懂!」


目前,Opus 4.7已完成了证明全文的整理排版:


https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

80年没人赢过的赌注

时间拨回1946年。

匈牙利数学家Paul Erdős提了一个听起来极简单的问题,在平面上撒n个点,最多能有多少对点之间的距离恰好是1?

举个例子,你在桌上摆100枚硬币,每两枚硬币圆心之间如果刚好隔一个硬币直径,就算一对「单位距离」。100枚硬币最多能凑出多少对?

Erdős自己给了一个答案:把点排成方格网格,经过适当缩放后,单位距离对的数量大约是n^(1+c/log log n)。

也就是,100枚硬币大概能凑出100多一丢丢对。

然后他下了赌注,这就是极限了,没人能做得更好。


之所以这么自信,因为这里有个关键瓶颈——高斯整数Z[i]。

Erdős的方格网格依赖这个数系,而一个固定范数在Z[i]里能分解出多少种方式,取决于除数函数,上限大约是 exp(O(log n / log log n))。

这就是那个「多出一丁点」的天花板。

80年来,所有人都在这个框架里打转。


数论重武器,降维打击几何学

对于人类数学家来说,代代相传的直觉是「答案要在高斯整数Z[i]里找」。

Mythos没读过这个传统,一上来就把Z[i]换成了次数远比2大的数域K的整数环O_K。

听起来像「用大炮打蚊子」,但就是这种跨学科的暴力,撬开了80年的僵局。


方法是,先利用Golod-Shafarevich判则,在一个二次域上面搭一座无限高的「数域塔」K₀ ⊂ K₁ ⊂ K₂ ⊂……

然后对每一层K_n取一个四次根扩张F_n = K_n(D^{1/4}),次数为d_n。

这座塔之所以管用,靠的是一个关键性质:

不管塔造多高,数域的「复杂度密度」始终有界,结构始终可控。一旦参数够大,几何计数就能启动。


接下来是整个证明的核心。

在Erdős的Z[i]里,单位群只有{±1, ±i}四个元素。能往外伸的「单位距离方向」就这么几个,直接被除数函数死死卡住。

但在高维数域里,单位群的秩随维度增长,van der Corput定理直接把秩转化成方向数。

如此一来,4个方向就变成随维度爆炸式增长。


这段看不懂没关系,记住一件事就行——

Erdős被困在一个只有4个出口的房间里,Mythos把墙拆了。


接下来是具体的构造。

首先,选一个实嵌入把这些数投射到平面上,就得到了点集P。

然后,取一个单位向量平移这些点,新旧两点之间的距离恰好是1。

因为方向数增长极快,满足条件的点对数量远超Erdős的上限。

两者相乘,就得到了多项式增益。


更直觉地说:

单位距离方向数增长为exp(Ω(d log log d)),而所有其他损耗全是exp(O(d))量级。d log log d碾压d。

Erdős的猜想,就这样被推翻了。

整个论证没有任何解析上的复杂性。和OpenAI那条125页路径相比,简洁得多。


用Levent自己的话说:

高层来看,这本质上还是Erdős原始构造加上一座类域塔。

只不过这里做的是字面意义上最蠢的事——把大小不超过半径一半的点加到大小不超过半径一半的单位上。

而它之所以管用,是因为类域塔的几何计数增长实在太快了。


一周三连,各自破城

过去这一周的时间线,信息密度高到离谱。

5月20日OpenAI官宣,一个未公开名称的通用推理模型,自主反驳了Erdős单位距离猜想。

同一天,普林斯顿教授Will Sawin在arXiv贴出手工改进版,把指数从6×10⁻³⁸干到了0.014。10³⁵倍的差距。

Georgia Tech数学家Tom Trotter,Erdős本人的合作者感慨道:「如果Erdős还活着,他一定会激动到发疯。」

5月21日DeepMind上场,AlphaProof Nexus一口气啃下9道Erdős题,每道推理成本最多只需几百美元。

5月26日,Anthropic也宣布实现独立证明,路径比OpenAI的125页短得多。

三家路线完全不同,但结果都收敛到了同一个点。


从笑话到《数学年刊》

要知道,在七个月前AI做数学还是个笑话。

2025年10月,OpenAI时任VP Kevin Weil在上宣称GPT-5解决了10个Erdős问题。

看到推文后,负责维护erdosproblems.com的数学家Thomas Bloom当场回怼「严重歪曲事实」,模型只是检索到了已知解法。Yann LeCun和Demis Hassabis都跟着嘲讽了一波。

很快,Weil就删了帖,并在四个月后离开了OpenAI。


当时所有人的判断都一样:模型会做题,但不会做研究。

转眼到了今天。

Bloom签了验证报告。Gowers写下了「提交到《数学年刊》我会毫不犹豫推荐接受」的盛赞。Litt说这是「AI自主产出的第一个让我觉得本身就有意思的结果」。

甚至,Litt还在Nature的采访中表示:「没有人类能像LLM那样吸收全部数学文献。AI正在打破学科之间的壁垒。」


三年前GPT-4还做不了本科数学题。

如今,让最伟大的数学家都感到绝望的Erdős问题,却正在变成AI的入学考试!

打破80年僵局的,是一个不知道「这题应该怎么想」的模型。

没有包袱,反而能从代数数论里借来重武器去打一道几何题。

Erdős留下了超过1000道未解题。这周又解了1道。

参考资料:

https://x.com/__alpoge__/status/2059298565093196012?s=20

https://x.com/_sholtodouglas/status/2059303540150137244?s=20

https://www-cdn.anthropic.com/files/4zrzovbb/website/ca35f196125c899a5ad11f011080202a652aef02.pdf

编辑:摩西

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
安徽一男子吐槽“最离谱的婚礼”,开车80公里空腹去饿肚子回

安徽一男子吐槽“最离谱的婚礼”,开车80公里空腹去饿肚子回

九方鱼论
2026-05-26 12:27:53
狗在交配时会锁结30分钟无法中断,如此危险的动作为何没被淘汰?

狗在交配时会锁结30分钟无法中断,如此危险的动作为何没被淘汰?

宇宙时空
2026-05-27 16:00:16
发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

发现一个残忍真相:真正毁掉孩子学习动力的,不是手机,而是父母过强的“外驱力”!想要重建内动力,父母一定要戒掉“反复提醒”的习惯

青春期父母成长学堂
2026-05-27 06:41:39
海淀西城“牛娃”,扎堆涌进北京“三非”.......

海淀西城“牛娃”,扎堆涌进北京“三非”.......

京城教育圈
2026-05-27 20:18:23
西方彻底破防!为什么中国一崛起,这群移民海外的华裔反而最痛苦

西方彻底破防!为什么中国一崛起,这群移民海外的华裔反而最痛苦

观察者小海风
2026-05-27 02:13:56
越扒越有,景甜又被曝猛料,富商要求2亿和解费,张继科太无辜

越扒越有,景甜又被曝猛料,富商要求2亿和解费,张继科太无辜

八斗小先生
2026-05-26 11:25:19
花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

花生再次被关注!调查发现:糖尿病常吃花生不过半年或有4好处

芹姐说生活
2026-05-15 23:37:01
丹尼-格林:西决G5的部分吹罚的确很扯,但雷霆确实掌控了比赛

丹尼-格林:西决G5的部分吹罚的确很扯,但雷霆确实掌控了比赛

懂球帝
2026-05-27 21:52:16
投毒杀人者、 三体公司原CEO许垚被执行死刑

投毒杀人者、 三体公司原CEO许垚被执行死刑

经济观察报
2026-05-26 09:53:04
卖点是露腹肌的全男舞剧门票炒到3000元,找不到工作的「男舞蹈生」靠狂热女观众开上了豪车

卖点是露腹肌的全男舞剧门票炒到3000元,找不到工作的「男舞蹈生」靠狂热女观众开上了豪车

Vista氢商业
2026-05-25 16:04:33
最佳睡眠时长又更新了!Nature和Cell:6.4-7.8小时最抗衰,少于6小时死亡风险激增50%;每晚9-11点入睡能年轻3岁,肝脏40岁就率先加速衰老

最佳睡眠时长又更新了!Nature和Cell:6.4-7.8小时最抗衰,少于6小时死亡风险激增50%;每晚9-11点入睡能年轻3岁,肝脏40岁就率先加速衰老

梅斯医学
2026-05-26 07:52:52
开始离谱了!燕郊板块房价从4万变6千,业主集体断供

开始离谱了!燕郊板块房价从4万变6千,业主集体断供

专业聊房君
2026-05-25 07:28:59
弗爷宣布竞选连任皇马主席:掌舵世界最佳,要再带来世界最佳球星

弗爷宣布竞选连任皇马主席:掌舵世界最佳,要再带来世界最佳球星

仰卧撑FTUer
2026-05-27 10:02:15
极端高温下,印度人想炸开喜马拉雅山送走热浪,这可能吗?

极端高温下,印度人想炸开喜马拉雅山送走热浪,这可能吗?

有范又有料
2026-05-26 17:04:40
这一回,轮到烟草员工开始没心情上班了?干活没底气了?

这一回,轮到烟草员工开始没心情上班了?干活没底气了?

今朝牛马
2026-05-26 20:40:56
大坂直美穿黑礼服入场!萨巴伦卡称赞 对手嘲讽:我不是来走秀

大坂直美穿黑礼服入场!萨巴伦卡称赞 对手嘲讽:我不是来走秀

念洲
2026-05-27 09:05:15
王鹤棣风波全面失控!牵连明星人数飙升,律师介入,父亲更是冤种

王鹤棣风波全面失控!牵连明星人数飙升,律师介入,父亲更是冤种

冷紫葉
2026-05-27 17:07:58
隆江猪脚饭!曾经的打工人神饭,如今快凉透了

隆江猪脚饭!曾经的打工人神饭,如今快凉透了

草莓甜甜
2026-05-25 15:55:15
体感超43℃!孙俪在厦门片场背后汗湿,仍淡定织毛衣,幽默喊话:不要提醒我的汗,它要狂喷了

体感超43℃!孙俪在厦门片场背后汗湿,仍淡定织毛衣,幽默喊话:不要提醒我的汗,它要狂喷了

台州交通广播
2026-05-27 15:39:56
图片报:利物浦决定今夏不激活夸安萨6700万镑的回购条款

图片报:利物浦决定今夏不激活夸安萨6700万镑的回购条款

懂球帝
2026-05-27 20:48:33
2026-05-27 23:04:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15321文章数 66892关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

武契奇夫人到上海面料市场定制西服 点名要用国产羊毛

头条要闻

武契奇夫人到上海面料市场定制西服 点名要用国产羊毛

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

手机
家居
数码
艺术
房产

手机要闻

关于macOS 27,该知道的我都为大家拿到了

家居要闻

古老而持久 石影扶手椅

数码要闻

38g超轻+方形传感器 雷鸟V4 AI拍摄眼镜图赏

艺术要闻

这个夏天去苏州过几天清闲安逸的日子

房产要闻

合生创展前总裁被查!直指房企违规放贷、利益输送等问题

无障碍浏览 进入关怀版