网易首页 > 网易号 > 正文 申请入驻

陶哲轩震撼!数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

0
分享至

  

  新智元报道

  编辑:编辑部

  【新智元导读】48小时,50年数学谜题就被破解!AI与全球数学家梦幻联动,从游戏分硬币到正方形填充,层层拆解埃尔德什遗留难题,人机协作彻底引爆了数学研究新范式。

  刚刚,AI又破解了一个数学难题!

  Erdos#1026问题已经被攻克,且给出了正式证明。

  而在此之前,这个问题已经困扰了数学界50年。

  

  陶哲轩在Mastodon上宣布了这一消息,还在一篇博客中详细讲述了这个故事。

  

  他强调,在AI的辅助下,人类团队仅用了48小时,就顺利攻克了这一难题。

  并且,AI在此过程中带来的是全新理解,绝非搜索这么简单。

  要知道,如果是靠传统方法,只靠数学家使用编程和文献检索,可能会需要数周甚至数月。

  在这个过程中,AI实际上是在生成新的数学洞见,而不仅仅是检索现有文献。

  Harmonic官网也宣布了这一消息,其AI系统Aristotle参与了此次解题过程。

  

  Erdos

  1975年,传奇数学家保罗·埃尔德什在一篇论文的角落随手写下一个问题。

  半个世纪后,这个问题静静躺在「埃尔德什问题网站」上,编号1026。

  谁也没想到,它会在2025年的最后一个月,被一群数学家利用AI工具,在短短48小时内彻底破解。

  埃尔德什的原问题,读起来有点像谜语。

  

  给定一串不同的实数x1,x2,…,xn,定义S(x1,…,xn)为所有单调子序列(递增或递减)的最大可能和。

  这个函数有什么性质?

  问题一出,大家面面相觑:这到底要问什么?是求S的表达式?还是找它和总和的比值下界?

  2025年9月12日,问题被挂上网站时,附加了一条注释:「该问题表述较为模糊。」

  但数学家的本能,就是要把模糊变成精确。

  当天,网友Desmond Weisenberg提出了一个清晰的游戏化解释:

  Alice和Bob的硬币游戏

  Alice有N枚硬币,她分成n堆,每堆xi枚(xi可不同)。Bob可以选取一个单调的子序列(递增或递减),拿走这些堆里所有硬币。

  问:无论Alice怎么分堆,Bob至少能拿到总硬币数的多少比例?

  这个比例,记作c(n)。

  

  从n=3到平方数猜想

  可以先看这样几个例子。

  

  很快,Stijn Cambie发现:

  如果Alice把硬币分成k2堆,每堆差不多大,并排列成k个递减块,每块k 堆,块之间递增,那么最长单调子序列只有k堆。

  于是Bob最多拿到1/k的比例,也即c(k2)≤1/k。

  反过来,Wouter van Doorn用已有结果给出下限:c(n)≥(1/√2)/√n。

  那么,√n·c(n)的极限是多少?它在1/√2和1之间。

  第二天,Stijn手算小n的值:

  

  数据虽少,但已足够让他大胆猜想:c(k2)=1/k。

  这意味着√n·c(n)→1,Bob在n很大时几乎能保证拿到约1/√n的比例。

  AI出手了!

  两个月后,2025年12月7日,Boris Alexeev用AI工具Aristotle在证明辅助语言Lean中自动证出了c(k2)=1/k。

  几乎同时,Koishi Chan给出一个优美的人类证明——「膨胀法」。

  

  至此,上下界合一,猜想成功得证。

  更巧的是,这个答案,其实早就存在了。

  Google Scholar很快找到一篇2016年论文,其中已有此结果,并引用了更早的Wagner用「膨胀法」处理埃尔德什-塞凯赖斯定理的工作。

  原来,数学早已悄悄解决过这个问题,只是未被链接到埃尔德什的原始提问。

  AI登场

  猜出完整公式

  但故事的高潮还在后面。

  陶哲轩决定用另一个AI工具AlphaEvolve系统探索c(n)。

  

  他让AI尝试构造使S尽量小的序列,很快得到n=1到16的数值结果:

  

  这些分数看似杂乱,但重新排列后,模式逐渐浮现了出来。

  

  Boris从中提炼出干净公式:

  

  并构造出极值序列:用「红」「蓝」两种数值的块交替排列,控制单调子序列的长度。

  下图直观展示了该构造(a≥0的情形):

  

  而1/c(n)的图像,正是对√n的分段线性逼近:

  

  连接经典

  正方形填充问题

  随后,Lawrence Wu指出:此问题等价于一个正方形填充问题(埃尔德什问题106)。

  

  Lawrence证明:c(n)≥1/f(n)。

  理由:对任意序列,可构造一系列正方形,它们互不重叠地填满边长为S(x1,…,xn)的大正方形。

  下图展示了从AlphaEvolve给出的一个序列构造出的正方形填充。

  

  最后一击

  文献中的完整解

  Lawrence再用AI深度搜索,找到了2024年Baek、Koizumi、Ueoro的论文,其中证明:f(k2+2c+1)≤k+c/k。

  结合Praton的嵌入论证,这恰好给出:c(k2+2a+1)≤k/(k2+a)。

  上下界再次吻合,猜想完全得证!

  AI+人类

  48小时极限突围

  这个故事最让陶哲轩触动的一点是,能汇聚一群不同背景的人、文献和工具来攻克这个问题,是何等重要。

  陶哲轩感慨道:

  传统模式下,一两位数学家凭借简单工具,或许最终也能拼出全貌,但那可能需要数周甚至数月。而在这个协作网络中,所有关键环节在48小时内汇聚。

  要陈述并证明c(n)的精确公式,需要基于多个观察结果,大概包括以下几点:

  该序列可以被数值计算为有理数序列。

  经过适当的归一化和排列后,序列中会出现肉眼可见的规律,让人能推测出序列的形式。

  这个问题是Erdős-Szekeres定理的一个加权版本。

  在Erdős-Szekeres定理的众多证明中,1959年Seidenberg的证明可以被解释为一种离散矩形填充论证。

  这个问题可以被重新解释为连续正方形填充问题,实际上与Erdős问题106(关于此类填充)的(广义轴平行形式)密切相关。

  Erdős问题106的轴平行形式最近刚被Baek-Koizumi-Ueoro解决。

  Praton的论文表明,Erdős问题106蕴含了这个问题所需的广义版本。这个蕴含关系特指轴平行的情况。

  正是靠着所有贡献者的通力合作以及他们使用的工具,所有这些关键线索才得以在48小时内汇集在一起。

  如果换作传统的模式,只靠一两个数学家以及更简单的编程和文献搜索工具,虽然理论上最终也能把这些碎片拼凑起来,但这个过程会花长得多的时间(可能是数周甚至数月)。

  另一个关键因素是Erdős问题网站上「平衡的AI政策」,它鼓励公开说明AI的使用情况,同时强烈反对隐瞒使用——

  允许使用AI辅助编写评论,前提是:

  (a)已对此进行公开说明;

  (b)内容(包括数学推导、代码、数值数据及相关来源的存在性)已由用户自己在没有AI协助的情况下仔细核查与验证;

  (c)评论篇幅在合理范围内,不过于冗长。

  

  一道悬置50年的问题,在2025年的冬天,因为一次跨人机、跨时空的奇妙协作,终于画上了圆满的句号。

  而这,可能只是一个新时代的开始。

  参考资料:ZHB

  https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
老朱家血统可能不干净……

老朱家血统可能不干净……

汉周读书
2026-01-31 12:55:06
汪小菲又曝大瓜!葛思齐称其半夜给自己打电话,不理解大S离婚

汪小菲又曝大瓜!葛思齐称其半夜给自己打电话,不理解大S离婚

不八卦掌门人
2026-02-01 15:46:12
什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

什么叫洗钱?网友:比亚迪造卫星一年20亿,拍一个减肥电影要3亿

夜深爱杂谈
2025-12-11 20:39:39
2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

2014年,黄海波刚走出收容所的大门,曲栅栅迎了上来

忠于法纪
2026-01-20 18:30:40
备战同曦!李弘权参加踩场,卢伟单独执教小偰,郭昊文与众人叙旧

备战同曦!李弘权参加踩场,卢伟单独执教小偰,郭昊文与众人叙旧

篮球资讯达人
2026-02-01 15:36:50
“真正的中国人是付钱的!”日本人竟冒充国人在巴基斯坦骗吃骗喝

“真正的中国人是付钱的!”日本人竟冒充国人在巴基斯坦骗吃骗喝

有书
2026-01-31 16:45:03
92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

92岁前法官独居上海养老院,独子留英40年开公司,他竟说不后悔

大鱼简科
2026-01-23 16:41:32
反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

反向收割?印度人把中国网贷当作“国家补贴”,坏账率高达80%!

胖哥不胡说
2026-01-20 11:47:25
昨日贵金属现史诗级暴跌不减市民抢购热潮,上海豫园老铺黄金门前有人裹着羽绒服带着露营椅彻夜排队,部分畅销款式已断货

昨日贵金属现史诗级暴跌不减市民抢购热潮,上海豫园老铺黄金门前有人裹着羽绒服带着露营椅彻夜排队,部分畅销款式已断货

纵相新闻
2026-02-01 03:17:02
千万别姐弟恋,很累!

千万别姐弟恋,很累!

果粉之家
2026-01-06 11:26:21
宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

宋朝富裕全靠这个行业政策,连元朝都不愿废除,却让朱元璋给废了

历史大学堂
2026-01-31 19:34:36
成人片单!五部被低估的“伦理神作”,把禁忌拍成了艺术

成人片单!五部被低估的“伦理神作”,把禁忌拍成了艺术

得心电影
2026-02-01 17:35:18
江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

江苏南京一校花,身高162CM,体重47公斤,五官精致到无懈可击

奇思妙想生活家
2026-01-31 14:53:58
金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

金晨事件后续,内部聊天曝光,太抠门没谈拢,多段绯闻记者放实锤

不写散文诗
2026-01-30 15:15:56
勇士消息:库里最新伤情出炉,格林离队概率增加,悍将回归倒计时

勇士消息:库里最新伤情出炉,格林离队概率增加,悍将回归倒计时

冷月小风风
2026-02-01 11:48:45
华为宣布:最高降4000元!此前苹果开启大降价

华为宣布:最高降4000元!此前苹果开启大降价

每日经济新闻
2026-01-29 18:19:05
郭凤莲感叹:要是按照陈永贵书记的设想继续发展,大寨会走向何处

郭凤莲感叹:要是按照陈永贵书记的设想继续发展,大寨会走向何处

悄悄史话
2026-01-26 18:00:42
“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

“流氓有文化更可怕”,退休老干部频繁联系女幼师,聊天记录曝光

妍妍教育日记
2026-01-27 19:58:28
黄国昌成立竞选总部,柯文哲刚放狂言,民众党生变,美女博士暴怒

黄国昌成立竞选总部,柯文哲刚放狂言,民众党生变,美女博士暴怒

靓仔情感
2026-02-01 16:34:47
贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

贵州毕节临街门面被砌墙封堵?官方通报:业主矛盾,已全部拆除

新京报
2026-02-01 17:34:07
2026-02-01 18:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14456文章数 66557关注度
往期回顾 全部

科技要闻

腾讯元宝宣布:10亿现金红包,今日开抢

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

头条要闻

开年首月连打张又侠等十"虎" 反腐没有"禁区特区盲区"

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

马年春晚第三次联排,多位明星现身

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

数码
房产
旅游
家居
艺术

数码要闻

REDMI Turbo 5 Max媒体评价汇总,大家认为客观吗?

房产要闻

藏不住的小城大事,海澄新城执掌自贸港风口,进阶兑现美好生活新篇

旅游要闻

长丰草莓香飘淮南吾悦广场

家居要闻

蓝调空舍 自由与个性

艺术要闻

明代隐藏的“草书高手”,他的字无人能模仿

无障碍浏览 进入关怀版