网易首页 > 网易号 > 正文 申请入驻

陶哲轩震撼!数学家1975年埋下的「坑」,被AI和全球网友用48小时填平了

0
分享至


来源:AI思想会

刚刚,AI又破解了一个数学难题!

Erdos,且给出了正式证明。

而在此之前,这个问题已经困扰了数学界50年。


陶哲轩在Mastodon上宣布了这一消息,还在一篇博客中详细讲述了这个故事。


他强调,在AI的辅助下,人类团队仅用了48小时,就顺利攻克了这一难题。

并且,AI在此过程中带来的是全新理解,绝非搜索这么简单。

要知道,如果是靠传统方法,只靠数学家使用编程和文献检索,可能会需要数周甚至数月。

在这个过程中,AI实际上是在生成新的数学洞见,而不仅仅是检索现有文献。

Harmonic官网也宣布了这一消息,其AI系统Aristotle参与了此次解题过程。


Erdos

1975年,传奇数学家保罗·埃尔德什在一篇论文的角落随手写下一个问题。

半个世纪后,这个问题静静躺在「埃尔德什问题网站」上,编号1026。

谁也没想到,它会在2025年的最后一个月,被一群数学家利用AI工具,在短短48小时内彻底破解。

埃尔德什的原问题,读起来有点像谜语。


给定一串不同的实数x1,x2,…,xn,定义S(x1,…,xn)为所有单调子序列(递增或递减)的最大可能和。

这个函数有什么性质?

问题一出,大家面面相觑:这到底要问什么?是求S的表达式?还是找它和总和的比值下界?

2025年9月12日,问题被挂上网站时,附加了一条注释:「该问题表述较为模糊。」

但数学家的本能,就是要把模糊变成精确。

当天,网友Desmond Weisenberg提出了一个清晰的游戏化解释:

Alice和Bob的硬币游戏

Alice有N枚硬币,她分成n堆,每堆xi枚(xi可不同)。Bob可以选取一个单调的子序列(递增或递减),拿走这些堆里所有硬币。

问:无论Alice怎么分堆,Bob至少能拿到总硬币数的多少比例?

这个比例,记作c(n)。


从n=3到平方数猜想

可以先看这样几个例子。


很快,Stijn Cambie发现:

如果Alice把硬币分成k2堆,每堆差不多大,并排列成k个递减块,每块k 堆,块之间递增,那么最长单调子序列只有k堆。

于是Bob最多拿到1/k的比例,也即c(k2)≤1/k。

反过来,Wouter van Doorn用已有结果给出下限:c(n)≥(1/√2)/√n。

那么,√n·c(n)的极限是多少?它在1/√2和1之间。

第二天,Stijn手算小n的值:


数据虽少,但已足够让他大胆猜想:c(k2)=1/k。

这意味着√n·c(n)→1,Bob在n很大时几乎能保证拿到约1/√n的比例。

AI出手了!

两个月后,2025年12月7日,Boris Alexeev用AI工具Aristotle在证明辅助语言Lean中自动证出了c(k2)=1/k。

几乎同时,Koishi Chan给出一个优美的人类证明——「膨胀法」。


至此,上下界合一,猜想成功得证。

更巧的是,这个答案,其实早就存在了。

Google Scholar很快找到一篇2016年论文,其中已有此结果,并引用了更早的Wagner用「膨胀法」处理埃尔德什-塞凯赖斯定理的工作。

原来,数学早已悄悄解决过这个问题,只是未被链接到埃尔德什的原始提问。

AI登场

猜出完整公式

但故事的高潮还在后面。

陶哲轩决定用另一个AI工具AlphaEvolve系统探索c(n)。


他让AI尝试构造使S尽量小的序列,很快得到n=1到16的数值结果:


这些分数看似杂乱,但重新排列后,模式逐渐浮现了出来。


Boris从中提炼出干净公式:


并构造出极值序列:用「红」「蓝」两种数值的块交替排列,控制单调子序列的长度。

下图直观展示了该构造(a≥0的情形):


而1/c(n)的图像,正是对√n的分段线性逼近:


连接经典

正方形填充问题

随后,Lawrence Wu指出:此问题等价于一个正方形填充问题(埃尔德什问题106)。


Lawrence证明:c(n)≥1/f(n)。

理由:对任意序列,可构造一系列正方形,它们互不重叠地填满边长为S(x1,…,xn)的大正方形。

下图展示了从AlphaEvolve给出的一个序列构造出的正方形填充。



最后一击

文献中的完整解

Lawrence再用AI深度搜索,找到了2024年Baek、Koizumi、Ueoro的论文,其中证明:f(k2+2c+1)≤k+c/k。

结合Praton的嵌入论证,这恰好给出:c(k2+2a+1)≤k/(k2+a)。

上下界再次吻合,猜想完全得证!

AI+人类

48小时极限突围

这个故事最让陶哲轩触动的一点是,能汇聚一群不同背景的人、文献和工具来攻克这个问题,是何等重要。

陶哲轩感慨道:

传统模式下,一两位数学家凭借简单工具,或许最终也能拼出全貌,但那可能需要数周甚至数月。而在这个协作网络中,所有关键环节在48小时内汇聚。

要陈述并证明c(n)的精确公式,需要基于多个观察结果,大概包括以下几点:

  • 该序列可以被数值计算为有理数序列。

  • 经过适当的归一化和排列后,序列中会出现肉眼可见的规律,让人能推测出序列的形式。

  • 这个问题是Erdős-Szekeres定理的一个加权版本。

  • 在Erdős-Szekeres定理的众多证明中,1959年Seidenberg的证明可以被解释为一种离散矩形填充论证。

  • 这个问题可以被重新解释为连续正方形填充问题,实际上与Erdős问题106(关于此类填充)的(广义轴平行形式)密切相关。

  • Erdős问题106的轴平行形式最近刚被Baek-Koizumi-Ueoro解决。

  • Praton的论文表明,Erdős问题106蕴含了这个问题所需的广义版本。这个蕴含关系特指轴平行的情况。

正是靠着所有贡献者的通力合作以及他们使用的工具,所有这些关键线索才得以在48小时内汇集在一起。

如果换作传统的模式,只靠一两个数学家以及更简单的编程和文献搜索工具,虽然理论上最终也能把这些碎片拼凑起来,但这个过程会花长得多的时间(可能是数周甚至数月)。

另一个关键因素是Erdős问题网站上「平衡的AI政策」,它鼓励公开说明AI的使用情况,同时强烈反对隐瞒使用——

允许使用AI辅助编写评论,前提是:

(a)已对此进行公开说明;

(b)内容(包括数学推导、代码、数值数据及相关来源的存在性)已由用户自己在没有AI协助的情况下仔细核查与验证;

(c)评论篇幅在合理范围内,不过于冗长。


一道悬置50年的问题,在2025年的冬天,因为一次跨人机、跨时空的奇妙协作,终于画上了圆满的句号。

而这,可能只是一个新时代的开始。

参考资料:ZHB

https://terrytao.wordpress.com/2025/12/08/the-story-of-erdos-problem-126/

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高市早苗涉违法向议员发放礼品

高市早苗涉违法向议员发放礼品

界面新闻
2026-02-25 07:54:10
创新突破、载誉而归,昌发展这些生态企业用佳绩“喜贺”春节

创新突破、载誉而归,昌发展这些生态企业用佳绩“喜贺”春节

昌发展集团
2026-02-15 10:48:11
昌发展新元科技园举办“暖新元 春满园”新春主题活动

昌发展新元科技园举办“暖新元 春满园”新春主题活动

昌发展集团
2026-02-04 17:12:16
宇树机器人去年只卖了5500多台,普通家庭基本没有买的

宇树机器人去年只卖了5500多台,普通家庭基本没有买的

爆角追踪
2026-02-25 10:08:50
双杀出线!5万人口小城燃爆欧冠:创54年神迹 奖金5000万

双杀出线!5万人口小城燃爆欧冠:创54年神迹 奖金5000万

叶青足球世界
2026-02-25 07:58:53
文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

文科生 72 小时杀入 GitHub 全球榜:我没写一行代码,但指挥了一支 AI 军队

极客公园
2026-02-24 12:13:10
6.67%!深圳研发强度跃居中国第一

6.67%!深圳研发强度跃居中国第一

正解局
2026-02-24 20:43:46
恩比德复出27+6+5率76人大胜步行者 马克西32+9+8探花23分

恩比德复出27+6+5率76人大胜步行者 马克西32+9+8探花23分

醉卧浮生
2026-02-25 10:26:42
明星卸妆后,曾黎脸蜡黄,王子文像老阿姨,看到王一博后我惊呆了

明星卸妆后,曾黎脸蜡黄,王子文像老阿姨,看到王一博后我惊呆了

最美的开始
2026-02-24 19:00:14
一家四口春节“硬核”出游:从杭州自驾到嘉峪关,2700公里电车充电18次,“真香了”

一家四口春节“硬核”出游:从杭州自驾到嘉峪关,2700公里电车充电18次,“真香了”

极目新闻
2026-02-24 18:14:46
官媒发文,63岁俞敏洪再破天花板,让董宇辉和整个商界沉默了

官媒发文,63岁俞敏洪再破天花板,让董宇辉和整个商界沉默了

小熊侃史
2026-02-24 17:59:27
未来科学城医药产业集群添新活力

未来科学城医药产业集群添新活力

昌发展集团
2026-02-10 16:37:47
库明加首秀27+7!杰伦伤退老鹰大胜奇才 特雷杨无缘战旧主

库明加首秀27+7!杰伦伤退老鹰大胜奇才 特雷杨无缘战旧主

醉卧浮生
2026-02-25 10:53:22
昌发展合成生物制造转化加速中心搭建高通量菌株构建筛选平台

昌发展合成生物制造转化加速中心搭建高通量菌株构建筛选平台

昌发展集团
2026-02-09 10:57:31
江西一家5口自驾返程遇车祸致1死4伤 目击者称一半车身被大货车挤压在护栏上

江西一家5口自驾返程遇车祸致1死4伤 目击者称一半车身被大货车挤压在护栏上

闪电新闻
2026-02-25 09:57:16
从“世界工厂”到“两业协同”:广东,正开启下一次跃迁

从“世界工厂”到“两业协同”:广东,正开启下一次跃迁

正解局
2026-02-24 20:18:39
重庆女游客在河南中灵山失联10日后遗体被找到,家属发声

重庆女游客在河南中灵山失联10日后遗体被找到,家属发声

极目新闻
2026-02-25 11:27:08
江西南昌一家人自驾返程途中发生车祸,目击者称一半的车身被大货车挤压

江西南昌一家人自驾返程途中发生车祸,目击者称一半的车身被大货车挤压

观威海
2026-02-25 10:26:09
2月24日起,中国出口美国关税将从20%降至10%

2月24日起,中国出口美国关税将从20%降至10%

壹航运
2026-02-25 09:45:06
当地人也被宰,蓬莱酒楼屡教不改连夜被摘牌,老板透露身份还挣扎

当地人也被宰,蓬莱酒楼屡教不改连夜被摘牌,老板透露身份还挣扎

社会日日鲜
2026-02-24 09:27:23
2026-02-25 11:59:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4543文章数 37409关注度
往期回顾 全部

科技要闻

苹果MacBook Pro要加触摸屏了,还带灵动岛

头条要闻

夫妻8年还清百万元债务:在杭州开饭店 几乎全年无休

头条要闻

夫妻8年还清百万元债务:在杭州开饭店 几乎全年无休

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

春节档"开门黑" 电影票少卖了7000万张

汽车要闻

方程豹首款轿车实车图曝光 就等价格了?

态度原创

教育
时尚
本地
数码
游戏

教育要闻

专门听外行的,专门不听内行的:遇到这样的父母,我无语了!

普通人穿衣别太老气横秋!这些穿搭给你灵感,保暖耐看两不误

本地新闻

津南好·四时总相宜

数码要闻

Spotify推出骨灰盒音箱,让音乐陪伴“来世”

《漫威金刚狼》正式确认9月15日发售 魔形女等经典角色登场

无障碍浏览 进入关怀版