网易首页 > 网易号 > 正文 申请入驻

AI仅6小时破解30年数学难题,陶哲轩与ChatGPT均失败

0
分享至

之前,数学圈炸了个大新闻悬了30年的埃尔德什问题#124,被一个叫「亚里士多德」的AI给解决了。

这事儿说出来你可能不信,人类数学家啃了三十年没啃动的硬骨头,AI花6小时就算完了,验证只用了1分钟,刚开始我也觉得玄乎。

数学这东西,讲究逻辑严密,一步错步步错,30年数学难题,AI仅6小时告破,陶哲轩,ChatGPT们都失败了真能靠谱?直到看到GitHub上公开的证明代码,还有数学界大佬们的讨论,才发现这事儿是真的。

保罗·埃尔德什这个人,在数学圈是个传奇,一辈子没家没业,满世界跑着跟人合作写论文,发表过1500多篇,堪称“数学界的游牧民族”。



他不光自己搞研究,还喜欢出题给别人,生前列了一堆数学问题,从数论到组合数学都有,每个问题都像个智力闯关游戏。

这些问题里,有些不难,很快就被搞定了,但有些就跟“钉子户”似的,一卡就是几十年。

埃尔德什问题#124,就是其中之一,从90年代提出到现在,整整30年没人能拿下。

埃尔德什#124这问题,光看表述就够绕的,大纲里写得专业,“给定k个自然数d_i≥2,若∑1/(d_i-1)≥1,则对任意自然数n,存在a_i使得n=∑a_i,且每个a_i在d_i进制下的数字仅含{0,1}。”



翻译成人话,就是给你几个大于等于2的数,比如3、4、5,先算它们“减1后的倒数”,也就是1/(3-1)=0.5,1/(4-1)≈0.333,1/(5-1)=0.25,加起来0.5+0.333+0.25=1.083,大于1。

这时候,随便给个自然数n,比如100,能不能找到几个数a1、a2、a3,让它们加起来等于100?关键是a1得是3进制的数(只能有0和1),a2是4进制(只能有0和1),a3是5进制(只能有0和1)。

简单说,就像用几种特殊的“二进制”拼出任意数,二进制大家熟,只有0和1,能表示所有数。



这问题听着简单,证明起来要了老命,人类数学家30年没搞定,不是因为笨,是真有技术瓶颈。

传统证明靠人工推导,一步一步算,但这问题涉及的变量太多,要覆盖所有可能情况,光靠脑子想根本顾不过来。

最大公约数验证、边界案例枚举,随便一个环节卡壳就前功尽弃。

有个叫BorisAlexeev的数学家,不服气,想用计算机工具验证,结果折腾半天还是没搞定。



他后来自己说,“就像在迷宫里打转,看着出口就在眼前,就是找不到门。,我瞅着这问题就头大,更别说证明了。

可数学家就吃这碗饭,越难越兴奋,没想到最后破局的,不是哪个天才数学家,而是个AI。

这个AI叫「亚里士多德」,名字挺霸气,跟古希腊哲学家一个名,它是一家叫HarmonicMath的公司搞出来的。

这家公司叫HarmonicMath,老板是VladTenev,团队里既有搞机器学习的码农,也有正经的数学家,算是“文理混搭”的典范。



他们不搞通用AI,就盯着数学推理死磕,「亚里士多德」的核心技术,说起来挺复杂,但简单理解就是“三板斧”,强化学习负责试错找策略,蒙特卡洛树搜索负责高效遍历可能性,Lean形式化语言负责保证每一步都没错。

你可能会问,ChatGPT、Gemini这些大模型不行吗?还真不行。

这些通用AI说白了就是“文献复读机”,只能在已有的知识库里找答案,让它们自己推导新东西,门儿都没有。

Gemini之前分析#124时,也就指出“最大公约数很重要”,然后就没下文了,跟没说一样。



「亚里士多德」不一样,它是“专业选手”,去年年底,BorisAlexeev把#124问题翻译成AI能看懂的“数学代码”,喂给了「亚里士多德」。

接下来的6小时,这AI没干别的,就是疯狂试各种证明思路。

上亿种可能路径里筛出一条它发现埃尔德什当年的问题表述有点小漏洞,少了个关键假设,简化版的问题其实能用已有定理推导。

找到突破口后,它基于Brown判据一顿猛算,直接输出了证明代码,最绝的是验证环节,用Lean系统跑了1分钟,逻辑严丝合缝,一点毛病没有。



证明代码后来发在了GitHub上,感兴趣的可以去瞅一眼。

里面全是密密麻麻的符号,我是看不懂,但数学家们一看就明白,这玩意儿成了!

AI这波操作,确实让不少人惊掉下巴,但你要说它是“突然开窍”,那倒也不是,背后有真功夫。

陶哲轩之前提过个“长尾分布”理论,说数学界的未解问题就像个“长尾”,大部分问题其实不难,就是专家资源有限,没人管,属于“低垂果实”。



AI正好可以去摘这些果子,2023年陶哲轩团队用AI工具,几天内就搞定了2200万条数学关系的证明,放以前人类专家干这活儿,怕是得几辈子。

有人说数学研究像片“暗森林”,大部分问题藏在角落里没人管,AI就像装了夜视仪的巡逻兵,把这些“低垂果实”一个个找出来,清理干净。

埃尔德什#124就是典型的“低垂果实”,人类数学家30年没搞定,不是因为难到逆天,而是没人发现问题表述有漏洞,白折腾了。

AI一上手就找到了关键,直接抄了近道,这事儿也给数学研究提了个醒,以后可能不是“人vs机器”,而是“人+机器”一起闯关。



AI负责体力活验证、找漏洞、清理简单问题,人类负责脑力活提出新问题、搞理论创新。

以后写论文可能都得用Lean这种形式化语言,就像现在写代码一样,每一步都得让计算机认可,想水论文怕是难了。

当然了,AI越厉害,越得有规矩,比如开源工具得共享,别搞技术垄断,让全世界的数学家都能用得上,这才是真的推动科学进步。

「亚里士多德」破解埃尔德什#124,不光是解决了一个数学问题,更像是给数学研究开了个新玩法。



以后咱们可能会看到越来越多的“AI+数学”组合,说不定哪天,那些悬了几百年的难题,也能被AI轻松拿下。

至于人类数学家会不会失业?放心,只要人类还能提出“埃尔德什问题”这样的好问题,数学家就永远有饭吃。

毕竟,AI再聪明,也得有人给它出题不是?

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
体制女生为何成大龄单身重灾区?一个热帖扎心:不是好男人绝种了

体制女生为何成大龄单身重灾区?一个热帖扎心:不是好男人绝种了

火山詩话
2026-04-02 16:20:07
超1800名数学家联合抵制在美举办国际数学家大会:美军事行动破坏世界稳定,去那里不安全,且与数学家之间的国际团结意识目标相悖

超1800名数学家联合抵制在美举办国际数学家大会:美军事行动破坏世界稳定,去那里不安全,且与数学家之间的国际团结意识目标相悖

极目新闻
2026-04-01 10:59:30
好消息、坏消息与真相

好消息、坏消息与真相

老头和你随便聊聊
2026-03-30 12:57:42
日本8艘宙斯盾舰全改战斧!射程覆盖北京上海,威胁中国腹地!

日本8艘宙斯盾舰全改战斧!射程覆盖北京上海,威胁中国腹地!

诗酒趁的年华
2026-04-01 05:01:12
表面德艺双馨,背后一肚子“男盗女娼”!这几位老前辈太让人意外

表面德艺双馨,背后一肚子“男盗女娼”!这几位老前辈太让人意外

阿尢说历史
2026-04-01 21:41:36
北京某科技公司又通知放假,已累计放假近2年!

北京某科技公司又通知放假,已累计放假近2年!

黯泉
2026-04-02 17:02:38
黄潜中场帕普-盖伊:我能在英超立足,冬窗确实收到一些报价

黄潜中场帕普-盖伊:我能在英超立足,冬窗确实收到一些报价

懂球帝
2026-04-03 02:10:29
落入第三档!国足亚洲杯上上签分组:沙特+叙利亚+新加坡,冲八强

落入第三档!国足亚洲杯上上签分组:沙特+叙利亚+新加坡,冲八强

男足的小球童
2026-04-02 17:02:55
168比4,中美罕见同声,俄罗斯和朝鲜唱反调,两个细节很重要

168比4,中美罕见同声,俄罗斯和朝鲜唱反调,两个细节很重要

近史博览
2026-04-02 09:53:05
终于定了!中国移动正式发通知:自4月30日起,全国统一执行

终于定了!中国移动正式发通知:自4月30日起,全国统一执行

探源历史
2026-04-03 01:26:27
童瑶其实挺真实的,明明一直在健身,小腹还是没法完全平坦

童瑶其实挺真实的,明明一直在健身,小腹还是没法完全平坦

小光侃娱乐
2026-04-01 13:15:08
比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企倒了,负债7500亿,创始人被带走

芳芳历史烩
2025-12-25 20:32:52
1552亿,600台光刻机,ASML正式表态,美媒:相当于是摊牌了

1552亿,600台光刻机,ASML正式表态,美媒:相当于是摊牌了

疯狂小菠萝
2026-04-02 17:19:58
伊朗有救了?一架专机降落中国,王毅表明态度,替美承担部分责任

伊朗有救了?一架专机降落中国,王毅表明态度,替美承担部分责任

林子说事
2026-04-02 17:35:56
“大批日本人离开上海”,本质是日企收缩与产业转型叠加的结果

“大批日本人离开上海”,本质是日企收缩与产业转型叠加的结果

南权先生
2026-01-31 15:50:51
开业2年直接闭店!北京这家奥莱倒下,撕开线下商业最痛真相

开业2年直接闭店!北京这家奥莱倒下,撕开线下商业最痛真相

城市商业视角
2026-04-02 13:06:03
天价、赛制、时区与歧视:2026美墨加世界杯注定失败的四大硬伤!

天价、赛制、时区与歧视:2026美墨加世界杯注定失败的四大硬伤!

田先生篮球
2026-04-02 21:40:54
官方:格策与法兰克福续约至2028年

官方:格策与法兰克福续约至2028年

懂球帝
2026-04-02 00:08:15
【酒业要闻】i茅台调整飞天抢购规则;蓉酒公司发布全国招商公告;郎酒三品节定档4月22日...

【酒业要闻】i茅台调整飞天抢购规则;蓉酒公司发布全国招商公告;郎酒三品节定档4月22日...

微酒
2026-04-02 21:26:25
陌生男女KTV发生关系,女说强奸,公诉机关:姿势推断女方自愿!

陌生男女KTV发生关系,女说强奸,公诉机关:姿势推断女方自愿!

书画艺术收藏
2026-02-27 19:30:06
2026-04-03 03:51:00
许穋很机智
许穋很机智
每天创作搞笑幽默视频,谢谢关注
1361文章数 44关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

北京89岁奶奶困屋内从27层翻窗下爬 爬到21层吓坏邻居

头条要闻

北京89岁奶奶困屋内从27层翻窗下爬 爬到21层吓坏邻居

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

《浪姐》人气榜出炉!曾沛慈断层第一

财经要闻

市场被特朗普一句话打醒 滞胀交易回归

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

本地
家居
数码
教育
手机

本地新闻

从学徒到世界冠军,为什么说张雪的底气在重庆?

家居要闻

岁月静好 典雅新章

数码要闻

跨界者大疆:不折腾才是扫地机的终极形态

教育要闻

王炸!这个区超两成考生“摇号上高中”,北京中招格局悄然变脸?

手机要闻

安卓性能榜定出炉:骁龙霸榜旗舰榜单,联发科占据次旗舰榜单!

无障碍浏览 进入关怀版