网易首页 > 网易号 > 正文 申请入驻

AI仅6小时破解30年数学难题,陶哲轩与ChatGPT均失败

0
分享至

之前,数学圈炸了个大新闻悬了30年的埃尔德什问题#124,被一个叫「亚里士多德」的AI给解决了。

这事儿说出来你可能不信,人类数学家啃了三十年没啃动的硬骨头,AI花6小时就算完了,验证只用了1分钟,刚开始我也觉得玄乎。

数学这东西,讲究逻辑严密,一步错步步错,30年数学难题,AI仅6小时告破,陶哲轩,ChatGPT们都失败了真能靠谱?直到看到GitHub上公开的证明代码,还有数学界大佬们的讨论,才发现这事儿是真的。

保罗·埃尔德什这个人,在数学圈是个传奇,一辈子没家没业,满世界跑着跟人合作写论文,发表过1500多篇,堪称“数学界的游牧民族”。



他不光自己搞研究,还喜欢出题给别人,生前列了一堆数学问题,从数论到组合数学都有,每个问题都像个智力闯关游戏。

这些问题里,有些不难,很快就被搞定了,但有些就跟“钉子户”似的,一卡就是几十年。

埃尔德什问题#124,就是其中之一,从90年代提出到现在,整整30年没人能拿下。

埃尔德什#124这问题,光看表述就够绕的,大纲里写得专业,“给定k个自然数d_i≥2,若∑1/(d_i-1)≥1,则对任意自然数n,存在a_i使得n=∑a_i,且每个a_i在d_i进制下的数字仅含{0,1}。”



翻译成人话,就是给你几个大于等于2的数,比如3、4、5,先算它们“减1后的倒数”,也就是1/(3-1)=0.5,1/(4-1)≈0.333,1/(5-1)=0.25,加起来0.5+0.333+0.25=1.083,大于1。

这时候,随便给个自然数n,比如100,能不能找到几个数a1、a2、a3,让它们加起来等于100?关键是a1得是3进制的数(只能有0和1),a2是4进制(只能有0和1),a3是5进制(只能有0和1)。

简单说,就像用几种特殊的“二进制”拼出任意数,二进制大家熟,只有0和1,能表示所有数。



这问题听着简单,证明起来要了老命,人类数学家30年没搞定,不是因为笨,是真有技术瓶颈。

传统证明靠人工推导,一步一步算,但这问题涉及的变量太多,要覆盖所有可能情况,光靠脑子想根本顾不过来。

最大公约数验证、边界案例枚举,随便一个环节卡壳就前功尽弃。

有个叫BorisAlexeev的数学家,不服气,想用计算机工具验证,结果折腾半天还是没搞定。



他后来自己说,“就像在迷宫里打转,看着出口就在眼前,就是找不到门。,我瞅着这问题就头大,更别说证明了。

可数学家就吃这碗饭,越难越兴奋,没想到最后破局的,不是哪个天才数学家,而是个AI。

这个AI叫「亚里士多德」,名字挺霸气,跟古希腊哲学家一个名,它是一家叫HarmonicMath的公司搞出来的。

这家公司叫HarmonicMath,老板是VladTenev,团队里既有搞机器学习的码农,也有正经的数学家,算是“文理混搭”的典范。



他们不搞通用AI,就盯着数学推理死磕,「亚里士多德」的核心技术,说起来挺复杂,但简单理解就是“三板斧”,强化学习负责试错找策略,蒙特卡洛树搜索负责高效遍历可能性,Lean形式化语言负责保证每一步都没错。

你可能会问,ChatGPT、Gemini这些大模型不行吗?还真不行。

这些通用AI说白了就是“文献复读机”,只能在已有的知识库里找答案,让它们自己推导新东西,门儿都没有。

Gemini之前分析#124时,也就指出“最大公约数很重要”,然后就没下文了,跟没说一样。



「亚里士多德」不一样,它是“专业选手”,去年年底,BorisAlexeev把#124问题翻译成AI能看懂的“数学代码”,喂给了「亚里士多德」。

接下来的6小时,这AI没干别的,就是疯狂试各种证明思路。

上亿种可能路径里筛出一条它发现埃尔德什当年的问题表述有点小漏洞,少了个关键假设,简化版的问题其实能用已有定理推导。

找到突破口后,它基于Brown判据一顿猛算,直接输出了证明代码,最绝的是验证环节,用Lean系统跑了1分钟,逻辑严丝合缝,一点毛病没有。



证明代码后来发在了GitHub上,感兴趣的可以去瞅一眼。

里面全是密密麻麻的符号,我是看不懂,但数学家们一看就明白,这玩意儿成了!

AI这波操作,确实让不少人惊掉下巴,但你要说它是“突然开窍”,那倒也不是,背后有真功夫。

陶哲轩之前提过个“长尾分布”理论,说数学界的未解问题就像个“长尾”,大部分问题其实不难,就是专家资源有限,没人管,属于“低垂果实”。



AI正好可以去摘这些果子,2023年陶哲轩团队用AI工具,几天内就搞定了2200万条数学关系的证明,放以前人类专家干这活儿,怕是得几辈子。

有人说数学研究像片“暗森林”,大部分问题藏在角落里没人管,AI就像装了夜视仪的巡逻兵,把这些“低垂果实”一个个找出来,清理干净。

埃尔德什#124就是典型的“低垂果实”,人类数学家30年没搞定,不是因为难到逆天,而是没人发现问题表述有漏洞,白折腾了。

AI一上手就找到了关键,直接抄了近道,这事儿也给数学研究提了个醒,以后可能不是“人vs机器”,而是“人+机器”一起闯关。



AI负责体力活验证、找漏洞、清理简单问题,人类负责脑力活提出新问题、搞理论创新。

以后写论文可能都得用Lean这种形式化语言,就像现在写代码一样,每一步都得让计算机认可,想水论文怕是难了。

当然了,AI越厉害,越得有规矩,比如开源工具得共享,别搞技术垄断,让全世界的数学家都能用得上,这才是真的推动科学进步。

「亚里士多德」破解埃尔德什#124,不光是解决了一个数学问题,更像是给数学研究开了个新玩法。



以后咱们可能会看到越来越多的“AI+数学”组合,说不定哪天,那些悬了几百年的难题,也能被AI轻松拿下。

至于人类数学家会不会失业?放心,只要人类还能提出“埃尔德什问题”这样的好问题,数学家就永远有饭吃。

毕竟,AI再聪明,也得有人给它出题不是?

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
'余生好好走',知名央视主持人王小丫,在病床上的留言字字催泪

'余生好好走',知名央视主持人王小丫,在病床上的留言字字催泪

枫尘余往逝
2026-02-03 11:27:29
文旅部党组:坚决拥护党中央对连辑进行审查调查的决定

文旅部党组:坚决拥护党中央对连辑进行审查调查的决定

澎湃新闻
2026-02-04 07:37:27
大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

大快人心!乌情报总局官宣:俄军战犯佐托夫被击毙,血债终须血偿

老马拉车莫少装
2026-02-03 23:23:30
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
中国斯诺克5胜1负!丁俊晖掉队,吴宜泽常冰玉逆转,2将爆大冷!

中国斯诺克5胜1负!丁俊晖掉队,吴宜泽常冰玉逆转,2将爆大冷!

刘姚尧的文字城堡
2026-02-04 07:52:23
499隔衣服摸胸!私人影院暗藏涉黄:299元起步撕丝袜,还有更过火

499隔衣服摸胸!私人影院暗藏涉黄:299元起步撕丝袜,还有更过火

没有偏旁的常庆
2025-12-31 02:25:28
萝莉岛惊人内幕曝光,妇女儿童遭受严重虐待!

萝莉岛惊人内幕曝光,妇女儿童遭受严重虐待!

特约前排观众
2026-02-04 00:05:11
奔驰突然大范围调价

奔驰突然大范围调价

都市快报橙柿互动
2026-02-02 19:19:15
巴拿马强吞中资港口,076携神秘隐身战机就位,中国绝非软柿子

巴拿马强吞中资港口,076携神秘隐身战机就位,中国绝非软柿子

音乐时光的娱乐
2026-02-03 20:35:44
多个经济大省下调2026年GDP增速目标

多个经济大省下调2026年GDP增速目标

经济观察报
2026-02-03 17:59:05
男人切记:搞定女人的“千古定律”,只有一条,屡试不爽!

男人切记:搞定女人的“千古定律”,只有一条,屡试不爽!

云端小院
2026-01-31 08:59:12
联合国崩?191国收到信函,古特雷斯下台前:阴了中国,帮了美国

联合国崩?191国收到信函,古特雷斯下台前:阴了中国,帮了美国

顾史
2026-02-03 02:24:14
云南滇中新区三名前局长公开讨薪,称承诺的80万年薪未足额发放

云南滇中新区三名前局长公开讨薪,称承诺的80万年薪未足额发放

新浪财经
2026-02-03 18:27:25
他8次上春晚,作死被捕入狱,如今56岁无人问津,沦落到四处走穴

他8次上春晚,作死被捕入狱,如今56岁无人问津,沦落到四处走穴

小熊侃史
2026-01-06 11:17:00
不是迷信!今天立春,牢记“3做,3不做”,千万别踩坑

不是迷信!今天立春,牢记“3做,3不做”,千万别踩坑

狼小妖
2026-02-04 00:12:09
崔庸健:他是我军重要领导人,后来赴朝鲜,成为朝鲜第二号人物

崔庸健:他是我军重要领导人,后来赴朝鲜,成为朝鲜第二号人物

小港哎历史
2026-02-04 09:00:09
卧底精神病院的记者韩福涛非常不简单,油罐车事件就是他曝光的

卧底精神病院的记者韩福涛非常不简单,油罐车事件就是他曝光的

映射生活的身影
2026-02-03 22:35:50
百度搜索Kimi官网前4条都是广告,Kimi不忍了,公开喊话百度

百度搜索Kimi官网前4条都是广告,Kimi不忍了,公开喊话百度

龚进辉
2026-02-02 12:17:36
三只羊“头部网红”单飞!曾是小杨哥首个月销破亿的徒弟

三只羊“头部网红”单飞!曾是小杨哥首个月销破亿的徒弟

北京商报
2026-02-03 14:43:48
炸锅了!无锡中山路,变步行街?

炸锅了!无锡中山路,变步行街?

无锡eTV全媒体
2026-02-04 05:50:57
2026-02-04 09:56:49
许穋很机智
许穋很机智
每天创作搞笑幽默视频,谢谢关注
1039文章数 38关注度
往期回顾 全部

科技要闻

李飞飞:AI的终点不是写代码,而是人类的尊严

头条要闻

强奸大嫂凶手出狱后去大嫂家 大嫂吓得穿内衣跑出求救

头条要闻

强奸大嫂凶手出狱后去大嫂家 大嫂吓得穿内衣跑出求救

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

大S逝世一周年 S家没通知大S子女惹争议

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

游戏
家居
旅游
数码
公开课

《无主之地4》Switch 2版疑似被砍 T2称已暂停开发

家居要闻

极简木艺术 典雅自在

旅游要闻

建昌:辽西秘境中,一部活态的山水人文史诗

数码要闻

苹果更新App Store提交最低SDK要求 4月28日起实施

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版