网易首页 > 网易号 > 正文 申请入驻

AI6小时破30年数学题!陶哲轩,ChatGPT们望尘莫及

0
分享至



数学被誉为“科学的皇后”,其严谨的逻辑体系和深邃的思维魅力,吸引着一代又一代研究者为之倾倒。在漫长的历史长河中,无数数学家以笔为剑、以脑为刃,在未知的数学疆域中开拓前行。而今,人工智能的崛起为这一古老学科注入了全新活力。近期,HarmonicMath团队研发的AI数学家「亚里士多德」(Aristotle),凭借100%独立思考,成功攻克了困扰数学界30载的埃尔德什问题#124,这一里程碑式的突破,不仅震撼了学术界,更宣告着数学研究正式迈入“人机协同”的新纪元。



埃尔德什
#124:横亘30年的数学“拦路虎”

提及数学界的“难题宝库”,匈牙利数学家保罗·埃尔德什(Erdős Pál)的「问题列表」绝对是绕不开的存在。这些问题难易不一,悬赏金额从几十美元到上万美元不等,但它们的价值早已超越物质层面,成为衡量数学家能力的“试金石”和追逐梦想的“精神图腾”。在这份列表中,第124号问题(Erdős#124)自1995年在《Complete sequences of sets of integer powers》一文中提出后,便如同一座坚固的堡垒,屹立在组合数学领域,让无数研究者望而却步。

要理解埃尔德什#124问题,我们可以用一个通俗的比喻:假设给出k个不小于2的自然数d_i,若将每个数减1后的倒数相加(即∑ 1/(d_i - 1)),结果大于等于1,那么对于任意一个自然数n,能否找到一组数a_i,使得n恰好是这组a_i的和?并且每个a_i用d_i作为基数来表示时,数字只能是0或1。换而言之,这个问题本质上是在探寻:在严苛的规则限制下,任意一个自然数是否都能像二进制数那样,用特定的“0-1组合”来表示,而不受基数大小的影响?

这个看似简单的问题,实则触及了组合数学的核心难点。传统的研究方法始终在最大公约数(gcd)的约束和边界案例的验证上陷入僵局,人类数学家们反复尝试多种思路,却始终无法找到突破口。就在人们以为这个难题还将沉睡更久时,AI数学家「亚里士多德」带来了惊喜。HarmonicMath团队为其量身打造了融合强化学习、蒙特卡洛树搜索与Lean形式化语言的智能架构。当问题输入后,「亚里士多德」仅用6小时便遍历了上亿种证明路径,最终输出了一份100%可验证的完整定理,而通过Lean证明系统进行检验,仅需短短1分钟。

这一成果让数学家鲍里斯·阿列克谢耶夫(Boris Alexeev)赞叹不已,他表示这是AI产出的定理中最令他惊艳的一个。目前,该证明已被上传至GitHub平台(https://github.com/plby/lean-proofs/blob/main/ErdosProblems/Erdos124.md),供全球数学爱好者和研究者参考。值得注意的是,埃尔德什#124问题存在两个版本,此次AI攻克的虽为相对简单的版本,但这丝毫不减其意义——这是人类历史上首次由AI完全独立完成具有重大影响力的数学难题证明。



为何是「亚里士多德」?通用AI的“短板”与专业AI的“优势”

「亚里士多德」的成功,也让人们不禁发问:同为顶尖AI,ChatGPT和Gemini为何在这个问题上铩羽而归?菲尔兹奖得主陶哲轩的分析给出了答案。他指出,据其了解,Gemini和ChatGPT的深度研究功能,均未能找到与埃尔德什#124问题相关的全新、有价值的文献资料。

具体而言,Gemini仅能给出一些基础观察:比如排除数字1后,gcd条件会成为必要条件;它还尝试将问题与康托尔集(Cantor集)的研究,尤其是“Newhouse gap lemma”联系起来,但始终未能挖掘出直接相关的新线索。而ChatGPT则表现出明显的“路径依赖”,大量引用包含「亚里士多德」证明的网页、相关论文及问题页面作为论据,未能提出任何原创性观点。

「亚里士多德」的脱颖而出,关键在于其“专业定位”。与ChatGPT、Gemini这类追求“全能”的通用大语言模型不同,它是为数学研究量身定制的“专项选手”。其核心优势在于融合了数学形式化证明的底层逻辑,能够模拟人类数学家的思维模式,进行严谨的逻辑推理和策略探索,而非简单地对现有信息进行拼接与总结。这种“术业有专攻”的特性,让它在面对需要深度创新的数学难题时,展现出了通用AI难以企及的能力。



陶哲轩视角:AI收割“低垂果实”,照亮数学“暗森林”

作为当代数学界的领军人物,陶哲轩对AI在数学领域的应用有着独到的见解。他在社交平台mathstodon上分享道,数学未解问题呈现出“长尾分布”的特征,而AI的自动化能力恰好擅长处理长尾末端的问题。这意味着,有大量难度适中、可被证明或证伪的问题,因专家数学家数量有限而被长期搁置,这些问题就像是挂在枝头的“低垂果实”,触手可及却无人采摘。

陶哲轩以去年的“Equational Theories Project”为例进行说明:该项目涉及普遍代数中2200万条可能的蕴涵关系,若完全依赖人类研究,可能需要数十年时间。但研究团队从一开始就引入“低技术含量”的自动化工具,短短几天便解决了大部分问题;随后逐步升级技术手段,攻克了一批难点问题;最后剩下的少数“硬骨头”,才由人类数学家耗时数月攻克。这个案例生动地证明,AI在处理海量“低垂果实”类问题时,效率远超人类。

埃尔德什问题网站收录了1108个曾出现在埃尔德什论文中的问题,其中既有E3这样的著名难题,也有大量无人问津的“小问题”,甚至连埃尔德什本人都未曾再度关注。近几周,该网站的“未解”标签减少了近十个,原因并非这些问题刚被解决,而是AI通过文献检索发现它们早已被人类攻克。此外,研究人员还发现了一类因描述存在技术瑕疵而变得容易解决的“低垂果实”,埃尔德什#124便是典型——其完整版本具有一定难度,但两篇相关论文遗漏了关键假设,使得该版本成为“Brown判据”的直接推论,这一漏洞直到「亚里士多德」介入才被发现。

在陶哲轩看来,AI并非要取代人类数学家,而是扮演着“清道夫”与“引路人”的双重角色。它先清理掉那些最容易解决的问题,将真正的核心难题筛选出来,让人类研究者能够将精力聚焦在最具价值的领域。就像一束光照亮了数学的“暗森林”,AI不仅让那些被遗忘的“低垂果实”重见天日,更帮助人类清晰地识别出需要攀登的“数学高峰”。

结语:数学研究的“新范式”已来

HarmonicMath创始人弗拉德·特内夫(Vlad Tenev)感慨道:“数学圈正经历前所未有的变革,‘智能证明’的时代已经到来!”「亚里士多德」攻克埃尔德什#124问题,绝非孤立的成果,而是数学研究范式转变的重要信号——AI与数学的深度融合已成为不可逆转的趋势。

展望未来,我们或将见证更多AI数学家活跃在科研一线,与人类研究者并肩作战,攻克一个又一个数学难题。那些曾经让人类望而生畏的“暗森林”,将在AI的“光照”下逐渐变得清晰;那些沉睡多年的“低垂果实”,将被AI逐一“采摘”。而人类数学家,则能在AI的辅助下,向数学殿堂中那些更巍峨、更神秘的高峰发起冲击。可以肯定的是,AI发现数学的时代,才刚刚拉开序幕。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国男篮集训名单公布,四大惊喜亮点,庞峥麟26岁突破

中国男篮集训名单公布,四大惊喜亮点,庞峥麟26岁突破

逗比演员说体育
2026-02-04 07:01:54
听说老领导出来散步了!

听说老领导出来散步了!

梳子姐
2026-02-02 16:55:43
1983年慈禧内棺被打开的罕见镜头,遗骸已经发黑,牙齿仍然完整

1983年慈禧内棺被打开的罕见镜头,遗骸已经发黑,牙齿仍然完整

谈史论天地
2026-02-03 18:25:46
失业的人越来越多了

失业的人越来越多了

曹多鱼的财经世界
2025-12-24 14:56:20
曝C罗铁心继续罢赛!愿降薪促成第3次效力曼联遭拒,美职联已询价

曝C罗铁心继续罢赛!愿降薪促成第3次效力曼联遭拒,美职联已询价

我爱英超
2026-02-04 06:08:55
烧死萨摩耶的男孩家长凌晨发布道歉又删除,狗主人最新回应

烧死萨摩耶的男孩家长凌晨发布道歉又删除,狗主人最新回应

极目新闻
2026-02-03 14:51:03
当爱泼斯坦“小电影”上热搜时,特朗普夫人纪录片遭遇冰火两重天

当爱泼斯坦“小电影”上热搜时,特朗普夫人纪录片遭遇冰火两重天

新民周刊
2026-02-03 09:08:00
尴尬!曝41岁C罗推进第3次效力曼联+愿降薪 红魔高层回绝:没兴趣

尴尬!曝41岁C罗推进第3次效力曼联+愿降薪 红魔高层回绝:没兴趣

风过乡
2026-02-04 05:44:03
基本锁定胜局后,高市不演了,准备建立“日军”:请大家让我修宪

基本锁定胜局后,高市不演了,准备建立“日军”:请大家让我修宪

创造精彩剧情
2026-02-04 07:25:41
随着利雅得胜利1-0,新月3连平,沙特联最新排名积分榜如下!

随着利雅得胜利1-0,新月3连平,沙特联最新排名积分榜如下!

薇说体育
2026-02-03 16:47:13
588万平方公里!沙俄抢走的中国故土,如今竟成为世界最大荒原

588万平方公里!沙俄抢走的中国故土,如今竟成为世界最大荒原

白色得季节
2025-12-30 21:08:45
罢赛引众怒!英媒狠批C罗:50万镑日薪都没能夺冠,没有自知之明

罢赛引众怒!英媒狠批C罗:50万镑日薪都没能夺冠,没有自知之明

夏侯看英超
2026-02-04 01:30:32
陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

陪玩陪睡不够!集体开嫖、舔手指、目无王法,阴暗面彻底藏不住了

好贤观史记
2025-11-09 21:58:39
买宝瑶:父孙楠闪婚九载终散场,演员梦被继母无情捏碎

买宝瑶:父孙楠闪婚九载终散场,演员梦被继母无情捏碎

不甜的李子
2026-02-03 00:08:39
广东一女子离世一个月前离婚,将3000万元遗产给两个未成年女儿

广东一女子离世一个月前离婚,将3000万元遗产给两个未成年女儿

三农老历
2026-02-04 06:15:12
特朗普终结了两大家族的总统梦

特朗普终结了两大家族的总统梦

文史茶馆2020
2026-01-20 10:56:37
7换4!灰熊重磅大交易!再见了,全明星核心!

7换4!灰熊重磅大交易!再见了,全明星核心!

篮球实战宝典
2026-02-04 04:11:37
30亿核潜艇南海撞废,美军反常没咬中国,背后是被谁逼停了?

30亿核潜艇南海撞废,美军反常没咬中国,背后是被谁逼停了?

近史博览
2026-02-02 20:31:45
黄征辉曾透露:台湾可以回归,但大陆必须答应2个条件,缺一不可

黄征辉曾透露:台湾可以回归,但大陆必须答应2个条件,缺一不可

花寒弦絮
2026-01-19 01:23:58
06年我把卧铺票让给孕妇,自己站了一宿,下车前她递给我一张纸条

06年我把卧铺票让给孕妇,自己站了一宿,下车前她递给我一张纸条

温情邮局
2026-01-27 10:14:26
2026-02-04 08:04:49
魏家东 incentive-icons
魏家东
一个人的营销商学院!
2320文章数 12147关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

美股爆发AI恐慌性抛售 英伟达市值一夜蒸发超8000亿元

头条要闻

美股爆发AI恐慌性抛售 英伟达市值一夜蒸发超8000亿元

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

大S逝世一周年 S家没通知大S子女惹争议

财经要闻

中央一号文件:扎实推进乡村全面振兴

汽车要闻

上汽决定不再等那个“正确答案”了

态度原创

房产
时尚
家居
本地
军事航空

房产要闻

大盘最低杀到8000+/㎡!海口59盘,最新房价曝光!

状态比10年前更好,她到底做对了什么?

家居要闻

极简木艺术 典雅自在

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

军事要闻

特朗普:庞大兵力将很快抵达伊朗

无障碍浏览 进入关怀版