网易首页 > 网易号 > 正文 申请入驻

数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始

0
分享至


新智元报道

编辑:编辑部

【新智元导读】最近,两位研究人员仅用一个周末,便借助GPT-5解决了10个「百年悬案」级的埃尔德什难题。正如数学家陶哲轩所言,AI最有成效的应用是处理查文献等耗时环节,将研究者解放出来专注于思考。这标志着一种全新科研范式的到来,AI正成为重塑基础科学、加速人类接近真理的强大工具。

科学研究,尤其是数学研究,真的要被AI彻底改变了。

两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。

埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。

上一周,前微软副总裁,现OpenAI研究科学家Sebastien Bubeck第一次确认了这件事。


今天,其中的一名的研究人员Mark Sellke最终确认了细节。

他们「问了」GPT-5数千次,就找到了10个未解决的埃尔德什难题的求解方案。

并且GPT-5还在另外11个问题上,发现了显著进展。

这种通过AI查询搜索的研究范式可能彻底改变科学、数学等基础学科的研究方法。


AI已经是数学家的大杀器,如果不用可能就面临出局了。

其中,Bubeck特地提到GPT-5 Pro在文献搜索方面的能力非常强大。

比如在问题339上,GPT-5 Pro经过搜索确认,其实有其他数学家20年前就解决了。

这种深层的文献搜索能力,目前只有AI能够做到。


就连陶哲轩也表示,AI正在改变数学研究。

陶哲轩:「中等能力」的AI是关键

就在最近,陶哲轩连发数条推文表示:

未来AI在数学上的最有成效应用,并不会来自最强大的模型去解最难的问题,而是来自「中等能力」的AI去处理那些琐碎、耗时、但又不可或缺的研究环节。


比如帮数学家查文献、整理笔记、验证引用、归档资料——这些看起来「没技术含量」的工作,恰恰是最适合AI的。

他用来说明和论证这个观点的例子正是开头所描述的埃尔德什难题。


在一个叫Erdős Problems的网站上,收录着上千个以数学家保罗·埃尔德什命名的命题。

其中大约600个被标注为「未解决」。


就在几天前,几位数学志愿者尝试了一个新方法——用AI深度检索工具重新搜索资料,解决Erdős Problems上的数学难题。

AI帮他们扫出一批疑似「已有解」的线索,人工再复核、比对、阅读。

短短几天,6个原本被列为「未解决」的问题被重新标记为「solved」:Problem 339、Problem 494、Problem 621、Problem 822、Problem 903、Problem 1043。


随即,评论区热闹了起来。

有人惊讶:原来这些题早被解决,只是没人找到;也有人开始主动使用同样的工具,继续筛查更多问题。

数学界第一次感受到:AI不一定帮你「解出」什么,但能帮你「发现」被遗忘的答案。

陶哲轩在帖文中评价这一趋势:

AI工具输出不会直接进入网站,而是由人工复核后更新。但过去几天评论区明显活跃了,出现了更多带文献链接的注释,说明很多发现确实是AI辅助完成的。

陶哲轩本人在Github上也维护了一个Erdős Problems埃尔德什问题数据库。

截止发稿前2个小时,陶哲轩才刚刚更新了数据库。


这些问题中有些还有悬赏金。


比如悬赏10000美元的数论题。

这道题目已经2001年被Baker,Harman和Pintz解决。

然后在2025年9月28日正式确认,大概率就是在AI的帮助下找到的。



其他埃尔德什难题速览

比如上面提到的问题339,GPT-5 Pro直接从浩如烟海的论文里找到了「答案」。

就是2003年发布的一篇论文。


问题621是一道图论。


问题822为数论。


问题903是组合数学。


其他未解决的问题,有些还有悬赏金额。

如果你稍微懂点数学,也可以用GPT-5试着搜索一下。


以上这些难题,绝大部分问题可能已经在浩如烟海的论文中被前人解决了。

但在AI出现前,想通过人力来查遍所有论文是不现实的。

从查文献开始,AI正悄悄重塑数学研究

在数学研究里,查文献一直是最让人头疼的环节之一。

如果问题有清晰的名字、固定的研究圈子,那还好。随便搜一篇关键论文,顺着引用链往前往后查,就能很快摸清全貌。

可很多问题压根没有标准名称。

有的埋在几十年前的期刊里,有的藏在不同学派、不同语言的论文中,还有的被研究者「顺带提了一嘴」,但没出现在标题里。

陶哲轩说,这时候用传统方法,就像在大海捞针。

哪怕你是专家,也得一篇篇点开、反复确认。有时花几天功夫,才发现看错了方向。

AI则能跨语义、跨领域地扫描大规模文献,用自然语言理解去捕捉相似概念。

比如输入一个模糊的研究方向,AI就能自动联想到各种近义的表达、不同领域的说法,从而找到那些人类肉眼容易忽略的论文

当然,陶哲轩也提醒:AI查文献并不需要「完美命中」。


但只要在同样的时间里,能找到更多有用的线索、减少无效命中,它就已经赢了。

而且学者在学会使用之后,投入的时间成本会被多次使用「平摊」,越用越值。

在他看来,这种模式的意义不止是提效。它其实在重构科研的节奏:

AI的成功率不必是100%,它只要比传统方法更高,就能带来真正的生产力提升。

在传统科研里,当研究者查遍资料、却一无所获时,这个过程通常不会写进论文。

毕竟,没人会在结论里说「我什么都没找到」。


一方面是担心被误会成「没查仔细」;另一方面,是因为学术写作习惯于只报告「成功」的结果。

但这样一来,同一个「无结果」的搜索,可能会被不同的人重复几十遍。

陶哲轩在帖子最后写道:AI的系统化搜索,可能改变这种状况。

因为当机器以同样的标准批量检索上百个问题时,「没查到」也变成了可量化的数据。

例如,可以公开地写:在36个问题中, 24个找到了额外文献, 12个没有。这样的结果更透明,也能更准确反映已有文献的分布。

AI不仅帮人找到答案,也让「没有答案」成为有价值的发现。

它让科研流程第一次具备了信息闭环:正向结果指向进步,反向结果避免浪费。

这或许才是AI带来的真正文化变革,它让科学回到它最朴素的样子——诚实地呈现事实,不论好坏。

陶哲轩这一连串思考,看似在谈AI,其实是在谈「人类如何重新组织知识」。

AI不会创造真理,而是在于让人类更快地接近真理。

它让重复劳动变得可控,让查不到结果也能成为信息;它不是研究者的竞争者,而是科研世界里第一个真正的时间节省器。

它让数学家不再被搜索、整理、验证这些繁琐工作拖住,而是能把注意力重新放回那件最重要的事——思考。

或许未来我们回望这一刻,会发现:人工智能没有改变数学的本质,它只是让数学回到了它该有的速度。

参考资料:HXl

https://mathstodon.xyz/@tao/115385022005130505

https://x.com/MarkSellke/status/1979226538059931886


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

年薪50万遭妻子嫌弃后续:丈夫身份曝光,工资全上交,挨骂是日常

单手搓核弹
2026-01-06 13:44:21
短剧演员吐槽剧组让婴儿一直淋雨:“孩子被雨淋了好久,哭得撕心裂肺”,据悉该场戏婴儿片酬仅800元

短剧演员吐槽剧组让婴儿一直淋雨:“孩子被雨淋了好久,哭得撕心裂肺”,据悉该场戏婴儿片酬仅800元

扬子晚报
2026-01-18 16:13:30
贾国龙没懂,预制菜不是最伤西贝的

贾国龙没懂,预制菜不是最伤西贝的

东针商略
2026-01-16 22:43:33
贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

削桐作琴
2025-12-26 23:57:15
缅甸外交部:此行为属于干涉缅甸内政,我们强烈反对与谴责

缅甸外交部:此行为属于干涉缅甸内政,我们强烈反对与谴责

缅甸中文网
2026-01-18 13:39:49
伊朗最高领袖:美国和以色列是伊朗暴力事件幕后黑手

伊朗最高领袖:美国和以色列是伊朗暴力事件幕后黑手

环球网资讯
2026-01-19 07:20:36
神仙木有她美丽,黑丝哪有白衬衫性感

神仙木有她美丽,黑丝哪有白衬衫性感

贵圈真乱
2025-12-12 12:12:10
今天才知道,高铁的无座票并不是站票,买无座票不要再傻乎乎站着了

今天才知道,高铁的无座票并不是站票,买无座票不要再傻乎乎站着了

美食格物
2026-01-17 04:54:14
再爆发!王俊杰上半场三分4中4狂轰15分 下半场0出手折返跑

再爆发!王俊杰上半场三分4中4狂轰15分 下半场0出手折返跑

醉卧浮生
2026-01-19 09:52:59
吴冠希:自从格兰主帅上任之后,新疆正朝着正确的方向发展

吴冠希:自从格兰主帅上任之后,新疆正朝着正确的方向发展

懂球帝
2026-01-18 23:19:27
江西杀猪宴跟风翻车,百桌宴席涌来五万人,镇政府回应没人掀桌子

江西杀猪宴跟风翻车,百桌宴席涌来五万人,镇政府回应没人掀桌子

揽星河的笔记
2026-01-18 22:21:51
4换1!锡安加盟!勇士疯了

4换1!锡安加盟!勇士疯了

逗比演员说体育
2026-01-19 01:16:16
刚刚 | 神舟二十号飞船返回舱成功着陆!

刚刚 | 神舟二十号飞船返回舱成功着陆!

天津广播
2026-01-19 09:52:51
77岁梁小龙瘦到皮包骨不足80斤 面容枯槁脸色蜡黄4号还外出吃烧鹅

77岁梁小龙瘦到皮包骨不足80斤 面容枯槁脸色蜡黄4号还外出吃烧鹅

乐悠悠娱乐
2026-01-19 09:52:36
范巴斯滕:接下来几个月我将放下工作,全身心去陪护重病妻子

范巴斯滕:接下来几个月我将放下工作,全身心去陪护重病妻子

懂球帝
2026-01-17 08:03:11
项立刚反对学英语,送儿子去美国留学咋说?这是骗谁呢?

项立刚反对学英语,送儿子去美国留学咋说?这是骗谁呢?

读鬼笔记
2026-01-17 20:01:04
李湘担心的事发生了!她最大遗憾,恐怕就是王诗龄了

李湘担心的事发生了!她最大遗憾,恐怕就是王诗龄了

花漾夜雨飘雪
2026-01-19 05:33:54
BBA,势败如山倒

BBA,势败如山倒

虎嗅APP
2026-01-18 01:54:26
马杜罗之子回忆美军突袭当晚:父亲看到我的来电 直接挂断

马杜罗之子回忆美军突袭当晚:父亲看到我的来电 直接挂断

极目新闻
2026-01-18 16:26:02
权力的诱惑:卡德罗夫的传承豪赌崩了?这出车臣大戏到底谁在操盘

权力的诱惑:卡德罗夫的传承豪赌崩了?这出车臣大戏到底谁在操盘

形上谓道
2026-01-18 20:13:43
2026-01-19 10:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14359文章数 66513关注度
往期回顾 全部

科技要闻

编程从此不再有门槛!Claude Code火爆出圈

头条要闻

牛弹琴:英国人心在滴血 就派了1个兵被加征10%关税

头条要闻

牛弹琴:英国人心在滴血 就派了1个兵被加征10%关税

体育要闻

21年后,中国男足重返亚洲四强

娱乐要闻

香港武打演员梁小龙去世:享年77

财经要闻

厂家铤而走险 含毒农药逃避市场监管?

汽车要闻

又一次闷声干大事,奇瑞进入2.0 AI+时代

态度原创

家居
房产
健康
旅游
数码

家居要闻

岁月柔情 现代品质轻奢

房产要闻

真四代来了!这次,海口楼市将彻底颠覆!

血常规3项异常,是身体警报!

旅游要闻

“滇南侨乡”夜色新 马帮古城引客来

数码要闻

DDR5内存价格自去年7月以来暴涨逾四倍

无障碍浏览 进入关怀版