网易首页 > 网易号 > 正文 申请入驻

数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始

0
分享至


新智元报道

编辑:编辑部

【新智元导读】最近,两位研究人员仅用一个周末,便借助GPT-5解决了10个「百年悬案」级的埃尔德什难题。正如数学家陶哲轩所言,AI最有成效的应用是处理查文献等耗时环节,将研究者解放出来专注于思考。这标志着一种全新科研范式的到来,AI正成为重塑基础科学、加速人类接近真理的强大工具。

科学研究,尤其是数学研究,真的要被AI彻底改变了。

两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。

埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。

上一周,前微软副总裁,现OpenAI研究科学家Sebastien Bubeck第一次确认了这件事。


今天,其中的一名的研究人员Mark Sellke最终确认了细节。

他们「问了」GPT-5数千次,就找到了10个未解决的埃尔德什难题的求解方案。

并且GPT-5还在另外11个问题上,发现了显著进展。

这种通过AI查询搜索的研究范式可能彻底改变科学、数学等基础学科的研究方法。


AI已经是数学家的大杀器,如果不用可能就面临出局了。

其中,Bubeck特地提到GPT-5 Pro在文献搜索方面的能力非常强大。

比如在问题339上,GPT-5 Pro经过搜索确认,其实有其他数学家20年前就解决了。

这种深层的文献搜索能力,目前只有AI能够做到。


就连陶哲轩也表示,AI正在改变数学研究。

陶哲轩:「中等能力」的AI是关键

就在最近,陶哲轩连发数条推文表示:

未来AI在数学上的最有成效应用,并不会来自最强大的模型去解最难的问题,而是来自「中等能力」的AI去处理那些琐碎、耗时、但又不可或缺的研究环节。


比如帮数学家查文献、整理笔记、验证引用、归档资料——这些看起来「没技术含量」的工作,恰恰是最适合AI的。

他用来说明和论证这个观点的例子正是开头所描述的埃尔德什难题。


在一个叫Erdős Problems的网站上,收录着上千个以数学家保罗·埃尔德什命名的命题。

其中大约600个被标注为「未解决」。


就在几天前,几位数学志愿者尝试了一个新方法——用AI深度检索工具重新搜索资料,解决Erdős Problems上的数学难题。

AI帮他们扫出一批疑似「已有解」的线索,人工再复核、比对、阅读。

短短几天,6个原本被列为「未解决」的问题被重新标记为「solved」:Problem 339、Problem 494、Problem 621、Problem 822、Problem 903、Problem 1043。


随即,评论区热闹了起来。

有人惊讶:原来这些题早被解决,只是没人找到;也有人开始主动使用同样的工具,继续筛查更多问题。

数学界第一次感受到:AI不一定帮你「解出」什么,但能帮你「发现」被遗忘的答案。

陶哲轩在帖文中评价这一趋势:

AI工具输出不会直接进入网站,而是由人工复核后更新。但过去几天评论区明显活跃了,出现了更多带文献链接的注释,说明很多发现确实是AI辅助完成的。

陶哲轩本人在Github上也维护了一个Erdős Problems埃尔德什问题数据库。

截止发稿前2个小时,陶哲轩才刚刚更新了数据库。


这些问题中有些还有悬赏金。


比如悬赏10000美元的数论题。

这道题目已经2001年被Baker,Harman和Pintz解决。

然后在2025年9月28日正式确认,大概率就是在AI的帮助下找到的。



其他埃尔德什难题速览

比如上面提到的问题339,GPT-5 Pro直接从浩如烟海的论文里找到了「答案」。

就是2003年发布的一篇论文。


问题621是一道图论。


问题822为数论。


问题903是组合数学。


其他未解决的问题,有些还有悬赏金额。

如果你稍微懂点数学,也可以用GPT-5试着搜索一下。


以上这些难题,绝大部分问题可能已经在浩如烟海的论文中被前人解决了。

但在AI出现前,想通过人力来查遍所有论文是不现实的。

从查文献开始,AI正悄悄重塑数学研究

在数学研究里,查文献一直是最让人头疼的环节之一。

如果问题有清晰的名字、固定的研究圈子,那还好。随便搜一篇关键论文,顺着引用链往前往后查,就能很快摸清全貌。

可很多问题压根没有标准名称。

有的埋在几十年前的期刊里,有的藏在不同学派、不同语言的论文中,还有的被研究者「顺带提了一嘴」,但没出现在标题里。

陶哲轩说,这时候用传统方法,就像在大海捞针。

哪怕你是专家,也得一篇篇点开、反复确认。有时花几天功夫,才发现看错了方向。

AI则能跨语义、跨领域地扫描大规模文献,用自然语言理解去捕捉相似概念。

比如输入一个模糊的研究方向,AI就能自动联想到各种近义的表达、不同领域的说法,从而找到那些人类肉眼容易忽略的论文

当然,陶哲轩也提醒:AI查文献并不需要「完美命中」。


但只要在同样的时间里,能找到更多有用的线索、减少无效命中,它就已经赢了。

而且学者在学会使用之后,投入的时间成本会被多次使用「平摊」,越用越值。

在他看来,这种模式的意义不止是提效。它其实在重构科研的节奏:

AI的成功率不必是100%,它只要比传统方法更高,就能带来真正的生产力提升。

在传统科研里,当研究者查遍资料、却一无所获时,这个过程通常不会写进论文。

毕竟,没人会在结论里说「我什么都没找到」。


一方面是担心被误会成「没查仔细」;另一方面,是因为学术写作习惯于只报告「成功」的结果。

但这样一来,同一个「无结果」的搜索,可能会被不同的人重复几十遍。

陶哲轩在帖子最后写道:AI的系统化搜索,可能改变这种状况。

因为当机器以同样的标准批量检索上百个问题时,「没查到」也变成了可量化的数据。

例如,可以公开地写:在36个问题中, 24个找到了额外文献, 12个没有。这样的结果更透明,也能更准确反映已有文献的分布。

AI不仅帮人找到答案,也让「没有答案」成为有价值的发现。

它让科研流程第一次具备了信息闭环:正向结果指向进步,反向结果避免浪费。

这或许才是AI带来的真正文化变革,它让科学回到它最朴素的样子——诚实地呈现事实,不论好坏。

陶哲轩这一连串思考,看似在谈AI,其实是在谈「人类如何重新组织知识」。

AI不会创造真理,而是在于让人类更快地接近真理。

它让重复劳动变得可控,让查不到结果也能成为信息;它不是研究者的竞争者,而是科研世界里第一个真正的时间节省器。

它让数学家不再被搜索、整理、验证这些繁琐工作拖住,而是能把注意力重新放回那件最重要的事——思考。

或许未来我们回望这一刻,会发现:人工智能没有改变数学的本质,它只是让数学回到了它该有的速度。

参考资料:HXl

https://mathstodon.xyz/@tao/115385022005130505

https://x.com/MarkSellke/status/1979226538059931886


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
21岁美国网红收入破亿美元,三年逆袭超越NBA巨星詹姆斯年薪!

21岁美国网红收入破亿美元,三年逆袭超越NBA巨星詹姆斯年薪!

田先生篮球
2026-03-05 08:52:25
俄罗斯被曝向伊朗提供情报,包括美军舰船和飞机的定位,白宫回应!美国准备部署第三艘航母,紧急批准对以色列超1.5亿美元军售

俄罗斯被曝向伊朗提供情报,包括美军舰船和飞机的定位,白宫回应!美国准备部署第三艘航母,紧急批准对以色列超1.5亿美元军售

每日经济新闻
2026-03-07 13:18:09
全球首个、一周一次注射可控血糖,该创新药率先在中国上市

全球首个、一周一次注射可控血糖,该创新药率先在中国上市

南方都市报
2026-03-06 19:58:10
纪实:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长很后怕

纪实:浙江幼师幼儿园潜伏22年,警察曝光真实身份,家长很后怕

谈史论天地
2026-03-01 09:49:38
美国恨透了中国北斗,为啥却不敢碰信号分毫?美方究竟在怕什么?

美国恨透了中国北斗,为啥却不敢碰信号分毫?美方究竟在怕什么?

壹知眠羊
2026-03-07 07:25:35
郑智:浙江队一直是中超劲旅,希望双方能打出一场精彩的比赛

郑智:浙江队一直是中超劲旅,希望双方能打出一场精彩的比赛

懂球帝
2026-03-07 20:03:36
美军准备发起“灭国大轰炸”,9千万伊朗人进入最艰难时刻

美军准备发起“灭国大轰炸”,9千万伊朗人进入最艰难时刻

别人都叫我阿腈
2026-03-06 20:51:16
强强对话惨败39分,约基奇38+8+5吞耻辱纪录!伤病成争冠最大阻碍

强强对话惨败39分,约基奇38+8+5吞耻辱纪录!伤病成争冠最大阻碍

锅子篮球
2026-03-07 15:23:33
越扒瓜越大!鲁山舅舅与亡姐结婚再添猛料,远不止吃绝户这么简单

越扒瓜越大!鲁山舅舅与亡姐结婚再添猛料,远不止吃绝户这么简单

梦史
2026-03-07 09:26:14
小玥儿没想到,刚生下孩子不到一周的马筱梅,没给自己的母亲大S留一丝“体面”

小玥儿没想到,刚生下孩子不到一周的马筱梅,没给自己的母亲大S留一丝“体面”

不八卦掌门人
2026-03-06 16:18:22
央视怒批,目不识丁、洋相百出,难怪两会上冯远征建议演员多学习

央视怒批,目不识丁、洋相百出,难怪两会上冯远征建议演员多学习

仙味少女心
2026-03-05 17:30:43
图多尔可能破纪录?英超历史最短命主帅:阿勒代斯30天下课第1

图多尔可能破纪录?英超历史最短命主帅:阿勒代斯30天下课第1

懂球帝
2026-03-07 12:37:07
人民日报怒批全国最清闲机关事业单位,基层员工看到名单直呼痛快

人民日报怒批全国最清闲机关事业单位,基层员工看到名单直呼痛快

三农老历
2026-03-07 15:21:33
奇耻大辱!怕被斩首,哈梅内伊葬礼突然宣布延期,具体日期未定

奇耻大辱!怕被斩首,哈梅内伊葬礼突然宣布延期,具体日期未定

深度报
2026-03-06 21:07:20
“伊朗女足回国无异于死亡?”外媒呼吁国际社会给予球队庇护

“伊朗女足回国无异于死亡?”外媒呼吁国际社会给予球队庇护

砚底沉香
2026-03-07 11:19:18
一旦中美开战,第一天会发生什么?美智库被兵推结果惊出一身汗

一旦中美开战,第一天会发生什么?美智库被兵推结果惊出一身汗

星星没有你亮
2026-02-07 02:24:58
公开露面,重回国乒?刘国梁公开发声,新身份曝光,布局国乒男队

公开露面,重回国乒?刘国梁公开发声,新身份曝光,布局国乒男队

阿衃体育
2026-03-07 17:48:34
西方战略专家感叹:中国是全世界,唯一强得悄无声息的超级大国!

西方战略专家感叹:中国是全世界,唯一强得悄无声息的超级大国!

勇士军武闲谈
2026-03-05 11:20:31
全国人大代表、58同城董事长兼CEO姚劲波:建议新购住房的贷款利息纳入个税专项附加扣除项目,建立“好房子”披露制度|两会声音

全国人大代表、58同城董事长兼CEO姚劲波:建议新购住房的贷款利息纳入个税专项附加扣除项目,建立“好房子”披露制度|两会声音

华夏时报
2026-03-06 19:11:10
印度:同意伊朗请求!

印度:同意伊朗请求!

每日经济新闻
2026-03-07 16:05:05
2026-03-08 01:47:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14662文章数 66667关注度
往期回顾 全部

科技要闻

OpenClaw爆火,六位"养虾人"自述与AI共生

头条要闻

选举24小时内举行 伊朗今天或选出最高领袖

头条要闻

选举24小时内举行 伊朗今天或选出最高领袖

体育要闻

塔图姆298天走完这段路 只用27分钟征服这座城

娱乐要闻

汪小菲曝亲妈猛料,张兰公开财产分配

财经要闻

针对"不敢休、不让休"怪圈 国家出手了

汽车要闻

逃离ICU,上汽通用“止血”企稳

态度原创

数码
艺术
房产
教育
公开课

数码要闻

英特尔 Core Ultra 3 “Panther Lake-H” 结构细节曝光

艺术要闻

1.61亿天价!陈丹青的《牧羊人》如何震撼艺术界?

房产要闻

传统学区房熄火?2月海口二手房爆火的板块竟然是…

教育要闻

初中三年悄悄筛人,输的常常不是脑子

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版