网易首页 > 网易号 > 正文 申请入驻

数学界地震!GPT-5连破10道「百年悬案」,陶哲轩:AI革命才刚开始

0
分享至


新智元报道

编辑:编辑部

【新智元导读】最近,两位研究人员仅用一个周末,便借助GPT-5解决了10个「百年悬案」级的埃尔德什难题。正如数学家陶哲轩所言,AI最有成效的应用是处理查文献等耗时环节,将研究者解放出来专注于思考。这标志着一种全新科研范式的到来,AI正成为重塑基础科学、加速人类接近真理的强大工具。

科学研究,尤其是数学研究,真的要被AI彻底改变了。

两位数学研究人员,利用GPT-5,只用一个周末就解决了10个「百年悬案」级的埃尔德什难题。

埃尔德什难题,又名为Erdös problems,是数学家埃尔德什生前留下的大约1000多个问题,此前人类只解决了部分。

上一周,前微软副总裁,现OpenAI研究科学家Sebastien Bubeck第一次确认了这件事。


今天,其中的一名的研究人员Mark Sellke最终确认了细节。

他们「问了」GPT-5数千次,就找到了10个未解决的埃尔德什难题的求解方案。

并且GPT-5还在另外11个问题上,发现了显著进展。

这种通过AI查询搜索的研究范式可能彻底改变科学、数学等基础学科的研究方法。


AI已经是数学家的大杀器,如果不用可能就面临出局了。

其中,Bubeck特地提到GPT-5 Pro在文献搜索方面的能力非常强大。

比如在问题339上,GPT-5 Pro经过搜索确认,其实有其他数学家20年前就解决了。

这种深层的文献搜索能力,目前只有AI能够做到。


就连陶哲轩也表示,AI正在改变数学研究。

陶哲轩:「中等能力」的AI是关键

就在最近,陶哲轩连发数条推文表示:

未来AI在数学上的最有成效应用,并不会来自最强大的模型去解最难的问题,而是来自「中等能力」的AI去处理那些琐碎、耗时、但又不可或缺的研究环节。


比如帮数学家查文献、整理笔记、验证引用、归档资料——这些看起来「没技术含量」的工作,恰恰是最适合AI的。

他用来说明和论证这个观点的例子正是开头所描述的埃尔德什难题。


在一个叫Erdős Problems的网站上,收录着上千个以数学家保罗·埃尔德什命名的命题。

其中大约600个被标注为「未解决」。


就在几天前,几位数学志愿者尝试了一个新方法——用AI深度检索工具重新搜索资料,解决Erdős Problems上的数学难题。

AI帮他们扫出一批疑似「已有解」的线索,人工再复核、比对、阅读。

短短几天,6个原本被列为「未解决」的问题被重新标记为「solved」:Problem 339、Problem 494、Problem 621、Problem 822、Problem 903、Problem 1043。


随即,评论区热闹了起来。

有人惊讶:原来这些题早被解决,只是没人找到;也有人开始主动使用同样的工具,继续筛查更多问题。

数学界第一次感受到:AI不一定帮你「解出」什么,但能帮你「发现」被遗忘的答案。

陶哲轩在帖文中评价这一趋势:

AI工具输出不会直接进入网站,而是由人工复核后更新。但过去几天评论区明显活跃了,出现了更多带文献链接的注释,说明很多发现确实是AI辅助完成的。

陶哲轩本人在Github上也维护了一个Erdős Problems埃尔德什问题数据库。

截止发稿前2个小时,陶哲轩才刚刚更新了数据库。


这些问题中有些还有悬赏金。


比如悬赏10000美元的数论题。

这道题目已经2001年被Baker,Harman和Pintz解决。

然后在2025年9月28日正式确认,大概率就是在AI的帮助下找到的。



其他埃尔德什难题速览

比如上面提到的问题339,GPT-5 Pro直接从浩如烟海的论文里找到了「答案」。

就是2003年发布的一篇论文。


问题621是一道图论。


问题822为数论。


问题903是组合数学。


其他未解决的问题,有些还有悬赏金额。

如果你稍微懂点数学,也可以用GPT-5试着搜索一下。


以上这些难题,绝大部分问题可能已经在浩如烟海的论文中被前人解决了。

但在AI出现前,想通过人力来查遍所有论文是不现实的。

从查文献开始,AI正悄悄重塑数学研究

在数学研究里,查文献一直是最让人头疼的环节之一。

如果问题有清晰的名字、固定的研究圈子,那还好。随便搜一篇关键论文,顺着引用链往前往后查,就能很快摸清全貌。

可很多问题压根没有标准名称。

有的埋在几十年前的期刊里,有的藏在不同学派、不同语言的论文中,还有的被研究者「顺带提了一嘴」,但没出现在标题里。

陶哲轩说,这时候用传统方法,就像在大海捞针。

哪怕你是专家,也得一篇篇点开、反复确认。有时花几天功夫,才发现看错了方向。

AI则能跨语义、跨领域地扫描大规模文献,用自然语言理解去捕捉相似概念。

比如输入一个模糊的研究方向,AI就能自动联想到各种近义的表达、不同领域的说法,从而找到那些人类肉眼容易忽略的论文

当然,陶哲轩也提醒:AI查文献并不需要「完美命中」。


但只要在同样的时间里,能找到更多有用的线索、减少无效命中,它就已经赢了。

而且学者在学会使用之后,投入的时间成本会被多次使用「平摊」,越用越值。

在他看来,这种模式的意义不止是提效。它其实在重构科研的节奏:

AI的成功率不必是100%,它只要比传统方法更高,就能带来真正的生产力提升。

在传统科研里,当研究者查遍资料、却一无所获时,这个过程通常不会写进论文。

毕竟,没人会在结论里说「我什么都没找到」。


一方面是担心被误会成「没查仔细」;另一方面,是因为学术写作习惯于只报告「成功」的结果。

但这样一来,同一个「无结果」的搜索,可能会被不同的人重复几十遍。

陶哲轩在帖子最后写道:AI的系统化搜索,可能改变这种状况。

因为当机器以同样的标准批量检索上百个问题时,「没查到」也变成了可量化的数据。

例如,可以公开地写:在36个问题中, 24个找到了额外文献, 12个没有。这样的结果更透明,也能更准确反映已有文献的分布。

AI不仅帮人找到答案,也让「没有答案」成为有价值的发现。

它让科研流程第一次具备了信息闭环:正向结果指向进步,反向结果避免浪费。

这或许才是AI带来的真正文化变革,它让科学回到它最朴素的样子——诚实地呈现事实,不论好坏。

陶哲轩这一连串思考,看似在谈AI,其实是在谈「人类如何重新组织知识」。

AI不会创造真理,而是在于让人类更快地接近真理。

它让重复劳动变得可控,让查不到结果也能成为信息;它不是研究者的竞争者,而是科研世界里第一个真正的时间节省器。

它让数学家不再被搜索、整理、验证这些繁琐工作拖住,而是能把注意力重新放回那件最重要的事——思考。

或许未来我们回望这一刻,会发现:人工智能没有改变数学的本质,它只是让数学回到了它该有的速度。

参考资料:HXl

https://mathstodon.xyz/@tao/115385022005130505

https://x.com/MarkSellke/status/1979226538059931886


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
布达诺夫亲自指挥,乌克兰又“定点清除”!追捕战争罪犯正在行动

布达诺夫亲自指挥,乌克兰又“定点清除”!追捕战争罪犯正在行动

鹰眼Defence
2025-11-02 16:09:07
十大将里谁能让57位上将全服?

十大将里谁能让57位上将全服?

梨花头
2025-11-02 14:45:47
安世中国凌晨发布公告:不存在违约行为,荷兰安世欠付ATGD货款高达10亿元人民币

安世中国凌晨发布公告:不存在违约行为,荷兰安世欠付ATGD货款高达10亿元人民币

极目新闻
2025-11-02 09:27:59
三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

封面新闻
2025-11-02 12:57:02
演员金靖否认“背刺李佳琦”:我从来没有删过他任何东西,此前网传金靖“删除与李佳琦相关内容”引发“背刺”猜测

演员金靖否认“背刺李佳琦”:我从来没有删过他任何东西,此前网传金靖“删除与李佳琦相关内容”引发“背刺”猜测

极目新闻
2025-11-02 22:39:12
老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老嘪科普
2025-10-23 19:21:38
天呐!巩俐这身材太惊艳了,胸围几乎到肚脐,状态却依旧十分亮眼

天呐!巩俐这身材太惊艳了,胸围几乎到肚脐,状态却依旧十分亮眼

TVB的四小花
2025-10-22 02:25:03
心疼!4岁娃打一针没了,妈妈哭晕倒,涉事人已被抓,官方已介入

心疼!4岁娃打一针没了,妈妈哭晕倒,涉事人已被抓,官方已介入

观察鉴娱
2025-11-01 18:31:25
傻了吧?台积电南京厂用大陆高额利润补贴海外工厂,这下跳不起了

傻了吧?台积电南京厂用大陆高额利润补贴海外工厂,这下跳不起了

豆腐脑观察局
2025-10-29 21:45:03
江苏8位同学宴请恩师,点了24道美食6瓶茅台,结账时集体“破防”

江苏8位同学宴请恩师,点了24道美食6瓶茅台,结账时集体“破防”

小蜜情感说
2025-11-02 11:59:32
数万亿美元“放水救市”,美联储降息冲击中国,资产异动超出预期

数万亿美元“放水救市”,美联储降息冲击中国,资产异动超出预期

叮当当科技
2025-11-02 00:04:38
静待官宣:瓦科签约27赛季!崔康熙团队起作用?泰山助教:祝福他

静待官宣:瓦科签约27赛季!崔康熙团队起作用?泰山助教:祝福他

建哥说体育
2025-11-02 07:53:58
捏蛋女已社死:正脸曝光面目狰狞,工作单位被扒,一家都是狠角色

捏蛋女已社死:正脸曝光面目狰狞,工作单位被扒,一家都是狠角色

吃瓜盟主
2025-08-30 15:53:04
奥迪E5 Sportback在华发布 首用字母标识替代四环车标

奥迪E5 Sportback在华发布 首用字母标识替代四环车标

墨谈科技
2025-11-02 22:38:51
这是吴石将军牺牲时的真实照片,绳子绕颈,害怕他临刑时大喊口号

这是吴石将军牺牲时的真实照片,绳子绕颈,害怕他临刑时大喊口号

大国纪录
2025-10-30 09:56:59
警惕!某地学校出现暴发疫情,疾控提醒:科学预防这样做更有效!

警惕!某地学校出现暴发疫情,疾控提醒:科学预防这样做更有效!

成都龙泉教育
2025-11-02 14:05:23
看完获奖短片《苍蝇一分钟的人生》,我撕碎了自己的人生清单

看完获奖短片《苍蝇一分钟的人生》,我撕碎了自己的人生清单

洞见
2025-10-20 22:37:17
不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

不顾央视警告顶风作案,与刘涛传出绯闻的杨烁,究竟是谁给的底气

芳芳历史烩
2025-09-24 20:13:19
1场6-3后,斯诺克第5席32强诞生!白雨露创纪录,周跃龙丢赛点!

1场6-3后,斯诺克第5席32强诞生!白雨露创纪录,周跃龙丢赛点!

刘姚尧的文字城堡
2025-11-02 13:04:08
来了,曼城!8000万顶级“节拍器”空降!1.3亿重建“右路走廊”

来了,曼城!8000万顶级“节拍器”空降!1.3亿重建“右路走廊”

头狼追球
2025-11-01 17:17:00
2025-11-02 23:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13769文章数 66236关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

多名教师称被欠薪欠缴社保 数千万学费被填房地产窟窿

头条要闻

多名教师称被欠薪欠缴社保 数千万学费被填房地产窟窿

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

房产
亲子
艺术
公开课
军事航空

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

亲子要闻

别再逼孩子卷了!每一个生命都是奇迹

艺术要闻

Rob van Hoek:荷兰浪漫田园风光画家

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版