网易首页 > 网易号 > 正文 申请入驻

AI又要颠覆数学?陶哲轩紧急发声:停止造神!

0
分享至


文章转载于新智元

你可能刷到过这种极具煽动性的新闻标题:「AI完全自主解决了人类五十年未解的数学难题!数学家要失业了!」

对于渴望见证AGI诞生的人来说,这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言,这仿佛是最后堡垒陷落的警报。

随着这些文章的影响力越来越大,终于有人坐不住了,出手降温。

有趣的是,这个人正是AI数学研究最积极的推动者之一——陶哲轩。

陶哲轩并没有否定AI的数学研究能力,他只是想把水温调回现实。

就在今天凌晨,陶哲轩发帖称,AI解决数学问题的能力被断章取义地夸大了。


他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。

他强调外界对AI解决Erdős问题的解读很容易过度,尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。

陶哲轩到底在澄清什么?AI在Erdős问题上究竟做到了什么程度?

1

陶哲轩的深夜辟谣

首先要说的是,陶哲轩并不是否认AI在数学上的进步。

他否认的主要是一种偷懒叙事:把「AI在某些问题上能产出可验证结果」,偷换成「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示,看AI在Erdős问题上的成绩单时,千万别只盯着「解了多少题」,还特别注意下面几点:

  • 题目难度差得离谱,「解题数」不能直接比:Erdős问题的难度跨度非常夸张,一端是公认超级硬核的核心难题,另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」,更适合当前AI工具发挥。问题是:你很难在不做专家级文献梳理的前提下,提前判断一题属于哪一类。所以,拿「谁解得多」来PK,很可能不是同一难度段的对比。

  • 很多题目「是否未解」本身就不确定:网站上不少问题缺少系统文献回顾,因此「Open」(未解)这个标签往往只是暂定。AI解出一题后,大家往往很快发现——原来文献里早有人解过(可能方法略不同)。这会让「AI首解」的叙事非常容易翻车。

  • 我们看到的多是成功案例,失败被隐藏了:网站对AI工具的记录并不完整,尤其对没进展、失败尝试的记录更少。

  • 有些题目原始表述有误,可能被「钻字面漏洞」解掉:极少数情况下,Erdős的题目表述可能不严谨甚至有误,要还原本意,往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。

  • 数学价值不只在答案,更在「连接知识网络」:数学的意义不只是证明成立,还在于这件事对相关领域有什么启发?和已有理论怎么挂钩?有哪些可迁移的方法?人类写证明时,往往会自然补上这些旁白:背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕,结果可能技术上对,但对数学共同体的可用价值更低。

  • 解出冷门长尾题,不等于够格投顶级期刊:不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时,更未必能进好期刊。

  • 把AI生成的证明形式化到Lean这类证明助手里,是提高可信度的好办法,但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱啰嗦得异常时,更要警惕。

简单来说,陶哲轩认为AI在Erdős问题上的进展值得关注,但真正要看的是题目的难度层级、文献核查、题意还原、知识融入,以及验证链条是否扎实等更多维度的指标。

AI能做出成果不等于AI已具备完整数学能力。


1

AI不是数学家 而是工具链的一环

那现实里,AI到底做了什么?

陶哲轩的这份GitHub页面把AI贡献分成了多个类别。

有AI生成了完整(或部分)解答,有AI以为题目未解、结果发现文献早就解过的案例,有AI参与文献检索,有AI把证明形式化到 Lean,有AI帮人类重写既有论证,等等。

例如,页面列出 在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答(Lean验证), 在1月8-10日也获得完整解答(Lean验证)。

这意味着在某些题型、某些难度区间,AI确实能做出「可运行的证明结构」,甚至进入形式化验证流程。


有些问题完全由AI解决,但后来才发现,有人早就解决了。


陶哲轩还专门列了「AI-powered literature review(AI驱动的文献回顾)」一类:AI被用来搜索是否已有结果、是否存在误判Open的情况。


1

人类仍然是主角

如果仅凭几个孤例就认为「AI数学无敌」,显然有些片面。

但反过来,觉得AI做数学啥也不行,同样会错过它真正有价值的部分。

更准确的说法可能是:AI正在学会做数学的体力活和工程活:跑套路、补漏洞、做形式化、写稿改稿、查文献。

而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。

所以,陶哲轩这次深夜发帖想要说的,正在于此。

未来的数学家,或许不再是孤独的思考者,而是统领着硅基智能大军的指挥官:在那片广袤的数学原野上,人类指引方向,AI开路架桥。

别断章取义地神话AI,但也绝不要低估这股正在重塑真理探索方式的力量。

参考资料:https://mathstodon.xyz/@tao/115871649394962391

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
少妇当众猥亵年轻男子:脱裤裸露下体,正面照流出,私密细节披露

少妇当众猥亵年轻男子:脱裤裸露下体,正面照流出,私密细节披露

博士观察
2026-02-27 14:51:00
美伊谈判基本告吹、攻击随时可能开始;另,巴基斯坦或攻入阿富汗

美伊谈判基本告吹、攻击随时可能开始;另,巴基斯坦或攻入阿富汗

邵旭峰域
2026-02-27 10:54:56
2026车市第一枪,谁打开了10万级的新想象?

2026车市第一枪,谁打开了10万级的新想象?

虎嗅APP
2026-02-25 18:10:14
洗涤公司要求员工每天工作19小时,离职扣1个月工资?公司:收的货多没办法;劳动监察:将核实

洗涤公司要求员工每天工作19小时,离职扣1个月工资?公司:收的货多没办法;劳动监察:将核实

大风新闻
2026-02-27 11:54:03
女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

女孩被打后续:村民发声,打人夫妻更多信息被扒,最高可判10年

天天热点见闻
2026-02-27 07:01:26
请假2小时被开除后续:店主真容曝光社死,黑历史被扒,已找律师

请假2小时被开除后续:店主真容曝光社死,黑历史被扒,已找律师

离离言几许
2026-02-26 16:16:45
各大银行盯上了压岁钱:孩子存1000元比你存20万利息高, 银行正将儿童金融服务,从节日营销升级为核心战略

各大银行盯上了压岁钱:孩子存1000元比你存20万利息高, 银行正将儿童金融服务,从节日营销升级为核心战略

每日经济新闻
2026-02-27 13:42:07
高市摆鸿门宴,剑指中国,21国赴会!令人痛心的是,东盟7国参加

高市摆鸿门宴,剑指中国,21国赴会!令人痛心的是,东盟7国参加

策略述
2026-02-26 16:58:50
摩根大通对百度的判断没有错

摩根大通对百度的判断没有错

刘远举
2026-02-27 16:12:22
教育部:学生每天体育2小时、课间15分钟已在全国所有省份部署推开

教育部:学生每天体育2小时、课间15分钟已在全国所有省份部署推开

财联社
2026-02-25 18:55:14
欧冠1/8决赛对阵:皇马连续5年遇曼城!巴黎VS切尔西,马竞战热刺

欧冠1/8决赛对阵:皇马连续5年遇曼城!巴黎VS切尔西,马竞战热刺

我爱英超
2026-02-27 19:19:50
连续3次喊话中国后,特朗普撒下弥天大谎,把3亿多美国人当猴耍

连续3次喊话中国后,特朗普撒下弥天大谎,把3亿多美国人当猴耍

知鉴明史
2026-02-26 18:23:44
“手机将全面涨价”,冲上热搜

“手机将全面涨价”,冲上热搜

南方都市报
2026-02-27 14:31:12
杉杉集团破产,事实证明:美女主持人只会排节目,对管理无能为力

杉杉集团破产,事实证明:美女主持人只会排节目,对管理无能为力

来科点谱
2026-02-27 07:29:21
雅江集团招聘 25-35万 ,高原补贴8000元/月

雅江集团招聘 25-35万 ,高原补贴8000元/月

新浪财经
2026-02-27 11:53:35
600735,连发两条公告!股票明起停牌,还被证监会立案

600735,连发两条公告!股票明起停牌,还被证监会立案

每日经济新闻
2026-02-25 19:53:12
南京市档案馆查到谷爱凌外婆冯国珍的珍贵历史档案,确定其为南京户籍

南京市档案馆查到谷爱凌外婆冯国珍的珍贵历史档案,确定其为南京户籍

极目新闻
2026-02-27 10:42:46
连体姐妹花的悲情一生:天生貌美,臀部相连,各自有男友,不幸沦为赚钱工具…

连体姐妹花的悲情一生:天生貌美,臀部相连,各自有男友,不幸沦为赚钱工具…

窈窕妈妈
2026-02-26 18:48:19
新加坡大满贯赛:女单大爆冷!世界第4被淘汰,陈幸同3:0日本名将

新加坡大满贯赛:女单大爆冷!世界第4被淘汰,陈幸同3:0日本名将

国乒二三事
2026-02-27 10:14:54
两天连丢两冠!国乒双线崩盘,孙颖莎王曼昱该不该紧急归位?

两天连丢两冠!国乒双线崩盘,孙颖莎王曼昱该不该紧急归位?

卿子书
2026-02-27 08:31:54
2026-02-27 20:15:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2891文章数 10456关注度
往期回顾 全部

科技要闻

单张不到五毛!谷歌深夜发布Nano Banana 2

头条要闻

世界经济论坛总裁辞职 曾私信爱泼斯坦称对方"天才"

头条要闻

世界经济论坛总裁辞职 曾私信爱泼斯坦称对方"天才"

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

教育
本地
游戏
手机
亲子

教育要闻

最高学费26万!2026济南、青岛私立学费汇总!

本地新闻

津南好·四时总相宜

微软立大功!Xbox商店曝光《红色沙漠》发售时间

手机要闻

三星版“豆包手机”发布 深度绑定AI

亲子要闻

萌娃报警要逮捕妈妈?得知真相的警察反应太逗了

无障碍浏览 进入关怀版