网易首页 > 网易号 > 正文 申请入驻

AI又要颠覆数学?陶哲轩紧急发声:停止造神!

0
分享至


文章转载于新智元

你可能刷到过这种极具煽动性的新闻标题:「AI完全自主解决了人类五十年未解的数学难题!数学家要失业了!」

对于渴望见证AGI诞生的人来说,这无疑又是一剂强心针。而对于坚守人类智力尊严的数学家而言,这仿佛是最后堡垒陷落的警报。

随着这些文章的影响力越来越大,终于有人坐不住了,出手降温。

有趣的是,这个人正是AI数学研究最积极的推动者之一——陶哲轩。

陶哲轩并没有否定AI的数学研究能力,他只是想把水温调回现实。

就在今天凌晨,陶哲轩发帖称,AI解决数学问题的能力被断章取义地夸大了。


他在Erdős Problems项目相关的GitHub页面补充了更系统的说明与警示。

他强调外界对AI解决Erdős问题的解读很容易过度,尤其是把某个孤立战果当成「AI已具备高级数学能力」的证据。

陶哲轩到底在澄清什么?AI在Erdős问题上究竟做到了什么程度?

1

陶哲轩的深夜辟谣

首先要说的是,陶哲轩并不是否认AI在数学上的进步。

他否认的主要是一种偷懒叙事:把「AI在某些问题上能产出可验证结果」,偷换成「AI已经会做数学、能独立创新、能替代人类」。

在他更新的「AI contributions to Erdős problems」页面里表示,看AI在Erdős问题上的成绩单时,千万别只盯着「解了多少题」,还特别注意下面几点:

  • 题目难度差得离谱,「解题数」不能直接比:Erdős问题的难度跨度非常夸张,一端是公认超级硬核的核心难题,另一端是大量长期没人细查、研究很少的「长尾题」。后者里有不少其实属于「低垂果实」,更适合当前AI工具发挥。问题是:你很难在不做专家级文献梳理的前提下,提前判断一题属于哪一类。所以,拿「谁解得多」来PK,很可能不是同一难度段的对比。

  • 很多题目「是否未解」本身就不确定:网站上不少问题缺少系统文献回顾,因此「Open」(未解)这个标签往往只是暂定。AI解出一题后,大家往往很快发现——原来文献里早有人解过(可能方法略不同)。这会让「AI首解」的叙事非常容易翻车。

  • 我们看到的多是成功案例,失败被隐藏了:网站对AI工具的记录并不完整,尤其对没进展、失败尝试的记录更少。

  • 有些题目原始表述有误,可能被「钻字面漏洞」解掉:极少数情况下,Erdős的题目表述可能不严谨甚至有误,要还原本意,往往需要结合上下文、靠领域经验做判断——这一步带有一定主观性。

  • 数学价值不只在答案,更在「连接知识网络」:数学的意义不只是证明成立,还在于这件事对相关领域有什么启发?和已有理论怎么挂钩?有哪些可迁移的方法?人类写证明时,往往会自然补上这些旁白:背景、动机、文献对比、方法边界。但AI主导的证明常常缺少这层知识的光晕,结果可能技术上对,但对数学共同体的可用价值更低。

  • 解出冷门长尾题,不等于够格投顶级期刊:不是每解一个未解题都等价于可发表论文。尤其当题目本身很冷门、方法只是对已有套路的小改动时,更未必能进好期刊。

  • 把AI生成的证明形式化到Lean这类证明助手里,是提高可信度的好办法,但仍可能被钻空子。比如形式化时偷偷引入额外公理、问题陈述被误形式化、或者利用数学库/语法的某些「边角行为」。特别是当形式化证明短得离谱啰嗦得异常时,更要警惕。

简单来说,陶哲轩认为AI在Erdős问题上的进展值得关注,但真正要看的是题目的难度层级、文献核查、题意还原、知识融入,以及验证链条是否扎实等更多维度的指标。

AI能做出成果不等于AI已具备完整数学能力。


1

AI不是数学家 而是工具链的一环

那现实里,AI到底做了什么?

陶哲轩的这份GitHub页面把AI贡献分成了多个类别。

有AI生成了完整(或部分)解答,有AI以为题目未解、结果发现文献早就解过的案例,有AI参与文献检索,有AI把证明形式化到 Lean,有AI帮人类重写既有论证,等等。

例如,页面列出 在2026年1月6日由Aristotle与ChatGPT 5.2 Pro 给出完整解答(Lean验证), 在1月8-10日也获得完整解答(Lean验证)。

这意味着在某些题型、某些难度区间,AI确实能做出「可运行的证明结构」,甚至进入形式化验证流程。


有些问题完全由AI解决,但后来才发现,有人早就解决了。


陶哲轩还专门列了「AI-powered literature review(AI驱动的文献回顾)」一类:AI被用来搜索是否已有结果、是否存在误判Open的情况。


1

人类仍然是主角

如果仅凭几个孤例就认为「AI数学无敌」,显然有些片面。

但反过来,觉得AI做数学啥也不行,同样会错过它真正有价值的部分。

更准确的说法可能是:AI正在学会做数学的体力活和工程活:跑套路、补漏洞、做形式化、写稿改稿、查文献。

而数学真正的「灵魂」——提出深刻问题、创造新概念、把一个结果嵌进整个学科的知识网络——仍然高度依赖人类。

所以,陶哲轩这次深夜发帖想要说的,正在于此。

未来的数学家,或许不再是孤独的思考者,而是统领着硅基智能大军的指挥官:在那片广袤的数学原野上,人类指引方向,AI开路架桥。

别断章取义地神话AI,但也绝不要低估这股正在重塑真理探索方式的力量。

参考资料:https://mathstodon.xyz/@tao/115871649394962391

点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海一公交司机下车搀扶行动不便老人乘车,乘客致电表扬:公交是城市文明窗口

上海一公交司机下车搀扶行动不便老人乘车,乘客致电表扬:公交是城市文明窗口

纵相新闻
2026-01-13 00:09:02
中国又火了!荒漠中挖出亚洲最大水库,美专家:赶快停手!

中国又火了!荒漠中挖出亚洲最大水库,美专家:赶快停手!

丰谭笔录
2026-01-07 10:55:21
乌江惊现怀孕女尸,其父称其多年前死于地震,背后真相细思恐极

乌江惊现怀孕女尸,其父称其多年前死于地震,背后真相细思恐极

风飘飘而吹衣
2024-04-10 16:23:42
一场大裁员正在席卷中国的银行!金饭碗也不香了,究竟是什么原因

一场大裁员正在席卷中国的银行!金饭碗也不香了,究竟是什么原因

墨兰史书
2025-12-26 19:40:03
22岁医学生被前男友杀害前正准备考研,凶手曾购买三棱军刺、电击枪等工具;受害人母亲2023年确诊癌症:为给女儿讨回公道,一度停止化疗

22岁医学生被前男友杀害前正准备考研,凶手曾购买三棱军刺、电击枪等工具;受害人母亲2023年确诊癌症:为给女儿讨回公道,一度停止化疗

扬子晚报
2026-01-13 12:28:57
绑走马杜罗只是个开始,特朗普访华前,给中国设下三大陷阱

绑走马杜罗只是个开始,特朗普访华前,给中国设下三大陷阱

近史博览
2026-01-13 13:29:42
英雄王杰舍身救下12条生命,八年未婚妻守候终生,每年都去祭拜

英雄王杰舍身救下12条生命,八年未婚妻守候终生,每年都去祭拜

谈古论今历史有道
2026-01-12 16:30:03
网红曝开拓者教练团内斗,斯普利特为保杨派,光头助教权利大

网红曝开拓者教练团内斗,斯普利特为保杨派,光头助教权利大

KG说球
2026-01-13 10:19:51
不可错过!1月13日晚18-00央视5套及5+频道直播节目表

不可错过!1月13日晚18-00央视5套及5+频道直播节目表

十三哥侃大山
2026-01-13 09:48:50
色字头上一把刀!46岁"纵欲过度"的萧亚轩,已然走上了另一条路

色字头上一把刀!46岁"纵欲过度"的萧亚轩,已然走上了另一条路

说历史的老牢
2026-01-12 13:47:27
中东变局下,以色列为何重申对华立场?

中东变局下,以色列为何重申对华立场?

陆弃
2026-01-12 10:20:47
宋佳坐飞机时晒自拍,拉布布挂件抢镜。

宋佳坐飞机时晒自拍,拉布布挂件抢镜。

小椰的奶奶
2026-01-13 06:48:54
曼联关注阿隆索皇马下课,有意请其执教!不限新帅打三中卫四后卫

曼联关注阿隆索皇马下课,有意请其执教!不限新帅打三中卫四后卫

罗米的曼联博客
2026-01-13 09:13:14
对话“死了么”创始人:灵感来自网友,多年打拼也曾有孤独感

对话“死了么”创始人:灵感来自网友,多年打拼也曾有孤独感

南方都市报
2026-01-12 12:34:09
中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

史政先锋
2026-01-05 19:53:45
赖清德支持的赖瑞隆初选胜出,将代表民进党参选2026年高雄市长

赖清德支持的赖瑞隆初选胜出,将代表民进党参选2026年高雄市长

海峡导报社
2026-01-13 12:16:03
26年春晚首次彩排!16位大咖亮相现场,这几位明星遭到“抵制”

26年春晚首次彩排!16位大咖亮相现场,这几位明星遭到“抵制”

瓜汁橘长Dr
2026-01-13 09:40:15
需求激增近1000%!发布15年的iPhone 4突然爆红 追捧者:拍照很有氛围感

需求激增近1000%!发布15年的iPhone 4突然爆红 追捧者:拍照很有氛围感

安兔兔
2026-01-11 22:04:21
特朗普“威胁”古巴等国,中方表态

特朗普“威胁”古巴等国,中方表态

新京报政事儿
2026-01-05 18:03:03
算命人说,家有这3生肖的人财气缠身,2026年躲不过一富

算命人说,家有这3生肖的人财气缠身,2026年躲不过一富

人閒情事
2026-01-12 10:41:54
2026-01-13 14:32:49
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2788文章数 10426关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

59岁女子诞下男婴:大女儿定居国外 我和丈夫感到寂寞

头条要闻

59岁女子诞下男婴:大女儿定居国外 我和丈夫感到寂寞

体育要闻

CBA还能众筹换帅?

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

财经要闻

中国一口气申报20万颗卫星,意味着什么?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

亲子
艺术
数码
时尚
公开课

亲子要闻

您吸的每一支烟,透支孩子的健康

艺术要闻

书法争议再起:拙与妍孰优孰劣引发热议

数码要闻

消息称AMD RDNA 5显卡晚于RTX 60系列问世,避开英伟达首发锋芒

走过那个夏天,甜茶终于站上金球奖之巅

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版