网易首页 > 网易号 > 正文 申请入驻

AI「生肉证明」堆爆GitHub!陶哲轩重磅发声:只会解题没用了

0
分享至


新智元报道

编辑:犀牛

【新智元导读】陶哲轩最新判断,数学正在从「证明稀缺」进入「证明过剩」时代——数学家最值钱的工作已不再只是「做出证明」,而是验证它、消化它,并把一块 AI 吐出的「生肉证明」变成人类真正吃得下的知识。

最近,陶哲轩在 Mastodon 抛出一记重磅判断——

数学正在从证明稀缺时代,进入证明过剩时代(from an era of proof scarcity to an era of proof abundance)!


在AI对Erdős问题的贡献Github页面上,20多份 AI 提交的全部或部分解,正堆在「pending assessment」(待评估)那一栏。

而在此之前,这个分类常年只有1-2份。


一夜之间,AI 正在以令人窒息的速度疯狂输出数学证明。

问题是——没人来得及看。

问题求解「三件套」

生成、验证、消化

陶哲轩把这次的思考建立在一个简洁的框架上。

他说,数学问题求解从来不是一件事,而是三件事:

  • Proof generation(证明生成):把一个猜想从「未解决」推到「有解」。

  • Proof verification(证明验证):确认这个解是对的,逻辑没有漏洞。

  • Proof digestion(证明消化):把证明读懂、讲透、提炼出方法论,让整个领域受益。


在过去的几百年里,三件事基本由同一拨人完成——你证了一个定理,你自然理解它,你写论文解释它。

这三个环节之间不存在「瓶颈差」。

但 AI 来了之后,情况变了。

生成环节被 LLM 大幅加速,验证环节有 Lean、Coq 等形式化工具兜底,唯独消化环节——那个需要人类大脑去理解「这个证明到底意味着什么」的环节——完全跟不上。

陶哲轩用了一个精确的工程术语来形容这种错位:impedance mismatch(阻抗失配)

三个环节的速度不匹配了:证明像洪水一样涌来,但理解的堤坝还是手工砌的。

他说,想象两种社会。

食物稀缺的社会,最受尊敬的人是猎手和农夫——是那些「bring home the bacon」(把食物带回家)的人。

你猎回一头鹿,不管肉质如何,整个部落都会感激你,会有人主动帮你清洗、烹饪、分配。几乎任何没有毒的食物贡献都受欢迎。

食物过剩的社会则完全不同。

想象一个 pot-luck 派对(每人带一道菜的聚餐)。如果一个陌生人闯进来,扔下一块来路不明的生肉,让大家自己去处理——没有人会高兴。

甚至超市买来的预包装食品,也只是勉强算数。

真正受欢迎的,是社区里受信任的成员精心烹制的家常菜——不仅因为好吃,更因为围绕这道菜的对话本身就是社交的一部分,也是培养下一代厨师的机会。

回到数学——AI 跑出来的「生肉证明」(raw proof),就是那块被陌生人扔在派对上的神秘肉。

它可能是正确的。它可能通过了形式化验证。

但没有人清洗过它、烹饪过它、也没有人能告诉你它到底好不好吃。


陶哲轩直言:这种「贡献」不仅没有推进问题的实际进展(do not measurably advance the progress),反而可能产生一个「负面效果」——它杀死了人们继续研究这个问题的兴趣

问题被宣告「已解决」了,但没人懂这个解。

好比一道菜被端上桌,但没人敢动筷子。

于是这道菜——连同围绕它可能产生的所有对话和灵感——就这样凉了。

Erdős #1196,唯一跑通「三件套」的案例

理论都需要一个切片去检验。

陶哲轩反复提到的那个切片,就是 Erdős 问题 #1196。

这是一个关于「primitive sets」(本原集)的猜想:在一个整数集合中,如果没有任何元素整除另一个元素,那么对所有元素 a 按 1/(a·log a) 求和,当集合元素趋于无穷大时,这个和是否趋近于1?

1968年,Erdős、Sárközy 和 Szemerédi 提出了这个猜想。


此后将近60年,数学家们不断逼近——斯坦福数学家 Jared Lichtman 花了数年证明了一个相关的上界(约1.399),但最终的渐近猜想始终悬而未决。

2026年4月的某个周一下午,23岁的 Liam Price 把这道题丢进了 GPT-5.4 Pro。

Price 没有数学博士学位,没有多年的专业训练。他用的是一个20美元/月的 ChatGPT Pro 订阅——任何人都能用的工具。


80分钟。

模型走通了一条数学界忽视了近90年的路径:用von Mangoldt 函数(一种经典的解析数论权重函数)结合马尔可夫过程理论,构造出了一个全新的证明框架。

这个技术组合已经存在了几十年,但从未有人想到把它用在本原集问题上。

证明出来了。

但如果故事到这里就结束,它只不过又是一块「神秘肉」。

关键在于接下来发生的事:陶哲轩亲自下场。

他在24小时内验证了证明的核心思路,随后将其扩展、重组、打磨,最终揭示出这个证明背后隐藏着一条更深层的联系——整数解剖学(integeranatomy)与马尔可夫过程理论之间一条此前未被描述的全新桥梁

这就是证明消化(proof digestion)。

不只是「对不对」的问题,而是「它意味着什么」的问题。

陶哲轩称 #1196 是目前唯一一个三阶段——生成、验证、消化——都基本跑通的案例。

也正因如此,他反复强调一个原则:理想状态是同一拨人完成全部三件事

而现实中,越来越多的人在用 AI 生成证明后,没时间去验证和消化,就直接提交了。

这正是 Erdős 问题近20多份待评估方案堆积的直接原因。

三处表态,同一判断

陶哲轩不是在一个地方随口说说。

他在几乎同一时期,通过三个不同渠道发出了同一个信号。

4月27日,Mastodon 长帖正式提出「证明稀缺→证明过剩」的范式判断。

4月27日,Nature 访谈(The job description is changing):他对记者 Davide Castelvecchi 说,数学家的「岗位描述」正在改变。一个拒绝碰 AI 工具、只想用传统方式做证明的研究生,未来可能会发现自己的机会越来越少。

能在传统数学功底之上熟练运用新工具的人,才会真正繁荣。


3月29日,博客长文《Mathematical methods and human thought in the age of AI》:他和 Klowden 花了超过一年写成这篇论文,试图超越眼前的技术细节,直面更根本的哲学问题——数学证明的本质是什么?论文的目的是什么?我们这个职业存在的意义是什么?

他在博客中写道:如果我们自己不回答这些问题,它们就会被科技公司或经济激励机制替我们回答。


三处表态,同一个内核:数学家的核心竞争力正在迁移——从「谁先生成证明」,转向「谁能选对问题、设计工作流、验证并消化结果」。

稀缺的不再是答案,而是理解。

更大的震荡:学术评价体系要重写

如果只是数学家的工作方式变了,那还只是一个学科内部的事。

但陶哲轩看到的远不止此。

当证明的成本被 AI 压到接近于零,当证明验证被 Lean/Coq 等形式化引擎大幅自动化——证明消化这个环节的价值就会被重估。

过去,消化证明是「免费的」。

你证了一个定理,你自然会理解它,会在论文里解释它。这个劳动从未被单独计价。

但当证明的生产者(AI)和理解者(人类)被拆开之后,消化就从隐性劳动变成了显性稀缺资源

这意味着整个学术声望的分配逻辑要变。

Citation 体系、论文评审标准、奖项评选规则、甚至招聘和晋升的依据——所有这些围绕「谁先证了什么」建立起来的激励结构,都将面临重构。

陶哲轩预测:就像现代社会不再把生食原料当作一顿饭一样,数学研究文化将不再把「未消化的裸证明」(raw, undigested proofs)视为对一个问题的解决方案。

未来的评判标准,将聚焦于一个贡献究竟在多大程度上丰富了整个领域,而非仅仅「解决」了问题本身。

而且这不只是数学一个学科的事。

AI for Math 的范式漂移,将成为所有强证明型学科的预演——理论物理中的计算验证、密码学中的安全性证明、软件工程中的形式化验证——所有依赖「正确性论证」作为核心产出的领域,都将面临同样的「阻抗失配」。

证明会越来越多,越来越快,越来越便宜。

证明的时代没有结束。

但「证明即一切」的时代,正在落幕。

未来属于那些不仅能「算出来」,更能「讲明白」的人。

参考资料:

https://mathstodon.xyz/@tao/116477351524980995

https://mathstodon.xyz/@tao/116450581967483825

https://www.nature.com/articles/d41586-026-01246-9

https://terrytao.wordpress.com/2026/03/29/mathematical-methods-and-human-thought-in-the-age-of-ai/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
爆冷!终结4连败,中超关键1战:半场轰6球,乔迪怒锤1米射失!

爆冷!终结4连败,中超关键1战:半场轰6球,乔迪怒锤1米射失!

话体坛
2026-06-26 22:11:53
《求是》重磅发声:稳楼市,守护居民家庭资产 !

《求是》重磅发声:稳楼市,守护居民家庭资产 !

专业聊房君
2026-06-26 08:20:12
94分钟破门无效!世界杯戏剧性一夜:伊朗错失绝杀 韩国又成输家

94分钟破门无效!世界杯戏剧性一夜:伊朗错失绝杀 韩国又成输家

侃球熊弟
2026-06-27 13:15:08
缓存清理要付费,WPS的“免费救星”剧本演不下去了

缓存清理要付费,WPS的“免费救星”剧本演不下去了

全栈遛狗员
2026-06-26 11:05:09
医生发现:能吃能喝的老人,基本在70岁,就已经不做这6件事了!

医生发现:能吃能喝的老人,基本在70岁,就已经不做这6件事了!

医学原创故事会
2026-06-16 18:47:09
被架在火上烤!荷兰大臣摊牌了:对中国出口光刻机由我们自己决定

被架在火上烤!荷兰大臣摊牌了:对中国出口光刻机由我们自己决定

互联鱼
2026-06-26 11:09:22
朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

朝鲜男人烟不离手,金正恩抽什么牌子的香烟?一包烟的价格是多少

番外行
2026-04-16 08:25:40
官方:朝鲜被取消下一届U17亚洲杯参赛资格,并被罚款5万美元

官方:朝鲜被取消下一届U17亚洲杯参赛资格,并被罚款5万美元

懂球帝
2026-06-27 17:09:37
父亲年前从国企退休,我以为退休金也就三四千块钱

父亲年前从国企退休,我以为退休金也就三四千块钱

五元讲堂
2026-02-25 14:26:11
白玉兰奖落幕,3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

白玉兰奖落幕,3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

好贤观史记
2026-06-27 11:51:57
十四届全国人大常委会举行第七十次委员长会议

十四届全国人大常委会举行第七十次委员长会议

人民网
2026-06-27 06:13:18
中国科学家也没料到:沙漠的太阳能电池板,可以唤醒荒漠生态系统

中国科学家也没料到:沙漠的太阳能电池板,可以唤醒荒漠生态系统

咸鱼金脑袋
2026-06-22 21:13:28
美联航备降后续!女子登机前状态和动机曝光,知情人曝更多内情

美联航备降后续!女子登机前状态和动机曝光,知情人曝更多内情

80后房车生活
2026-06-27 15:48:42
高考结束妈妈下厨犒劳女儿,只因吵醒睡觉,女儿摔东西抓破母亲脸

高考结束妈妈下厨犒劳女儿,只因吵醒睡觉,女儿摔东西抓破母亲脸

一丝不苟的法律人
2026-06-25 16:34:42
勇士签下老将和悍将,两年1400万三年8500万合同

勇士签下老将和悍将,两年1400万三年8500万合同

80后房车生活
2026-06-26 14:25:14
“就因为我身体不好,他们就骂我是瘸子”,12岁脑瘫女孩跳楼身亡案,最新进展

“就因为我身体不好,他们就骂我是瘸子”,12岁脑瘫女孩跳楼身亡案,最新进展

新京报
2026-06-27 08:56:53
世体谈阿尔瓦雷斯:他决心要走,马竞最好别把他当菜鸟糊弄过去

世体谈阿尔瓦雷斯:他决心要走,马竞最好别把他当菜鸟糊弄过去

兰亭墨未干
2026-06-27 16:10:40
2平1负!拥巴萨皇马双队长的乌拉圭回家,韩国:这波助攻我收了

2平1负!拥巴萨皇马双队长的乌拉圭回家,韩国:这波助攻我收了

阿心文史
2026-06-27 11:11:09
白玉兰奖落幕,3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

白玉兰奖落幕,3人口碑暴涨,2人升咖,1人镀金失败,唯她被骂惨

阿废冷眼观察所
2026-06-27 06:50:05
哪些运动能有效改善睡眠质量?

哪些运动能有效改善睡眠质量?

人民体育
2026-06-25 12:06:45
2026-06-27 17:24:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15547文章数 66938关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

佛得角队历史性闯入世界杯32强 主帅回应

头条要闻

佛得角队历史性闯入世界杯32强 主帅回应

体育要闻

韩国球迷感谢西班牙:他们本可做掉我们

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

首搭华为乾崑智驾ADS5 启境GT7上市售价20.99万-32.99万元

态度原创

家居
健康
时尚
本地
教育

家居要闻

绿意盎然 自然之境

“无糖汤圆”是否隐藏着健康陷阱?

乙女游戏新人设,竟然是195年下体育生?!

本地新闻

世界杯球迷节:比球赛更好玩的派对

教育要闻

高一学霸一个月备战高考,斩获620分,已提前入围中科大少年班,独家揭秘备战过程

无障碍浏览 进入关怀版