网易首页 > 网易号 > 正文 申请入驻

陶哲轩:几周前,AI突破数学形式化临界点

0
分享至


来源:量子位

数学界的“最强大脑”,快被AI出的证明淹没了。

菲尔兹奖得主陶哲轩分享了他在IEANTN项目(显式解析数论网络集成项目)中的最新体验:

AI生成正确证明的速度太快了,但证明写得太臃肿,人类根本来不及审。

几周前还需要志愿者花数周才能认领完成的形式化任务,现在AI几小时就能搞定。


一个17世纪数学家帕斯卡就注意到的现象正在以全新的方式困扰着当代数学:

生成一个冗长的正确证明,比生成一个简短的正确证明更容易。

陶哲轩把这个现象称为“阻抗不匹配”,而AI把这个矛盾推到了极致。

从数周到数小时

陶哲轩主导的IEANTN项目,目标是将显式解析数论中大量技术性论文形式化,在Lean证明助手中建立一个活的、可动态更新的数论估计网络


这个工作涉及大量繁琐的数值验证和参数匹配。

用陶哲轩自己的话说,这类工作占据了他思考解析数论问题时至少70%的时间

按传统方法,他会把单个引理拆分成独立任务发布出去,然后等待志愿者认领——通常要等好几周。

由于人工形式化本身困难,志愿者会自然而然地追求证明的简短、高效和自然,提交的代码审查起来也很轻松。

但在最近几周,自动形式化技术突然跨过了某个临界点。

陶哲轩发布的几乎每一个形式化任务,都能在数小时内被AI工具完成。

项目中待认领的未解决issue队列,基本清空了。


AI能做局部优化,做不了全局重构

速度的飞跃带来了意想不到的副作用。

AI生成的形式化证明往往比人类写的长出数百行,包含大量冗余步骤,许多引理没有在合适的抽象层次上陈述。

单看任何一个证明,好像都不是大问题,因为这些证明本来就不是给人读的。

但每个臃肿证明都会给项目总构建时间增加几十秒,累积效应变得不可忽视。

陶哲轩把这称为“阻抗失配”:证明生成、证明验证、证明消化三个环节之间的速度差距正在拉大。


生成端被AI加速了数个量级,但验证和消化端仍然依赖人类的认知带宽。

具体到实践中,将一个包含数千行代码(其中部分由AI生成)的中等规模Lean文档,转化为一个结构优雅、适合提交到Mathlib数学库的版本,成了一项颇具挑战的工作。

陶哲轩发现了当前AI工具的一个清晰边界。

让AI做局部的“code golf”(代码精简),它能胜任,可以把证明的体积压缩一些。

但全局性的重构决策,完全超出了现有AI工具的能力范围。

比如发现某个论证在文档中多处重复出现,可以抽象为一个独立引理,而这个引理可能在当前文件之外还有更广泛的用途。

陶哲轩指出,他可以向AI解释这样一个重构方案,AI随后能执行它,但AI无法自发地发现这类重构机会。

AI擅长处理局部的、原子化的任务,但对项目的全局结构缺乏理解。在IEANTN项目的语境下,这意味着AI能快速生成单个引理的证明,却无法判断这个引理应该如何嵌入整个数论估计网络的架构中。


项目推进速度确实比预期快了很多。

但陶哲轩表示,他现在需要花更多时间来提前规划形式化任务的scope,预判AI会迅速交回一个证明,因此在发布任务时就要考虑好如何让结果更易审查、更兼容项目的全局结构。


换句话说,瓶颈从“等人来做证明”转移到了“设计好任务让AI的产出能被有效整合”。数学家的角色正在从亲自执行证明,转向成为证明工程的架构师。

要实现这个愿景,每一块拼图都必须在正确的抽象层次、以正确的接口标准存在于系统中。AI能以惊人速度生产拼图块,但拼图块的形状是否与整体蓝图匹配,目前仍然只有人类能判断。

参考链接:
[1]https://mathstodon.xyz/@tao/116789374373843141
[2]https://www.ipam.ucla.edu/news-research/special-projects/integrated-explicit-analytic-number-theory-network/

阅读最新前沿科技趋势报告,请访问21世纪关键技术研究院的“未来知识库”


未来知识库是 “21世纪关键技术研究院”建 立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

品读时刻
2026-06-13 09:03:28
突然,集体上涨!中东传来大消息,以色列发动袭击!

突然,集体上涨!中东传来大消息,以色列发动袭击!

证券时报e公司
2026-06-27 22:40:45
伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

春夫杂谈
2026-06-26 19:28:20
“这种环境都能排卵?”女毕业生表白单位男领导,评论区炸锅了

“这种环境都能排卵?”女毕业生表白单位男领导,评论区炸锅了

世界圈
2026-06-26 08:40:50
A股:传来两个消息,明天,周一重要时刻来了!

A股:传来两个消息,明天,周一重要时刻来了!

明心
2026-06-28 10:30:14
同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

平说财经
2026-06-26 19:31:07
原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

翰飞观事
2026-06-28 09:59:22
吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

医学科普汇
2026-06-23 17:16:20
国产三蹦子火到丹麦,轮到老外崇中媚华了,死活不让改倒车请注意

国产三蹦子火到丹麦,轮到老外崇中媚华了,死活不让改倒车请注意

王新喜
2026-06-28 07:55:43
原来她是哈兰德的女友,难怪老公2亿欧元身价,曾在20岁未婚生子

原来她是哈兰德的女友,难怪老公2亿欧元身价,曾在20岁未婚生子

莫地方
2026-06-27 01:00:03
媒体:梅西用比赛说明,他哪怕散步都能踢成全场最佳!

媒体:梅西用比赛说明,他哪怕散步都能踢成全场最佳!

历史第一人梅西
2026-06-28 12:09:14
发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

小书虫妈妈
2026-06-25 12:36:46
随着上海申花4-1,浙江1-3,中超最新积分榜出炉

随着上海申花4-1,浙江1-3,中超最新积分榜出炉

俯身冲顶
2026-06-28 21:03:28
美媒晒3方交易方案:詹姆斯3年5830万重返骑士 湖人连获墨菲+阿伦

美媒晒3方交易方案:詹姆斯3年5830万重返骑士 湖人连获墨菲+阿伦

锅子篮球
2026-06-28 12:40:30
男篮抵沈阳备战世预赛!郭士强+2将热度高,王治郅随队,小曾仍在

男篮抵沈阳备战世预赛!郭士强+2将热度高,王治郅随队,小曾仍在

篮球资讯达人
2026-06-28 22:35:44
伊朗:全国约三成民众将参加于7月举行的伊朗已故最高领袖阿里·哈梅内伊的告别、送葬和安葬仪式

伊朗:全国约三成民众将参加于7月举行的伊朗已故最高领袖阿里·哈梅内伊的告别、送葬和安葬仪式

政知新媒体
2026-06-27 17:45:37
斯卡洛尼:梅西本可以踢满全场,但他选择把上场机会让给队友

斯卡洛尼:梅西本可以踢满全场,但他选择把上场机会让给队友

懂球帝
2026-06-28 13:29:21
还差1球,库尼亚有望成为曼联队史世界杯单届进球最多的球员

还差1球,库尼亚有望成为曼联队史世界杯单届进球最多的球员

懂球帝
2026-06-28 18:58:14
事实证明,已经“消失”7年的周立波,早已走上一条不归路

事实证明,已经“消失”7年的周立波,早已走上一条不归路

素衣读史
2026-04-16 19:41:20
正常男人吃一颗伟哥是什么体验?网友们的分享让人脸红心跳加快!

正常男人吃一颗伟哥是什么体验?网友们的分享让人脸红心跳加快!

黯泉
2026-06-25 12:10:30
2026-06-28 23:31:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4851文章数 37482关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

教育
艺术
亲子
游戏
公开课

教育要闻

明日提前批第1次志愿填报!注意事项来啦↘

艺术要闻

她不用笔,她用刀

亲子要闻

肠道真菌菌群紊乱增加儿童过敏风险

分析师:跟风《GTA6》卖80刀?先想想自己配不配

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版