网易首页 > 网易号 > 正文 申请入驻

全网惊了!陶哲轩带AI下场,33分钟「盲证」数学

0
分享至

新智元报道

编辑:桃子 KingHZ

【新智元导读】菲尔兹奖得主陶哲轩再放大招,仅数天时间,开源的概念验证工具借助Copilot迭代至2.0版本。而在最新视频中,他甚至用AI在33分钟「盲做」形式化一页证明,效率惊人。

数学大神陶哲轩携手ChatGPT,打造了开源项目——数学概念验证工具,专攻任意正参数的不等式证明。

没想到,才几天的时间,这款工具迎来2.0版本惊艳升级!

它已从最初的自动化验证框架,摇身一变,成为如今灵活的证明助手。

2.0版不仅能全自动证明,还支持半自动交互式证明。

在设计过程中,他不仅融入了命题逻辑,还模仿Lean证明助手的精髓,结合Python神器sympy,让工具变得更强大、更通用。

这个工具的巨大优势在于,能够让人类数学家与AI助手无缝协作,攻克繁琐计算。

值得一提的是,GitHub Copilot在陶哲轩工具2.0版本中,发挥了重要的作用。

仅数天,2.0版来袭

数学证明助手2.0主要用于证明简短但繁琐的任务,比如验证不等式推导。

这次更新特意添加了对渐近估计的支持。

项目链接:https://github.com/teorth/estimates

这个证明助手有两种工作模式:假设模式(Assumption mode)与策略模式(Tactic mode)

大多数练习开始后默认处于策略模式,其界面风格模仿了现代的形式化证明系统,如LeanIsabelleRocq

上手简单

新根据上手简单,使用方便,比如要证明下列不等式:

如果x,y,z是正实数,且满足x<2y和y<3z+1,证明x<7z+2。

在Python中,定义一个函数就可以了。



def linarith_exercise():
    p = ProofAssistant()
    x, y, z = p.vars("pos_real", "x", "y", "z")
    p.assume(x < 2*y, "h1")
    p.assume(y < 3*z+1, "h2")
    p.begin_proof(x < 7*z+2)
    return p



在交互式 Python 环境中:



>>> from main import *
>>> p = linarith_exercise()
Starting proof.  Current proof state:
x: pos_real
y: pos_real
z: pos_real
h1: x < 2*y
h2: y < 3*z+1
|- x < 7*z+2




自定义证明任务

1. 初始化:



p = ProofAssistant()


2. 添加变量:



x = p.var("real", "x") 
y, z = p.vars("pos_int", "y", "z")



3. 添加假设:



p.assume(x + y + z <= 3, "h") 
p.assume((x >= y) & (y >= z), "h2")



4. 开始目标:



p.begin_proof(Eq(z,1))  # 开始证明 z = 1



此外,还支持引用预置引理。

因为设计目标是可扩展性强,新版本还鼓励用户自行提出或贡献新的策略。

策略是用于将当前证明状态转化为零个或多个后续证明状态的方法。

通常通过ProofAssistant.use()方法调用。

渐近分析

这个证明辅助工具最初的设计动机之一,是为了构建一个可以操控渐近估计的环境,例如如下几种常见形式:

  • X≲Y也可写作 X=O(Y)),表示存在某个绝对常数C,使得∣X∣≤C;

  • X≪Y(也可写作 X=o(Y)),表示对任意常数ε>0,只要渐近参数足够大,就有 ∣X∣≤εY;

  • X≍Y(也可写作 X=Θ(Y)),表示X≲Y且Y≲X。

sympy中,这种渐近行为是通过如下方式实现的:

首先,陶哲轩等定义了新的sympy表达式类型,称为OrderOfMagnitude,对应于所讨论的数量级空间O。

这种表达式虽然不是具体的数值,但支持多种代数操作,例如加法、乘法、实数次幂以及数量级比较。

然而需要注意的是,在该数量级系统中不存在「零」或「减法」的概念。

接下来,他们定义了一个名为Theta的操作

它将正实数的sympy表达式映射为OrderOfMagnitude表达式,能够形式化表示上述渐近关系:

  • X≲Y:形式化为lesssim(X, Y),语法糖为Theta(Abs(X)) <= Theta(Y)

  • X≪Y:形式化为ll(X, Y),语法糖为Theta(Abs(X)) < Theta(Y)

  • X≍Y:形式化为asymp(X, Y),语法糖为Eq(Theta(X), Theta(Y))

sympy中,还内建了各种渐近运算的规则,例如:

  • 对于任意数值常数 C,有Θ(C) 会简化为Θ(1);

  • 对于两个表达式X, Y,有 Θ(X+Y)会简化为 max⁡(Θ(X),Θ(Y)); 等等。

以下是一个使用证明辅助工具建立渐近估计的简单示例:

假设已知正整数N和两个正实数x和y,满足:x≤2N^2以及y<3N

任务是推导出:xy≲N^4

首先,定义对应函数:



def loglinarith_exercise():
    p = ProofAssistant()
    N = p.var("pos_int", "N")
    x, y = p.vars("pos_real", "x", "y")
    p.assume(x <= 2*N**2, "h1")
    p.assume(y < 3*N, "h2")
    p.begin_proof(lesssim(x*y, N**4))
    return p



然后,执行相关命令,自动完成相关证明:



>>> from main import *
>>> p = loglinarith_exercise()
Starting proof.  Current proof state:
N: pos_int
x: pos_real
y: pos_real
h1: x <= 2*N**2
h2: y < 3*N
|- Theta(x)*Theta(y) <= Theta(N)**4
>>> p.use(LogLinarith(verbose=True))
Checking feasibility of the following inequalities:
Theta(N)**1 >= Theta(1)
Theta(x)**1 * Theta(N)**-2 <= Theta(1)
Theta(y)**1 * Theta(N)**-1 <= Theta(1)
Theta(x)**1 * Theta(y)**1 * Theta(N)**-4 > Theta(1)
Infeasible by multiplying the following:
Theta(N)**1 >= Theta(1) raised to power 1
Theta(x)**1 * Theta(N)**-2 <= Theta(1) raised to power -1
Theta(y)**1 * Theta(N)**-1 <= Theta(1) raised to power -1
Theta(x)**1 * Theta(y)**1 * Theta(N)**-4 > Theta(1) raised to power 1
Proof complete!




33分钟「盲做」数学证明

就在刚刚,陶哲轩还发布了一则30多分钟的新视频。

视频中,他抛出了一个令人兴奋的新实验:

用自动化工具,如GitHub Copilot、Lean证明助手,半自动形式化一个仅一页纸的数学证明。

陶哲轩仅用33分钟便完成,且全程「盲目」操作,无需深究证明的高层逻辑。

在帖子介绍中,他提到这次实验是源于,自己在Equational Theories Project中,与作者Bruno Le Floch的交流。

他提供了一个关于命题E1689-E2「人类可读」证明草稿,挑战了此前「所有证明都依赖计算机」的说法

陶哲轩突发奇想,决定用一种计算方式形式化这个证明,而且完全依赖工具,摒弃对证明整体结构的理解。

他坦言,「这与我通常的形式化工作方式,截然不同。我不试图把握『宏观思路』,而是借助GitHub Copilot的大模型和Lean的canonical匹配策略,专注于细节的准确性」。

在演示视频中,他将Bruno的草稿拆解成细小的逻辑单元,AI工具自动处理约一半细节,剩余部分由他手动补全。

最终,生成了一个能在Lean中通过验证的形式化证明。

用时仅33分钟。

这种「技术性、非概念性」的证明,正是AI工具的用武之地。

陶哲轩认为,这类证明的关键在于,确保每一步逻辑严密,而非依赖深刻的洞察。

AI接管了繁琐的推理,让数学家能专注于如何表达逻辑,而无需反复验证细节。

陶哲轩的这次实验,远不止一个证明的完成。它让我们看到,AI正在重塑研究范式。

参考资料:

GitHub - teorth/estimates: Code to automatically prove or verify estimates in analysis

https://terrytao.wordpress.com/2025/05/01/a-proof-of-concept-tool-to-verify-estimates/

https://mathstodon.xyz/@tao/114486537464033675

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

张雪峰去世真相!网友:偌大的公司靠他个人ip养活,早死是必然的

火山詩话
2026-03-25 09:18:58
多地将举办“纪念张国荣”演唱会,行情火爆?张国荣挚友:请停止所有非法行为

多地将举办“纪念张国荣”演唱会,行情火爆?张国荣挚友:请停止所有非法行为

上观新闻
2026-03-26 15:06:07
苹果 Max 新品正式开售,3999 元起!

苹果 Max 新品正式开售,3999 元起!

科技堡垒
2026-03-26 11:36:39
跌麻了!笔记本开年销量暴跌40%近乎腰斩:没人买了

跌麻了!笔记本开年销量暴跌40%近乎腰斩:没人买了

中国能源网
2026-03-26 14:13:04
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

“大概有几十万”,重庆一小区有人高空撒钱,物业称捡回几大桶,撒钱者正配合调查

新京报
2026-03-26 20:41:35
姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

姐弟俩被继母逼吃大便、热水烫下体、垃圾桶觅食、浑身淤青......生父威胁邻居别管闲事,已被逮捕!

新民周刊
2026-03-26 19:12:17
禁止将居民住宅专门用于安放骨灰!

禁止将居民住宅专门用于安放骨灰!

北青网-北京青年报
2026-03-26 16:11:05
高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

高速统一限速3月26日正式落地!五档限速+清理非标不会再乱扣分!

沙雕小琳琳
2026-03-26 09:41:30
岛上设陷阱,海上堵两头!伊朗布下天罗地网,曼德海峡将成美国经济新“放血点”?

岛上设陷阱,海上堵两头!伊朗布下天罗地网,曼德海峡将成美国经济新“放血点”?

红星新闻
2026-03-26 18:34:31
扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

环球网资讯
2026-03-26 08:55:12
我国航空发动机领域著名专家严红病逝,年仅57岁

我国航空发动机领域著名专家严红病逝,年仅57岁

澎湃新闻
2026-03-26 11:40:26
泰国征兵广告用张凌赫做海报:想像“武安侯”一样帅气骑马吗?今年四月报名参军 选择骑兵部队

泰国征兵广告用张凌赫做海报:想像“武安侯”一样帅气骑马吗?今年四月报名参军 选择骑兵部队

闪电新闻
2026-03-26 17:45:38
斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

澎湃新闻
2026-03-26 17:02:26
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
首个因中东战争宣布进入紧急状态的国家,为何是菲律宾?

首个因中东战争宣布进入紧急状态的国家,为何是菲律宾?

上观新闻
2026-03-26 19:36:04
网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

网友在乌兹别克斯坦偶遇“佛山三水城巴”,佛山方面回应:车子被转卖到了国外

极目新闻
2026-03-26 17:01:19
一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

涛哥锐评
2026-03-26 17:57:04
曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

曾在恒大赚上亿!40岁郜林吐槽:在中乙当老总1个月工资不够油费

我爱英超
2026-03-26 20:47:14
2026-03-26 22:32:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

头条要闻

美国总统特朗普公开宣布访华行程 外交部回应

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

旅游
家居
教育
时尚
军事航空

旅游要闻

别再人挤人,泰州的这条老街,传承1200年!

家居要闻

傍海而居 静观蝴蝶海

教育要闻

江苏省教育厅公布全省中小学生竞赛活动名单

上新|| 她们说,找到了自己的人生裙子!

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版