网易首页 > 网易号 > 正文 申请入驻

陶哲轩联手AI挑战经典ε-δ极限!加法秒杀、乘法翻车

0
分享至

新智元报道

编辑:犀牛

【新智元导读】数学大师陶哲轩的第三支Lean 4自动化数学证明视频来了!他携手GitHub Copilot挑战分析学经典的「ε-δ」极限问题:加法定理Copilot挥洒自如,减法开始卡壳,乘法更是全面失控。Copilot究竟是神助攻还是添乱?

数学大师陶哲轩的AI新实验来了!

这次是Lean 4自动化数学证明的第三支视频。

主要看看GitHub Copilot在处理分析学经典的「ε-δ」问题(描述函数极限的经典方法)时,效果究竟如何。

之前,陶哲轩上传了两支这个系列的视频。

加上此次的一共3支视频,陶哲轩的油管频道已经有1.7万位订阅者了。

看来,他作为菲尔兹奖得主、当代最杰出数学家之一的影响力的确毋庸置疑。

陶哲轩在此次定理形式化演示中发现,GitHub Copilot在帮助新手入门和处理基础任务时表现得相当不错。

它能帮助用户快速上手Lean语言(一种交互式定理证明工具),提供语法提示,并智能补全基本定义和声明。

在比较简单的证明,比如函数极限的和定理中,Copilot还能准确预测证明结构和关键步骤,表现得就像个得力助手一样。

但当证明变得复杂时,Copilot的短板就暴露出来了。

比如在处理函数极限的差和积定理时,它在复杂的代数推导、寻找合适的数学引理(比如与绝对值相关的引理)等方面显得力不从心。

Copilot有时还会出现「幻觉」,生成压根不存在的策略,或者犯一些低级错误,导致证明过程乱成一团。

这时,陶哲轩不得不亲自出马,修正错误,甚至完全接管证明。

「人机协作」的证明过程

形式化数学的目标是用计算机能完全看懂的精确语言,把数学概念和证明写出来,再用定理证明工具(比如视频里提到的Lean)来一步步检查推理是否靠谱。

这就像把数学证明翻译成一种特别严谨的编程语言。

第三弹的视频里,陶哲轩从一个经典的分析学概念入手:函数的极限

用Lean把这个定义写出来,对新手来说真不是件容易事儿。不过,GitHub Copilot就像个贴心助手,派上了大用场。

陶哲轩刚敲下「定义一个谓词limit f x₀ l」,Copilot就立刻get到他想表达的是「ε-δ」极限定义,秒秒钟生成了对应的Lean代码。

虽然陶哲轩根据自己的习惯稍作调整,但Copilot的智能补全明显让整个过程快了不少。

「和的极限」——小试牛刀

接下来,陶哲轩挑战了一个更复杂的定理:如果函数f(x)的极限是L,g(x)的极限是M,那么f(x)+g(x)的极限就是L+M。

Copilot又秀了一把操作。它不仅帮陶哲轩写出了定理的Lean声明,还开始「猜」证明的步骤,建议引入假设,提取出ε和δ这些关键变量。

Copilot尝试用Lean的calc块整理不等式链,还试着用simp简化表达式。

但这里它开始出小差错,比如搞乱了绝对值的位置,或者在代数推导时显得不够「机智」。

陶哲轩不得不出手,比如他提醒Copilot用「ε/2」技巧。Copilot虽然一开始没完全跟上,但调整后成功融入了这个思路。

最终,经过一番人机配合,这个「和的极限」定理在Lean里被顺利证明通过。

陶哲轩觉得,Copilot干了大部分活,互动体验也很不错。

「差的极限」——AI有点懵

有了「和的极限」的经验,陶哲轩以为「差的极限」会同样顺利。这个定理是说,如果f(x)的极限是L,g(x)的极限是M,那么f(x)-g(x)的极限是L-M。

Copilot似乎也信心满满,直接套用了「和的极限」的证明套路,甚至用上了上述的「ε/2」的技巧。

但过程中,Copilot还是卡壳了,甚至还「脑补」了一个Lean里根本不存在的策略(叫什么sub subanc)。

面对Copilot的「胡思乱想」,陶哲轩试图给予提示,但Copilot还是搞不懂。

陶哲轩意识到,这些代数变换对人类来说简单,但在Lean里需要调用特定的数学引理来支撑每一步。最终,陶哲轩只能亲自动手完成这些代数推导。

这一关让陶哲轩看到,Copilot虽然能模仿证明的大框架,但在需要特定引理或复杂代数操作时,容易掉链子。

他给Copilot这一关的表现打了个B+:帮了不少忙,但关键时刻还是得靠人类引导甚至接管

「积的极限」——彻底乱套

最难的来了:如果f(x)的极限是L,g(x)的极限是M,那么f(x)·g(x)的极限是L·M。

这个证明比加减法复杂多了,尤其在控制误差(ε)时,堪称噩梦。

Copilot尝试沿用标准套路,加中间项、三角不等式。

但问题来了,Lean里处理绝对值乘积或求和,需要非常具体的引理,比如把|ab|变成|a||b|得用abs_mul,|a+b|≤|a|+|b|得用abs_add。

Copilot在找这些引理时频频出错,甚至想用一些通用的策略(比如线性算术),却因为有乘法和绝对值而行不通。

更麻烦的是,为了让误差控制在ε内,一开始得精心设计f(x)和g(x)的误差参数。这些参数选择和边界估计对Copilot来说有点太难了,它试了些参数,但证明中发现行不通,甚至还差点弄出除以零的错误。

陶哲轩在这阶段花了大量时间「救火」,不断调整Copilot的尝试,寻找正确的引理,甚至回去改最初的误差参数。

整个过程乱成一团,尽管Lean系统改参数相对方便(改了让系统重查就行),但得对证明结构有清晰理解才知道怎么改。

最终,经过艰苦努力和大量人工干预,陶哲轩完成了「积的极限」证明。

他总结说,一旦证明复杂到一定程度,Copilot就变得「不怎么靠谱」了

证明的完整代码在GitHub中:

import Mathlib

/- In this file we are going to give some "epsilon-delta" proofs of facts about limits of functions on the real line. -/

/- First, we give the epsilon-delta definition of what it means for a function f : R -> R to converge to a limit L at a value x_0. -/

def limit (f : ℝ → ℝ) (L : ℝ) (x_0 : ℝ) : Prop :=
  ∀ ε > 0, ∃ δ > 0, ∀ x, |x - x_0| < δ → |f x - L| < ε

/-- First we show that if a function f converges to a limit L at x_0, and a function g converges to a limit M at x_0, then f+g converge to L+M at x_0. -/

lemma limit_add (f g : ℝ → ℝ) (L M : ℝ) (x_0 : ℝ) :
  limit f L x_0 → limit g M x_0 → limit (fun x => f x + g x) (L + M) x_0 := by
  intro h1 h2 ε hε
  -- Use ε/2 for each function
  have hε2 : 0 < ε / 2 := half_pos hε
  rcases h1 (ε / 2) hε2 with ⟨δ₁, hδ₁, h1'⟩
  rcases h2 (ε / 2) hε2 with ⟨δ₂, hδ₂, h2'⟩
  let δ := min δ₁ δ₂
  use δ
  constructor
  · exact lt_min hδ₁ hδ₂
  intro x hx
...

代码地址:https://github.com/teorth/estimate_tools/blob/master/EstimateTools/test/limits.lean

有意思的是,大部分观众都觉得视频做得很棒,不过不少网友都建议陶哲轩换个新麦克风,以消除回音。

AI只是副驾驶

在视频的最后,陶哲轩总结道:当证明过程变得复杂时,不如回到最传统的「人脑」方式——拿支笔在纸上把证明的思路和关键步骤理得清清楚楚,再去证明器里一步步形式化

Copilot更像是你的「得力助手」,适合在你已经大致知道证明方向时,帮你快速搞定那些重复的、格式化的工作。

它是个超强的辅助工具,但证明的策略、方向和最终验证,还是得靠人类自己来把控。

参考资料:

https://www.youtube.com/watch?v=c1ixXMtmfS8

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我们都错了!同样是球王,访谈揭示梅西和C罗最大差别,并非球艺

我们都错了!同样是球王,访谈揭示梅西和C罗最大差别,并非球艺

小鬼头体育
2025-11-09 00:25:27
上海这一晚,蒋欣、胡杏儿秒了00后小花,才知什么叫美得有辨识度

上海这一晚,蒋欣、胡杏儿秒了00后小花,才知什么叫美得有辨识度

大铁猫娱乐
2025-11-08 16:35:08
利物浦1亿欧元报价国米铁卫?若真有正式报价,马洛塔不会犹豫

利物浦1亿欧元报价国米铁卫?若真有正式报价,马洛塔不会犹豫

里芃芃体育
2025-11-09 17:06:25
你见过最毁三观的家庭是啥样?网友:我老公今晚给他妈妈屁股上药

你见过最毁三观的家庭是啥样?网友:我老公今晚给他妈妈屁股上药

解读热点事件
2025-11-09 00:20:03
62岁李连杰返老还童,手术后年轻二十岁,生龙活虎就像变了一个人

62岁李连杰返老还童,手术后年轻二十岁,生龙活虎就像变了一个人

一只番茄鱼
2025-11-07 17:50:53
英国将军看到台海另一种结局:收台之日,解放军或许不开一枪一炮

英国将军看到台海另一种结局:收台之日,解放军或许不开一枪一炮

朔方瞭望
2025-11-09 09:36:14
中医是不是科学?看完这篇15年前的论文,自己去判断吧

中医是不是科学?看完这篇15年前的论文,自己去判断吧

读鬼笔记
2025-10-18 19:50:35
断档!天津女排全运会卫冕堪忧,2号位坍塌,李盈莹状态难返巅峰

断档!天津女排全运会卫冕堪忧,2号位坍塌,李盈莹状态难返巅峰

骑马寺的少年
2025-11-09 21:23:54
人前光鲜人后心酸!深圳台主持董超49岁离职,如今转行当网红谋生

人前光鲜人后心酸!深圳台主持董超49岁离职,如今转行当网红谋生

揽星河的笔记
2025-11-07 20:16:16
AMD统治CPU市场:月销量占比近84%!9800X3D一款接近Intel全系

AMD统治CPU市场:月销量占比近84%!9800X3D一款接近Intel全系

快科技
2025-11-09 18:30:15
LV总裁吴越现身上海!马上70岁,戴着钻戒名表身材苗条像四五十岁

LV总裁吴越现身上海!马上70岁,戴着钻戒名表身材苗条像四五十岁

乐悠悠娱乐
2025-11-07 11:00:50
谢娜坐高铁偶遇王鹤棣,发文称:他一定是打听好我的行踪假装偶遇

谢娜坐高铁偶遇王鹤棣,发文称:他一定是打听好我的行踪假装偶遇

韩小娱
2025-11-09 17:04:08
斯诺克喜讯:吴宜泽击败希金斯,首获排名赛桂冠,跻身前16强

斯诺克喜讯:吴宜泽击败希金斯,首获排名赛桂冠,跻身前16强

陈赩爱体育
2025-11-09 23:24:19
提前开香槟,穆里尼奥帅位无忧,科斯塔以碾压态势赢得本菲卡竞选

提前开香槟,穆里尼奥帅位无忧,科斯塔以碾压态势赢得本菲卡竞选

穆里尼奥主义者
2025-11-09 16:52:18
突发!终止重大资产重组,山东这家上市公司“蛇吞象”并购告吹

突发!终止重大资产重组,山东这家上市公司“蛇吞象”并购告吹

山东财经报道
2025-11-09 08:55:01
A股:大家要做好准备,行情很明朗,明天,11月10日,很可能这样走

A股:大家要做好准备,行情很明朗,明天,11月10日,很可能这样走

云鹏叙事
2025-11-09 09:29:16
长得丑演技烂,求求“资本家的丑孩子”们,放过观众的眼睛吧

长得丑演技烂,求求“资本家的丑孩子”们,放过观众的眼睛吧

娱塘主呱呱
2025-10-16 09:31:21
“面部塑料感重”发酵3天后,杨紫更新新动态,宋丹丹的话遭反转

“面部塑料感重”发酵3天后,杨紫更新新动态,宋丹丹的话遭反转

艳儿说电影
2025-11-09 10:57:55
痛心!38岁江苏美女教师梁娇去世,丈夫去世不到百天,女儿才7岁

痛心!38岁江苏美女教师梁娇去世,丈夫去世不到百天,女儿才7岁

云舟史策
2025-06-23 09:35:09
央视《沉默的荣耀》:顶着整容脸却要演女主,谁的审美出了问题?

央视《沉默的荣耀》:顶着整容脸却要演女主,谁的审美出了问题?

嫹笔牂牂
2025-10-08 07:28:28
2025-11-10 00:19:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13828文章数 66239关注度
往期回顾 全部

科技要闻

黄仁勋亲赴台积电“讨要更多芯片”

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

头条要闻

陕西男子打晕妻子误以为已死 将人扔下土崖致其死亡

体育要闻

他只想默默地拿走最后一亿美元

娱乐要闻

《繁花》事件影响:唐嫣工作被取消

财经要闻

10月CPI同比涨0.2% PPI同比下降2.1%

汽车要闻

钛7月销破2万 霜雾灰与青峦翠配色正式开启交付

态度原创

艺术
家居
房产
本地
军事航空

艺术要闻

心中有你,无论相见与否总是思念。

家居要闻

现代自由 功能美学居所

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

本地新闻

这届干饭人,已经把博物馆吃成了食堂

军事要闻

俄媒:俄军即将攻占乌克兰"第三首都"

无障碍浏览 进入关怀版