网易首页 > 网易号 > 正文 申请入驻

前两天刚被群嘲,ChatGPT转头就解决了一个数学难题

0
分享至



机器之心报道

编辑:Panda

前些天,OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲以及对于 AI 领域夸大宣传和 AI 检索能力的激烈讨论。参阅报道《OpenAI「解决」10 道数学难题?哈萨比斯直呼「尴尬」,LeCun 辛辣点评》。

然而,讽刺的是,当人们还在辩论 AI 是不是一个合格的「文献检索员」时,真正的数学发现已经悄然发生。

AI 取得研究突破

加州大学洛杉矶分校(UCLA)数学教授 Ernest Ryu 发推称:「我使用 ChatGPT 解决了凸优化中的一个未曾被解决的问题。」



随后,他通过一系列推文介绍了自己与 ChatGPT 的联合成果。

首先来看一下他所研究的问题本身:



呃,看不懂,但我们可以让 AI 来帮助我们理解(AI 再立大功!):

这个数学问题探讨的是一个在最优化理论中非常著名的动态系统,我们可以用一个生动的物理比喻来理解它:一个球在碗里的滚动过程。在这个比喻中,被称为「凸函数」的 f 就代表一个形状完美的碗,它内部光滑,从碗边到碗底的坡度是逐渐下降的,没有任何凹陷或小山丘。这个碗的碗底可能是一个尖锐的点,也可能是一片宽广的平坦区域,这片最低的区域在数学上被称为 argmin f。而 X (t) 则描述了在时间 t 时,一个球在这个碗中所处的位置。截图中的那个核心微分方程,Ẍ(t) + (3/t)Ẋ(t) + ∇f (X (t)) = 0,就是控制这个球如何滚动的「物理定律」。其中,∇f (X (t)) 扮演了「重力」的角色,时刻将球往坡度最陡峭的下方拉扯;而 (3/t)Ẋ(t) 则是一个非常特殊的「摩擦力」,它的奇特之处在于会随着时间的流逝而逐渐减弱。一开始摩擦力很强,能有效减速,但随着时间 t 变得越来越大,这个摩擦效应会变得越来越微弱。整个问题就是从碗壁的某个初始位置 X₀ 将球从静止状态释放,然后观察它在这套独特的物理规则下将如何运动。

这个问题的真正核心与挑战,在于需要严格证明:这个滚动的球最终不仅会到达碗底,而且会完全静止在碗底的某一个确切的点上。表面上看,这似乎是理所当然的,但在数学上却是一个深刻的难题。数学家们早已证明,球的「高度」 f (X (t)) 随着时间的推移,必然会无限趋近于碗底的最低高度。换言之,我们 100% 确定这个球最终会进入碗底的最低区域,而不会停在半山腰。但这仅仅是「函数值收敛」。真正的「悬而未决的难题」在于球的「位置」 X (t) 是否也会收敛。如果碗底是一个宽广的平坦区域,球在到达这个区域后,会不会因为惯性而永无止境地滑行、振荡或者兜圈子,就像一个陀螺在光滑的地面上不停旋转一样?这个问题要求证明,恰恰是由于那个 3/t 的特殊时变摩擦力,它能以一种恰到好处的方式耗尽球的所有动能,最终引导它停泊在一个固定的位置上,而不是在最低能量状态下进行永恒的漂移。这在很长一段时间里都是一个吸引了众多研究的公开问题,因为它触及了优化算法收敛性理论的基石。

下面则是 ChatGPT 的证明,但也经过了 Ernest Ryu 教授的整理:





他也分享了原始的交互记录:https://chatgpt.com/share/68f805f2-b8fc-8010-8df6-20a46bc1df44

从这份记录可以看到,他使用的模型是 GPT-5 Pro,而该模型为该问题执行了 22 分钟的推理。



同样,AI 基于此给出的分析是:Nesterov ODE (常微分方程) 的解 X (t) 最终会收敛到函数 f 的某一个最小值点 X∞。

我们也能在证明中看到 z₁ 和 z₂ 距离为 0,意味着这两者必须是同一个点。这与最初「假设存在两个不同的点」相矛盾。因此,最初的假设是错误的,所以这个球只能停在一个点上。

Ernest Ryu 还介绍了自己的历程和想法:「我的反应:ChatGPT 确实有效地加速了我的进度。这项工作花了大约 12 个小时,分 3 天进行。现在回想起来,证明过程其实很简单。」

他继续介绍说:「但我尝试了许多其他策略,但都没有成功,而 ChatGPT 至关重要地帮助我快速探索并消除了这些死胡同。此外,关键的成功步骤也是由 ChatGPT 提出的。

不过他也指出,ChatGPT 的成功并不是一蹴而就的:「ChatGPT 并非一次性给出证明。整个过程高度互动。它提出了许多论点,其中大约 80% 都是错误的。但有些想法对我来说确实很新颖。每当我意识到一个新奇的想法,无论正确与否,我都会提炼出其中的关键洞见,并促使 ChatGPT 对其进行进一步的开发。」

Ryu 还总结了自己与 ChatGPT 各自的贡献:



最后,他指出:「在我看来,这个结果已经可以在权威的优化理论期刊上发表。不过,我还想进一步完善它。」未来他还计划将该证明泛化到 r>0 的 ODE 以及尝试「将这个论证转化为证明离散时间对应方法(即 Nesterov 加速梯度法)的收敛性」。

他总结说:「ChatGPT 现在已经处于能解决一些数学研究问题的水平,但确实需要一位专家来指导它。

有意思的是,他提到自己研究过程中最大的障碍是「用完 ChatGPT Pro 查询」,而他使用的已经是「昂贵的 Pro 计划」,只能等下个月刷新了。

当然,这是个相当不错的宣传机会,已经有 OpenAI 工作人员联系他,并提供了更多积分。



AI 成为论文第一作者

无独有偶,加州大学欧文分校(UCI)数学教授 Paata Ivanisvili 前些时日也宣称 GPT-5 Pro 助其发现了一个命题的反例。



更有趣的是,他刚刚还宣布要将 ChatGPT 列为他这篇论文的合著者,并且还是第一作者



当然,这早已不是 AI 首次以作者身份登上严肃的学术论文,早在 2023 年 ChatGPT 就已经当作论文第三作者,参阅报道《一位论文作者火了,ChatGPT 等大型语言模型何时能成为论文合著者?》不过,值得注意的是,该论文的最新版本的作者名单中已经没有 ChatGPT 的身影。



2023 年的截图,现如今该论文的作者名单中已经没有 ChatGPT

AI 辅助证明,成为第二作者

而在前些天的所谓「OpenAI『解决〗10 道数学难题?」事件之后,有两位人类研究者遭遇了类似的尴尬。他们在宣布成功解决了 #707 Erdos 问题之后发现这个问题其实 30 年前就已经被解决了!

不过他们也并未止步于此,而是继续让 GPT-5 编写了一个 Lean 形式化证明,并成功进行了验证。当然,他们也强调了专家指导和反馈的重要性。

总之,我们看到,在其论文的作者列表中,ChatGPT 与 Lean 都跻身其中。



当然,将 AI 列为论文作者的做法依然存在巨大争议。









结语

顺带一提,在前述相关推文的评论区,我们也能看到其它一些使用 AI 取得研究进展的信息:



Ernest Ryu 教授的故事,连同其他研究者的经历,共同揭示了一个正在到来的新时代:AI 或许不再仅仅是工具,它正在成为研究伙伴

这意味着,未来顶尖的科研,或许将不再是单打独斗的英雄主义,而是人类专家与强大 AI 之间的深度对话与协作。

那么,屏幕前的你呢?你有在自己的研究工作中使用 AI 吗?体验如何?欢迎分享你的故事。

https://x.com/ErnestRyu/status/1980759528984686715

https://x.com/PI010101/status/1981014478969033156

https://x.com/goldstein_aa/status/1981034927266083203

https://x.com/SebastienBubeck/status/1980804267524116569

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
300071,实控人、董事长兼总经理,被留置!

300071,实控人、董事长兼总经理,被留置!

证券时报e公司
2026-02-01 17:38:39
中央定调,延迟退休后,1966年8月出生的职工,2027年退休划算吗

中央定调,延迟退休后,1966年8月出生的职工,2027年退休划算吗

另子维爱读史
2026-02-01 19:47:22
S家又开始了!全家上阵使出三连招,就为榨干大S一周年忌日热度

S家又开始了!全家上阵使出三连招,就为榨干大S一周年忌日热度

萌神木木
2026-02-01 17:01:19
一路走好!继朱媛媛后,又一名人离世,年仅29岁,死因令人唏嘘!

一路走好!继朱媛媛后,又一名人离世,年仅29岁,死因令人唏嘘!

探长影视解说
2026-01-14 13:29:39
中国女排联赛现不和谐一幕,接应国手罕见黑脸,张籽萱太无辜

中国女排联赛现不和谐一幕,接应国手罕见黑脸,张籽萱太无辜

民哥台球解说
2026-02-01 19:48:16
美媒终于回过味,中国这哪是买石油,分明是在给俄进行“大换血”

美媒终于回过味,中国这哪是买石油,分明是在给俄进行“大换血”

讯崽侃天下
2026-02-01 16:55:16
没想到,李湘风波还没完,让她怀二胎的人竟因一个举动口碑暴涨!

没想到,李湘风波还没完,让她怀二胎的人竟因一个举动口碑暴涨!

五姑娘台球
2026-02-01 08:16:47
李湘暴雷,被英国相关部门调查,如果洗钱罪名坐实,下场会很惨

李湘暴雷,被英国相关部门调查,如果洗钱罪名坐实,下场会很惨

大双
2026-01-27 09:43:03
发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

发现个奇怪现象:电车没有“干掉”油车,却“干掉”了汽车修理厂

刘哥谈体育
2026-01-19 11:46:50
终于是时候了!2026老旧小区加梯新规,1楼6楼都支持,不用再吵了

终于是时候了!2026老旧小区加梯新规,1楼6楼都支持,不用再吵了

老特有话说
2026-01-30 23:03:43
回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

回顾探花大神:害人害己,多位女主被亲戚认出当场“社死”

就一点
2025-10-09 12:19:42
范晓萱上中国节目泄近况!网一看身影哭了惊呼:有大S影子

范晓萱上中国节目泄近况!网一看身影哭了惊呼:有大S影子

夏天笑眯眯
2026-02-01 16:17:09
高中数学能考到120分,物理考到70分,且不偏科,一本基本到手!

高中数学能考到120分,物理考到70分,且不偏科,一本基本到手!

好爸育儿
2026-02-01 15:38:47
内蒙古12盟市,通报孙绍骋被查

内蒙古12盟市,通报孙绍骋被查

上观新闻
2026-02-01 16:57:26
还有冷空气!最低-7℃!江苏发布最新天气预测

还有冷空气!最低-7℃!江苏发布最新天气预测

城市日历
2026-02-01 12:46:21
拿600万,全场3中0,昔日MVP沦为拖油瓶!球迷:结婚以后越来越软

拿600万,全场3中0,昔日MVP沦为拖油瓶!球迷:结婚以后越来越软

弄月公子
2026-01-31 22:53:36
有人说谭松韵长得还行,见了真人我才明白,这简直是美得无法低调

有人说谭松韵长得还行,见了真人我才明白,这简直是美得无法低调

TVB的四小花
2026-01-31 10:05:37
萝莉岛上拆解儿童高达吃肉,这事儿怎么洗?

萝莉岛上拆解儿童高达吃肉,这事儿怎么洗?

韬闻
2026-02-01 13:46:13
姚振华实名举报江苏官员,再次证明了一件事

姚振华实名举报江苏官员,再次证明了一件事

作家加野
2026-02-01 10:56:14
影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

影后辛芷蕾,这张照片摄影师得加鸡腿,抓拍的太到位了

徐帮阳
2025-12-23 18:33:38
2026-02-01 22:04:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12226文章数 142561关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

头条要闻

专家:美对伊朗提多个苛刻条件 伊朗若全答应等于投降

体育要闻

锁喉吃红牌+扇耳光 英超15人打群架

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

本地
健康
数码
手机
公开课

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

耳石症分类型,症状大不同

数码要闻

AMD Zen6规格泄露:CCD芯片面积仅约76平方毫米,核心数量提升50%

手机要闻

消息称一加16手机升级2亿像素长焦,有望支持微距功能

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版