网易首页 > 网易号 > 正文 申请入驻

前两天刚被群嘲,ChatGPT转头就解决了一个数学难题

0
分享至



机器之心报道

编辑:Panda

前些天,OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲以及对于 AI 领域夸大宣传和 AI 检索能力的激烈讨论。参阅报道《OpenAI「解决」10 道数学难题?哈萨比斯直呼「尴尬」,LeCun 辛辣点评》。

然而,讽刺的是,当人们还在辩论 AI 是不是一个合格的「文献检索员」时,真正的数学发现已经悄然发生。

AI 取得研究突破

加州大学洛杉矶分校(UCLA)数学教授 Ernest Ryu 发推称:「我使用 ChatGPT 解决了凸优化中的一个未曾被解决的问题。」



随后,他通过一系列推文介绍了自己与 ChatGPT 的联合成果。

首先来看一下他所研究的问题本身:



呃,看不懂,但我们可以让 AI 来帮助我们理解(AI 再立大功!):

这个数学问题探讨的是一个在最优化理论中非常著名的动态系统,我们可以用一个生动的物理比喻来理解它:一个球在碗里的滚动过程。在这个比喻中,被称为「凸函数」的 f 就代表一个形状完美的碗,它内部光滑,从碗边到碗底的坡度是逐渐下降的,没有任何凹陷或小山丘。这个碗的碗底可能是一个尖锐的点,也可能是一片宽广的平坦区域,这片最低的区域在数学上被称为 argmin f。而 X (t) 则描述了在时间 t 时,一个球在这个碗中所处的位置。截图中的那个核心微分方程,Ẍ(t) + (3/t)Ẋ(t) + ∇f (X (t)) = 0,就是控制这个球如何滚动的「物理定律」。其中,∇f (X (t)) 扮演了「重力」的角色,时刻将球往坡度最陡峭的下方拉扯;而 (3/t)Ẋ(t) 则是一个非常特殊的「摩擦力」,它的奇特之处在于会随着时间的流逝而逐渐减弱。一开始摩擦力很强,能有效减速,但随着时间 t 变得越来越大,这个摩擦效应会变得越来越微弱。整个问题就是从碗壁的某个初始位置 X₀ 将球从静止状态释放,然后观察它在这套独特的物理规则下将如何运动。

这个问题的真正核心与挑战,在于需要严格证明:这个滚动的球最终不仅会到达碗底,而且会完全静止在碗底的某一个确切的点上。表面上看,这似乎是理所当然的,但在数学上却是一个深刻的难题。数学家们早已证明,球的「高度」 f (X (t)) 随着时间的推移,必然会无限趋近于碗底的最低高度。换言之,我们 100% 确定这个球最终会进入碗底的最低区域,而不会停在半山腰。但这仅仅是「函数值收敛」。真正的「悬而未决的难题」在于球的「位置」 X (t) 是否也会收敛。如果碗底是一个宽广的平坦区域,球在到达这个区域后,会不会因为惯性而永无止境地滑行、振荡或者兜圈子,就像一个陀螺在光滑的地面上不停旋转一样?这个问题要求证明,恰恰是由于那个 3/t 的特殊时变摩擦力,它能以一种恰到好处的方式耗尽球的所有动能,最终引导它停泊在一个固定的位置上,而不是在最低能量状态下进行永恒的漂移。这在很长一段时间里都是一个吸引了众多研究的公开问题,因为它触及了优化算法收敛性理论的基石。

下面则是 ChatGPT 的证明,但也经过了 Ernest Ryu 教授的整理:





他也分享了原始的交互记录:https://chatgpt.com/share/68f805f2-b8fc-8010-8df6-20a46bc1df44

从这份记录可以看到,他使用的模型是 GPT-5 Pro,而该模型为该问题执行了 22 分钟的推理。



同样,AI 基于此给出的分析是:Nesterov ODE (常微分方程) 的解 X (t) 最终会收敛到函数 f 的某一个最小值点 X∞。

我们也能在证明中看到 z₁ 和 z₂ 距离为 0,意味着这两者必须是同一个点。这与最初「假设存在两个不同的点」相矛盾。因此,最初的假设是错误的,所以这个球只能停在一个点上。

Ernest Ryu 还介绍了自己的历程和想法:「我的反应:ChatGPT 确实有效地加速了我的进度。这项工作花了大约 12 个小时,分 3 天进行。现在回想起来,证明过程其实很简单。」

他继续介绍说:「但我尝试了许多其他策略,但都没有成功,而 ChatGPT 至关重要地帮助我快速探索并消除了这些死胡同。此外,关键的成功步骤也是由 ChatGPT 提出的。

不过他也指出,ChatGPT 的成功并不是一蹴而就的:「ChatGPT 并非一次性给出证明。整个过程高度互动。它提出了许多论点,其中大约 80% 都是错误的。但有些想法对我来说确实很新颖。每当我意识到一个新奇的想法,无论正确与否,我都会提炼出其中的关键洞见,并促使 ChatGPT 对其进行进一步的开发。」

Ryu 还总结了自己与 ChatGPT 各自的贡献:



最后,他指出:「在我看来,这个结果已经可以在权威的优化理论期刊上发表。不过,我还想进一步完善它。」未来他还计划将该证明泛化到 r>0 的 ODE 以及尝试「将这个论证转化为证明离散时间对应方法(即 Nesterov 加速梯度法)的收敛性」。

他总结说:「ChatGPT 现在已经处于能解决一些数学研究问题的水平,但确实需要一位专家来指导它。

有意思的是,他提到自己研究过程中最大的障碍是「用完 ChatGPT Pro 查询」,而他使用的已经是「昂贵的 Pro 计划」,只能等下个月刷新了。

当然,这是个相当不错的宣传机会,已经有 OpenAI 工作人员联系他,并提供了更多积分。



AI 成为论文第一作者

无独有偶,加州大学欧文分校(UCI)数学教授 Paata Ivanisvili 前些时日也宣称 GPT-5 Pro 助其发现了一个命题的反例。



更有趣的是,他刚刚还宣布要将 ChatGPT 列为他这篇论文的合著者,并且还是第一作者



当然,这早已不是 AI 首次以作者身份登上严肃的学术论文,早在 2023 年 ChatGPT 就已经当作论文第三作者,参阅报道《一位论文作者火了,ChatGPT 等大型语言模型何时能成为论文合著者?》不过,值得注意的是,该论文的最新版本的作者名单中已经没有 ChatGPT 的身影。



2023 年的截图,现如今该论文的作者名单中已经没有 ChatGPT

AI 辅助证明,成为第二作者

而在前些天的所谓「OpenAI『解决〗10 道数学难题?」事件之后,有两位人类研究者遭遇了类似的尴尬。他们在宣布成功解决了 #707 Erdos 问题之后发现这个问题其实 30 年前就已经被解决了!

不过他们也并未止步于此,而是继续让 GPT-5 编写了一个 Lean 形式化证明,并成功进行了验证。当然,他们也强调了专家指导和反馈的重要性。

总之,我们看到,在其论文的作者列表中,ChatGPT 与 Lean 都跻身其中。



当然,将 AI 列为论文作者的做法依然存在巨大争议。









结语

顺带一提,在前述相关推文的评论区,我们也能看到其它一些使用 AI 取得研究进展的信息:



Ernest Ryu 教授的故事,连同其他研究者的经历,共同揭示了一个正在到来的新时代:AI 或许不再仅仅是工具,它正在成为研究伙伴

这意味着,未来顶尖的科研,或许将不再是单打独斗的英雄主义,而是人类专家与强大 AI 之间的深度对话与协作。

那么,屏幕前的你呢?你有在自己的研究工作中使用 AI 吗?体验如何?欢迎分享你的故事。

https://x.com/ErnestRyu/status/1980759528984686715

https://x.com/PI010101/status/1981014478969033156

https://x.com/goldstein_aa/status/1981034927266083203

https://x.com/SebastienBubeck/status/1980804267524116569

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内蒙古黑老大易连峰,酒店调戏游玩女子,不料惹到大人物就此覆灭

内蒙古黑老大易连峰,酒店调戏游玩女子,不料惹到大人物就此覆灭

青青会讲故事
2024-10-10 17:09:30
曹操墓前堆成山的布洛芬,是这届年轻人最野的"历史梗"

曹操墓前堆成山的布洛芬,是这届年轻人最野的"历史梗"

小豫讲故事
2025-10-27 11:50:08
上海老人地铁强行坐女生腿上,他还不知道自己捅了多大篓子!

上海老人地铁强行坐女生腿上,他还不知道自己捅了多大篓子!

娱乐圈的笔娱君
2025-11-02 14:40:50
三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

封面新闻
2025-11-02 12:57:02
男单决赛对阵!奥运亚军4:1晋级决赛,战胜过王楚钦,与日本争冠

男单决赛对阵!奥运亚军4:1晋级决赛,战胜过王楚钦,与日本争冠

国乒二三事
2025-11-02 21:29:16
许世友正喝酒来电话,问:我是上将许世友你是谁?答:小兵周恩来

许世友正喝酒来电话,问:我是上将许世友你是谁?答:小兵周恩来

良工说
2025-09-04 00:53:34
蒋万安手腕够绝:上午与郑丽文握手发通稿,下午便端坐其对面

蒋万安手腕够绝:上午与郑丽文握手发通稿,下午便端坐其对面

蛙斯基娱乐中
2025-10-27 00:27:29
詹姆斯祝贺!道奇4-3蓝鸟夺世界大赛第9冠 日本山本由伸MVP

詹姆斯祝贺!道奇4-3蓝鸟夺世界大赛第9冠 日本山本由伸MVP

醉卧浮生
2025-11-02 13:17:10
世体:恩德里克本赛季首次为皇马出战,但仍将在冬窗租借离队

世体:恩德里克本赛季首次为皇马出战,但仍将在冬窗租借离队

懂球帝
2025-11-02 22:55:03
北京金鼎轩一根油条卖39元?工作人员称“个头大够两人吃”,市监局回应

北京金鼎轩一根油条卖39元?工作人员称“个头大够两人吃”,市监局回应

大峰
2025-11-02 10:27:19
饶漱石在华野没有职务,淮海战前,为何被称作“华野全军政委”?

饶漱石在华野没有职务,淮海战前,为何被称作“华野全军政委”?

春秋砚
2025-11-02 18:00:03
耳光大赛中被KO+陷入昏迷!中国武术大师颧骨骨裂缝5针 还要打5场

耳光大赛中被KO+陷入昏迷!中国武术大师颧骨骨裂缝5针 还要打5场

风过乡
2025-11-02 09:37:26
“会打扮”和“不会打扮”的地铁奶奶:差别有多大?看对比就知道

“会打扮”和“不会打扮”的地铁奶奶:差别有多大?看对比就知道

白宸侃片
2025-10-27 00:26:08
美国人:中国在空间站造出稀有金属,才解决了六代机航发大难题?

美国人:中国在空间站造出稀有金属,才解决了六代机航发大难题?

Thurman在昆明
2025-11-02 01:10:37
看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

看哭了!舅舅18岁开始抚养三个外甥,九年时间感动全网!

晓踏就是我
2025-11-02 16:55:18
何祚庥:我对核聚变研究的质疑,就是向杨振宁先生这样的先贤学习

何祚庥:我对核聚变研究的质疑,就是向杨振宁先生这样的先贤学习

怀疑探索者
2025-11-02 21:29:01
又一则励志新闻翻车了!

又一则励志新闻翻车了!

清书先生
2025-10-21 15:51:40
一字之差,从总指挥长到指挥长,我国载人航天发射发生了哪些变化

一字之差,从总指挥长到指挥长,我国载人航天发射发生了哪些变化

Thurman在昆明
2025-11-01 14:44:54
俄乌冲突迎来大结局?最大罪人已浮现,泽连斯基终于等来美方信号

俄乌冲突迎来大结局?最大罪人已浮现,泽连斯基终于等来美方信号

健身狂人
2025-10-31 14:55:35
市监局办公室副主任周日值班当天猝死不予认定工伤,家属起诉人社局、县政府 法院判了

市监局办公室副主任周日值班当天猝死不予认定工伤,家属起诉人社局、县政府 法院判了

红星新闻
2025-10-07 21:50:15
2025-11-03 00:27:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11617文章数 142497关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

和章泽天出席会议被抓拍 刘强东发文调侃称"没了自信"

头条要闻

和章泽天出席会议被抓拍 刘强东发文调侃称"没了自信"

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

亲子
旅游
教育
本地
公开课

亲子要闻

宝蓝跟爸爸赛玩 “卖冰淇淋”,看谁卖得更多~

旅游要闻

“诗和远方”并不远!青海·海西生态旅游宣传推介会走进广州

教育要闻

当海岛遇上诗教,不妨做一个诗歌岛上的原住民 | 与你共读

本地新闻

全网围观,到底多少人被这个野人大学生笑疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版