网易首页 > 网易号 > 正文 申请入驻

前两天刚被群嘲,ChatGPT转头就解决了一个数学难题

0
分享至



机器之心报道

编辑:Panda

前些天,OpenAI 研究员宣称 GPT-5 「发现」了 10 个悬赏数学难题的解决方法,舆论误以为是 GPT-5 给出了解题方法,结果被发现只是检索到了早已存在的文献,引发了学界大佬的群嘲以及对于 AI 领域夸大宣传和 AI 检索能力的激烈讨论。参阅报道《OpenAI「解决」10 道数学难题?哈萨比斯直呼「尴尬」,LeCun 辛辣点评》。

然而,讽刺的是,当人们还在辩论 AI 是不是一个合格的「文献检索员」时,真正的数学发现已经悄然发生。

AI 取得研究突破

加州大学洛杉矶分校(UCLA)数学教授 Ernest Ryu 发推称:「我使用 ChatGPT 解决了凸优化中的一个未曾被解决的问题。」



随后,他通过一系列推文介绍了自己与 ChatGPT 的联合成果。

首先来看一下他所研究的问题本身:



呃,看不懂,但我们可以让 AI 来帮助我们理解(AI 再立大功!):

这个数学问题探讨的是一个在最优化理论中非常著名的动态系统,我们可以用一个生动的物理比喻来理解它:一个球在碗里的滚动过程。在这个比喻中,被称为「凸函数」的 f 就代表一个形状完美的碗,它内部光滑,从碗边到碗底的坡度是逐渐下降的,没有任何凹陷或小山丘。这个碗的碗底可能是一个尖锐的点,也可能是一片宽广的平坦区域,这片最低的区域在数学上被称为 argmin f。而 X (t) 则描述了在时间 t 时,一个球在这个碗中所处的位置。截图中的那个核心微分方程,Ẍ(t) + (3/t)Ẋ(t) + ∇f (X (t)) = 0,就是控制这个球如何滚动的「物理定律」。其中,∇f (X (t)) 扮演了「重力」的角色,时刻将球往坡度最陡峭的下方拉扯;而 (3/t)Ẋ(t) 则是一个非常特殊的「摩擦力」,它的奇特之处在于会随着时间的流逝而逐渐减弱。一开始摩擦力很强,能有效减速,但随着时间 t 变得越来越大,这个摩擦效应会变得越来越微弱。整个问题就是从碗壁的某个初始位置 X₀ 将球从静止状态释放,然后观察它在这套独特的物理规则下将如何运动。

这个问题的真正核心与挑战,在于需要严格证明:这个滚动的球最终不仅会到达碗底,而且会完全静止在碗底的某一个确切的点上。表面上看,这似乎是理所当然的,但在数学上却是一个深刻的难题。数学家们早已证明,球的「高度」 f (X (t)) 随着时间的推移,必然会无限趋近于碗底的最低高度。换言之,我们 100% 确定这个球最终会进入碗底的最低区域,而不会停在半山腰。但这仅仅是「函数值收敛」。真正的「悬而未决的难题」在于球的「位置」 X (t) 是否也会收敛。如果碗底是一个宽广的平坦区域,球在到达这个区域后,会不会因为惯性而永无止境地滑行、振荡或者兜圈子,就像一个陀螺在光滑的地面上不停旋转一样?这个问题要求证明,恰恰是由于那个 3/t 的特殊时变摩擦力,它能以一种恰到好处的方式耗尽球的所有动能,最终引导它停泊在一个固定的位置上,而不是在最低能量状态下进行永恒的漂移。这在很长一段时间里都是一个吸引了众多研究的公开问题,因为它触及了优化算法收敛性理论的基石。

下面则是 ChatGPT 的证明,但也经过了 Ernest Ryu 教授的整理:





他也分享了原始的交互记录:https://chatgpt.com/share/68f805f2-b8fc-8010-8df6-20a46bc1df44

从这份记录可以看到,他使用的模型是 GPT-5 Pro,而该模型为该问题执行了 22 分钟的推理。



同样,AI 基于此给出的分析是:Nesterov ODE (常微分方程) 的解 X (t) 最终会收敛到函数 f 的某一个最小值点 X∞。

我们也能在证明中看到 z₁ 和 z₂ 距离为 0,意味着这两者必须是同一个点。这与最初「假设存在两个不同的点」相矛盾。因此,最初的假设是错误的,所以这个球只能停在一个点上。

Ernest Ryu 还介绍了自己的历程和想法:「我的反应:ChatGPT 确实有效地加速了我的进度。这项工作花了大约 12 个小时,分 3 天进行。现在回想起来,证明过程其实很简单。」

他继续介绍说:「但我尝试了许多其他策略,但都没有成功,而 ChatGPT 至关重要地帮助我快速探索并消除了这些死胡同。此外,关键的成功步骤也是由 ChatGPT 提出的。

不过他也指出,ChatGPT 的成功并不是一蹴而就的:「ChatGPT 并非一次性给出证明。整个过程高度互动。它提出了许多论点,其中大约 80% 都是错误的。但有些想法对我来说确实很新颖。每当我意识到一个新奇的想法,无论正确与否,我都会提炼出其中的关键洞见,并促使 ChatGPT 对其进行进一步的开发。」

Ryu 还总结了自己与 ChatGPT 各自的贡献:



最后,他指出:「在我看来,这个结果已经可以在权威的优化理论期刊上发表。不过,我还想进一步完善它。」未来他还计划将该证明泛化到 r>0 的 ODE 以及尝试「将这个论证转化为证明离散时间对应方法(即 Nesterov 加速梯度法)的收敛性」。

他总结说:「ChatGPT 现在已经处于能解决一些数学研究问题的水平,但确实需要一位专家来指导它。

有意思的是,他提到自己研究过程中最大的障碍是「用完 ChatGPT Pro 查询」,而他使用的已经是「昂贵的 Pro 计划」,只能等下个月刷新了。

当然,这是个相当不错的宣传机会,已经有 OpenAI 工作人员联系他,并提供了更多积分。



AI 成为论文第一作者

无独有偶,加州大学欧文分校(UCI)数学教授 Paata Ivanisvili 前些时日也宣称 GPT-5 Pro 助其发现了一个命题的反例。



更有趣的是,他刚刚还宣布要将 ChatGPT 列为他这篇论文的合著者,并且还是第一作者



当然,这早已不是 AI 首次以作者身份登上严肃的学术论文,早在 2023 年 ChatGPT 就已经当作论文第三作者,参阅报道《一位论文作者火了,ChatGPT 等大型语言模型何时能成为论文合著者?》不过,值得注意的是,该论文的最新版本的作者名单中已经没有 ChatGPT 的身影。



2023 年的截图,现如今该论文的作者名单中已经没有 ChatGPT

AI 辅助证明,成为第二作者

而在前些天的所谓「OpenAI『解决〗10 道数学难题?」事件之后,有两位人类研究者遭遇了类似的尴尬。他们在宣布成功解决了 #707 Erdos 问题之后发现这个问题其实 30 年前就已经被解决了!

不过他们也并未止步于此,而是继续让 GPT-5 编写了一个 Lean 形式化证明,并成功进行了验证。当然,他们也强调了专家指导和反馈的重要性。

总之,我们看到,在其论文的作者列表中,ChatGPT 与 Lean 都跻身其中。



当然,将 AI 列为论文作者的做法依然存在巨大争议。









结语

顺带一提,在前述相关推文的评论区,我们也能看到其它一些使用 AI 取得研究进展的信息:



Ernest Ryu 教授的故事,连同其他研究者的经历,共同揭示了一个正在到来的新时代:AI 或许不再仅仅是工具,它正在成为研究伙伴

这意味着,未来顶尖的科研,或许将不再是单打独斗的英雄主义,而是人类专家与强大 AI 之间的深度对话与协作。

那么,屏幕前的你呢?你有在自己的研究工作中使用 AI 吗?体验如何?欢迎分享你的故事。

https://x.com/ErnestRyu/status/1980759528984686715

https://x.com/PI010101/status/1981014478969033156

https://x.com/goldstein_aa/status/1981034927266083203

https://x.com/SebastienBubeck/status/1980804267524116569

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
价格飙涨6000%!原研药集体撤离中国的影响,开始出现了...

价格飙涨6000%!原研药集体撤离中国的影响,开始出现了...

牛锅巴小钒
2026-03-21 19:20:35
10 位翻车的科技人员!涉核工业、导弹、歼击机等领域,能力不再是护身符

10 位翻车的科技人员!涉核工业、导弹、歼击机等领域,能力不再是护身符

风向观察
2026-03-21 14:12:53
刚到越南,我就被恶心到了,远比想象的恶心百倍,不能直视

刚到越南,我就被恶心到了,远比想象的恶心百倍,不能直视

番外行
2026-03-22 00:05:09
后续!壶口瀑布事件:景区已上门道歉,内部在查投诉人,网友辣评

后续!壶口瀑布事件:景区已上门道歉,内部在查投诉人,网友辣评

奇思妙想草叶君
2026-03-21 20:56:23
医保新规4月1日执行,1965-1985年人群注意,6项操作越早办越好!

医保新规4月1日执行,1965-1985年人群注意,6项操作越早办越好!

另子维爱读史
2026-03-20 22:25:31
人贩子“梅姨”落网,和画像判若两人,她拐卖孩子的数量能判死刑

人贩子“梅姨”落网,和画像判若两人,她拐卖孩子的数量能判死刑

汉史趣闻
2026-03-21 20:38:28
一票否决!欧盟内部集体暴怒,德国总理当场发话:这事没完

一票否决!欧盟内部集体暴怒,德国总理当场发话:这事没完

策略述
2026-03-21 14:58:28
岛国40+现役熟女天花板盘点,魅力无人能挡,你最爱谁?

岛国40+现役熟女天花板盘点,魅力无人能挡,你最爱谁?

碧波万览
2026-03-22 01:34:51
3月使劲吃这菜,一助消化,二安神,三润肺,四健脾胃,错过可惜

3月使劲吃这菜,一助消化,二安神,三润肺,四健脾胃,错过可惜

阿龙美食记
2026-03-07 12:52:40
李梓萌,私生活传闻太荒唐

李梓萌,私生活传闻太荒唐

做一个合格的吃瓜群众
2026-03-21 19:20:55
销售帮男子摇中“贵A·A88888”顶级“豹子号”车牌,两人激动到当场大喊,网友直呼:黄金右手

销售帮男子摇中“贵A·A88888”顶级“豹子号”车牌,两人激动到当场大喊,网友直呼:黄金右手

极目新闻
2026-03-21 19:30:27
上海德云社开业三天被举报,只因社门口放了一大蒜形状的咖啡杯子

上海德云社开业三天被举报,只因社门口放了一大蒜形状的咖啡杯子

蜜桔娱乐
2026-03-21 09:37:34
太恶劣!来沪王某(女,00后)被判刑,被捕后毫无悔意,“为啥非揪着我不放”

太恶劣!来沪王某(女,00后)被判刑,被捕后毫无悔意,“为啥非揪着我不放”

环球网资讯
2026-03-21 16:29:13
后续来了!壶口瀑布景区已致歉,但网友却为何不买账?

后续来了!壶口瀑布景区已致歉,但网友却为何不买账?

哄动一时啊
2026-03-21 11:48:24
鹿晗关晓彤齐登热搜榜,百万大V爆料分手内幕,女方已开始新恋情

鹿晗关晓彤齐登热搜榜,百万大V爆料分手内幕,女方已开始新恋情

潮鹿逐梦
2026-03-21 19:36:49
我发现,杠精基本上都是穷人

我发现,杠精基本上都是穷人

洞见
2026-03-20 12:38:11
“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

“这次穿得算保守了”,女老师短裙配蕾丝袜,学生上课头都不敢抬

妍妍教育日记
2026-03-21 10:05:03
女儿相中599元的鞋,娘仨在店门口纠结半小时咬牙买下,母亲回应:女儿很懂事,旧鞋已穿到开胶,如果不买会很愧疚

女儿相中599元的鞋,娘仨在店门口纠结半小时咬牙买下,母亲回应:女儿很懂事,旧鞋已穿到开胶,如果不买会很愧疚

扬子晚报
2026-03-21 17:07:50
很多人把社保卡金融账户激活后就放在一边,却不知道它还能怎么用

很多人把社保卡金融账户激活后就放在一边,却不知道它还能怎么用

智慧生活笔记
2026-03-22 01:15:31
以色列迪莫纳被伊朗导弹“直接击中” 附近有敏感核设施

以色列迪莫纳被伊朗导弹“直接击中” 附近有敏感核设施

新华社
2026-03-22 02:48:03
2026-03-22 07:23:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12555文章数 142590关注度
往期回顾 全部

科技要闻

宇树招股书拆解,人形机器人出货量第一!

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

头条要闻

伊朗发射3800公里射程的导弹 最令美军战栗的细节披露

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

通胀警报拉响,加息潮要来了?

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

游戏
手机
家居
数码
艺术

魔兽世界:时光服P3阶段将至,新手该练什么职业,这个很重要!

手机要闻

鸿蒙最强旗舰!华为首款风扇手机下周开卖:麒麟9030 Pro性能全开

家居要闻

时空交织 空间绮梦

数码要闻

炸锅!国产存储芯片再突破!手机固态价格大跳水,内存自由要来了

艺术要闻

你的母校在吗?毛主席亲笔题名的 20 所大学合集

无障碍浏览 进入关怀版