网易首页 > 网易号 > 正文 申请入驻

刚刚,GPT-5 Pro自证全新数学定理!OpenAI总裁直呼颠覆,大佬们集体转发

0
分享至


新智元报道

编辑:定慧

【新智元导读】微软前AI副总裁兼杰出科学家Sebastien Bubeck发文表示GPT-5 Pro从零攻克了数学论文中的未解区间,这个发现让他大受震撼。该发现引得众多大佬转发,OpenAI总裁认为AI或将加速数学研究。

AI真的能解决人类的前沿问题吗?

比如类似庞加莱猜想、求解麦克斯韦方程、费马大定理、黎曼猜想等问题。

今天这个问题有了答案。

AI还真的可以!完全独立,不参考人类已有的任何方法。

昨晚,GPT-5 Pro可以从零开始完全求解一个复杂的数学问题。


并且再次强调,它没有使用任何人类此前的证明方法。

而它的答案比论文中的求解方法都要好。


不过值得人类庆幸的是,论文作者后面又提供了全新的方法超过了AI。

Sebastien Bubeck是OpenAI的研究工程师,此前曾担任微软人工智能副总裁兼杰出科学家。

他把一篇论文直接扔给了GPT-5 Pro。

这篇论文研究了一个非常自然的问题:在光滑凸优化中,梯度下降法的步长η满足什么条件时,迭代点所对应的函数值形成的曲线是凸的?


论文地址:https://arxiv.org/pdf/2503.10138v1

在论文的v1版本中,他们证明了如果η小于1/L(L为光滑度),则可以得到此属性。

如果η大于1.75/L,作者他们就构造了一个反例。

因此,未解决的问题是:在区间[1/L,1.75/L]内会发生什么情况。

首先,简单解释下这个问题。

梯度下降就像下山,每一步要选一个步长ηL可以理解成地形的「弯曲程度」(越大越陡/越敏感)。


论文不只关心「会不会往下走」(单调下降),还关心下降的轨迹是不是「凸」的:也就是每一步的进步幅度不会忽大忽小,不会「前面像平台、后面突然跳崖」。

这对何时停下来很有用——凸就表示越来越平稳,不会突然又大降。


Sebastien用GPT-5 Pro去攻这个未解决区间,模型把已知下限从1/L推进到1.5/L。

以下是GPT-5 Pro给出的证明。

虽然初看不明觉厉,但整体证明过程看起来非常优雅。


本来这个发现让Sebastien兴奋了好一阵,甚至想要直接发一篇arXiv论文。

但是,人类还是比AI快了一步。

论文原作者很快发了v2版本,彻底收尾,他们将阈值改写1.75/L

Sebastien认为这个发现依然非常令人鼓舞,为什么?AI不是并没有打败人类吗?

因为GPT-5 Pro在证明中,它试图证明的是1.5/L而不是1.75/L,这也表明GPT-5 Pro并没有直接去搜索v2版本。

另外,上述证明与v2的证明也非常不同,它更像是v1证明的一种演进。

这么看,现在的AI能力,不仅仅是博士级,很多时候都超过博士了。

这个发现也让很多大佬们表示,AI下一个可能改变和影响的就是数学领域。

在AI的帮助下,人类知识的边界将会再次被拓宽。


OpenAI的总裁Greg Brockman甚至表示这可能是AI在数学领域展现生命力的一种迹象。


此外,这次发现也和之前OpenAI官宣自己拿下IMO和IOI金牌不同。

这次攻破数学题的模型,就是面向用户的GPT-5 Pro版本,而不是内部推理模型。


Sebastien表示这个结论是经过自己25分钟验证。

作为前微软人工智能副总裁兼杰出科学家,他的证明应该没问题,看来AI确实实际证明了该数学问题。


GPT-5发布后虽然毁誉参半。

但是,GPT-5 Pro是真的达到,甚至超过了奥特曼所说的「博士级」AI。

虽然这次解决的问题还没有超过人类,但这种完全自主、自发现的能力苗头还是彰示了AI的能力。

这让我想起了流浪地球里的MOSS,也是自发现、自组织、自编程的AI。

Sebastien是一个很厉害的人。

他目前在OpenAI从事人工智能相关的工作。


在此之前,Sebastien曾担任微软的副总裁兼首席科学家,在微软研究院工作了10年(最初加入理论研究组)。

Sebastien还在普林斯顿大学担任了3年的助理教授。

在Sebastien的职业生涯的前15年里,他主要研究凸优化、在线算法以及机器学习中的对抗鲁棒性。

因这些研究工作多次获得最佳论文奖(包括STOC2023、NeurIPS2018和2021最佳论文奖、与微软研究院实习生合作获得的ALT2018和2023最佳学生论文奖、COLT2016最佳论文奖以及COLT2009最佳学生论文奖)。

他现在更加关注于理解智能是如何在大语言模型中涌现,以及如何利用这种理解来提升大语言模型的智能水平,可能最终实现通用人工智能(AGI)。

Sebastien们将这种方法称为「AGI物理学」,因为他试图从不同的尺度(参数、神经元、神经元组、层、数据课程等)揭示AI系统各部分如何协同工作,从而产生这些模型惊人且出人意料的行为。

看起来,像Sebastien这样的数学家、科学家们正在致力于尝试破解大模型的黑箱之谜。

希望AI在拓展人类认知边界的同时,人类也能破解大模型的秘密。

参考资料:

https://x.com/Sebastien%20Bubeck/status/1958198661139009862


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2500亿规模!“莆田羽绒服”横行,收割“伪中产”,网友:智商税

2500亿规模!“莆田羽绒服”横行,收割“伪中产”,网友:智商税

诗意世界
2025-11-13 10:33:59
1-3落后逆转!刘诗雯再入混双决赛登热搜 笑容满面球迷看台狂欢呼

1-3落后逆转!刘诗雯再入混双决赛登热搜 笑容满面球迷看台狂欢呼

颜小白的篮球梦
2025-11-13 12:21:18
长期吃酸菜,到底会不会致癌?好多人还不知道,建议看完再吃!

长期吃酸菜,到底会不会致癌?好多人还不知道,建议看完再吃!

简食记工作号
2025-11-14 00:12:24
保罗乔治妻子庆祝生日 晒与多位NBA太太合照!众多美女中身材超赞

保罗乔治妻子庆祝生日 晒与多位NBA太太合照!众多美女中身材超赞

Emily说个球
2025-11-13 16:24:06
香港电影金像奖停办预示香港电影要完?

香港电影金像奖停办预示香港电影要完?

港剧叔
2025-11-13 09:28:53
斯诺克最新战报!世界冠军被罚16分,肖国栋单局逆转,追到2-2!

斯诺克最新战报!世界冠军被罚16分,肖国栋单局逆转,追到2-2!

刘姚尧的文字城堡
2025-11-14 00:09:05
我招待老乡一周花11万,走时他们只字不提,一周后律师敲响我家门

我招待老乡一周花11万,走时他们只字不提,一周后律师敲响我家门

牛魔王与芭蕉扇
2025-10-15 17:15:08
超简单的长寿秘诀:晨起4件事,血管最喜欢

超简单的长寿秘诀:晨起4件事,血管最喜欢

猫大夫医学科普
2025-11-11 06:49:24
美国科学家研制出超级合金,能够承受核聚变产生的类似太阳的高温

美国科学家研制出超级合金,能够承受核聚变产生的类似太阳的高温

Thurman在昆明
2025-11-14 00:33:52
人类对“暖气片”的开发不足1%!6个隐藏用法,第一个就惊呆我

人类对“暖气片”的开发不足1%!6个隐藏用法,第一个就惊呆我

美家指南
2025-11-12 15:50:49
遭遇全国性的灾难,美国大手一挥,就给菲律宾捐了一笔的“巨款”

遭遇全国性的灾难,美国大手一挥,就给菲律宾捐了一笔的“巨款”

扶苏聊历史
2025-11-13 11:44:25
郑丽文惨遭迫害,赖清德玩阴的,中央政府雷霆出击,力挽狂澜

郑丽文惨遭迫害,赖清德玩阴的,中央政府雷霆出击,力挽狂澜

小影的娱乐
2025-10-24 06:24:47
千万别成下一个大S,33岁迪丽热巴曝病情,令人担心的事不止一件

千万别成下一个大S,33岁迪丽热巴曝病情,令人担心的事不止一件

七阿姨爱八卦
2025-11-13 16:33:31
火箭慌不慌!伊森53.1%三分命中率封神,这合同给少了真留不住

火箭慌不慌!伊森53.1%三分命中率封神,这合同给少了真留不住

篮球小布丁
2025-11-14 03:35:29
你敢扣,我早有后手!法国海关戴高乐机场扣二十万从中国寄来包裹

你敢扣,我早有后手!法国海关戴高乐机场扣二十万从中国寄来包裹

南权先生
2025-11-13 15:56:26
65岁大爷娶38岁寡妇,寡妇什么都不要,新婚夜却提了一个要求

65岁大爷娶38岁寡妇,寡妇什么都不要,新婚夜却提了一个要求

清茶浅谈
2025-04-04 00:16:32
传播煽动分裂国家言论,充当“台独”打手帮凶 起底台湾网红温子渝陈柏源

传播煽动分裂国家言论,充当“台独”打手帮凶 起底台湾网红温子渝陈柏源

上游新闻
2025-11-13 15:19:04
明明同一人,演完《人世间》演《唐朝诡事录3》,换上古装没认出

明明同一人,演完《人世间》演《唐朝诡事录3》,换上古装没认出

娱君坠星河
2025-11-13 15:16:11
开车时嘴里叼牙线棒被处罚 宜兴交管部门:原认定确有不当,已依法撤销

开车时嘴里叼牙线棒被处罚 宜兴交管部门:原认定确有不当,已依法撤销

环球网资讯
2025-11-12 22:47:15
外国智库:若大陆武力攻台,朝鲜或进行低烈度支援

外国智库:若大陆武力攻台,朝鲜或进行低烈度支援

止戈军是我
2025-11-13 22:21:19
2025-11-14 04:56:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13860文章数 66246关注度
往期回顾 全部

科技要闻

月产能突破百万片,中芯国际Q3净利增43.1%

头条要闻

高市早苗扯着眼皮诉苦:我现在每天只睡2小时

头条要闻

高市早苗扯着眼皮诉苦:我现在每天只睡2小时

体育要闻

跟豪门传了十年绯闻,他却偏要“择一队终老”

娱乐要闻

王鹤棣孟子义真要搭?

财经要闻

源峰25亿赌局!汉堡王中国"卖身"求生

汽车要闻

具备高阶辅助驾驶功能 欧拉5预售价10.98万起

态度原创

家居
手机
游戏
数码
军事航空

家居要闻

莫奈时间 重构先锋概念

手机要闻

澎湃OS 3第三批推送:小米14、REDMI K70系列全覆盖,你收到了吗

Steam 主机官宣!《天国:拯救 2》销量突破 400 万

数码要闻

三星 Galaxy Book6 Pro 成绩又现,确认 X7 358H 搭载 B390 核显

军事要闻

美国在委内瑞拉海岸动用无人机和F-35

无障碍浏览 进入关怀版