网易首页 > 网易号 > 正文 申请入驻

菲尔兹奖得主0贡献!GPT-5.5 Pro两小时跑出博士级证明

0
分享至


新智元报道

编辑:桃子

【新智元导读】全网震撼!菲尔兹奖得主把未解数学题扔给GPT-5.5 Pro,不到两小时拿到博士论文级证明。整个过程中,他没给出任何数学思路。

今天,菲尔兹奖得主Timothy Gowers在个人博客上发了一篇长文——

最近一次使用ChatGPT 5.5 Pro的体验

标题平平无奇,内容却让整个数学圈坐不住了。


文中,他亲手验证了一个令整个数学界不寒而栗的事实:

GPT-5.5 Pro,用了不到两个小时,独立完成了一项博士论文级别的数学研究。

而Gowers本人在整个过程中,数学贡献几乎为0


两个小时,一章博士论文级成果。


全程2小时,菲尔兹奖得主贡献为0

事情是这样的。

这几天,Timothy Gowers拿到了ChatGPT 5.5 Pro的测试权限,决定搞一次真刀真枪的测试。

他从数学家Melvyn Nathanson的一篇新论文中,挑出了几个关于加法数论中集合求和的未解问题。


这些问题的核心是:给定一个k个整数的集合A,它的h重求和集hA的可能大小有哪些?

要实现特定大小的求和集,集合的「直径」最小能是多少?


Nathanson自己给出了一个指数级的上界:2^k - 1。

于是,Gowers把问题扔给了GPT-5.5 Pro。17分钟05秒后,AI给出了一个构造,直接把上界从指数级干到了二次方级。

而这,显然已经是最优的了。

更让人坐不住的,是Gowers在整个过程中扮演的角色。

他没有给出任何数学思路,没有提供关键引理,更没有指出证明方向,

Gowers只是充当了一个「情绪价值提供者」和「排版助手」,给出的提示词极其简单——

对,这个想法不错,试试看能不能成;

把这段推导写成标准的LaTeX论文格式。


博客中,Gowers在反复强调:提示词「不包含任何数学输入」。

AI走的每一步推理、每一个构造、每一处关键转折,都是它自己想出来的。

仅用了几个小时,AI就完成了人类可能需要数月,甚至数年才能完成的工作。

换句话说,人类顶级数学家在这场合作中的智力贡献,约等于0。

AI给出原创想法,震惊MIT博士生

如果故事到这里就结束了,那顶多算是「AI又解了一道数学题」。

但后面发生的事情,才真正让人细思极恐。

Gowers继续追问ChatGPT:那一般情况的h呢?这个问题的难度陡然上升。

因为当h=2的时候,数学家们已完全搞清了所有可能的求和集大小。但对于一般的h,甚至不知道完整的答案是什么。

此前,MIT博士生Isaac Rajagopal已经证明了一个指数级的上界。


Gowers于是让GPT去看看能不能改进拉Rajagopal的结果。

第一轮GPT思考了16分41秒,把上界从k的指数级改进到了k^(1/2+ε)的指数级。

这是对拉Rajagopal工作的「常规修改」。

第二轮Gowers说,能不能再进一步,搞到多项式级?

GPT思考了13分33秒,表示「有戏」,但需要验证两个技术性命题。

Gowers让它自己验证,9分12秒后,GPT完成了验证,并在随后的31分40秒内写出了完整的预印本论文。


论文地址:https://drive.google.com/file/d/1IkJBcWYz_3J_QGsESBmMa-jrEHAJDcJB/view

最终结果:N(h,k) ≤ O(k^{10h³})——从指数级,直接跃升到多项式级。


Rajagopal本人看完后,给出了一个让人五味杂陈的评价:

ChatGPT这个想法很原创、很巧妙。如果是我自己想出来的,我会非常骄傲。

然而,我需要一两周才能完成的脑力风暴,GPT只用了不到一个小时。


更重磅的是,Rajagopal详细分析了GPT的核心创新——

它使用了h²-耗散集(h²-dissociated sets)来控制h阶以下的关系。「这个思路,据我所知,完全是原创的」。

不得不说,当一个MIT学生用「我会为这个想法感到骄傲」来评价一个AI的数学证明时,某种范式转移已经悄然发生了。

顶级数学家警告:危机来了

菲尔兹奖得主Gowers没有停留在「ChatGPT很厉害」的层面,他直接把话题拉到了最尖锐的问题:

博士生怎么办?

这才是这篇博客真正的重量级炸弹。


在组合数学领域,有大量论文会提出一系列新的组合参数,并附带一串未解问题。

这些问题通常不是特别难,它们的价值在于给初入科研的学生提供一个「可以攻克的目标」,让他们在解决一个「正式的开放问题」中获得信心和成就感。

但现在,这条路被AI截断了。Gowers的原话说得很直白:

过去,只要有人提出问题就够了。

但现在,仅仅被提出是不够的,它还必须足够难,难到LLM解决不了。



2026年至今,已有15个Erdős开放问题被解决,其中11个明确标注了AI的贡献。

就在几周前,一个23岁、没有高等数学学位的年轻人Liam Price,用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的Erdős问题。

菲尔兹奖得主陶哲轩亲自验证了这个证明,并将其扩展为一个新理论的起点。


过去需要数年训练才能达到的研究能力门槛,正在被AI一夜之间碾平。

Gowers直言,「若是AI在数学领域以目前这个速度发展下去,那么我们将很快面临一场危机」。


对此,OpenAI研究员Sebastien Bubeck深表赞同。


但也有人冷静指出:这只是一次实验,不能过度外推。Nathanson的问题虽然是开放问题,但难度未必代表数学前沿的天花板。

Gowers自己也承认,他「没有完整答案」,只是在记录自己的经历。

过去两年,类似的「AI攻克数学」叙事出现过好几次,仔细看都会发现具体条件限制不少。

但这一次,说话的人是菲尔兹奖得主,他的判断标准不需要额外背书。


AI数学加速度,已不可逆转

把时间线拉长一点就会发现,AI在数学领域的进步曲线几乎是垂直的。

2023年,GPT-4做不了大多数本科数学题;2024年,o1在数学竞赛中拿到了金牌水平;2025年,o3在前沿研究中开始展现推理能力。


2026年5月,GPT-5.5 Pro独立完成了博士论文级别的证明。

三年,从本科到博士。

Gowers的实验揭示了一个临界点:AI不只是工具了。至少在某些问题上,它已经是一个能独立产出原创结果的研究者。

那些曾经需要数年苦修才能叩开的大门,现在只需要一个提示框和两个小时。

门槛没了。但门后面的世界,可能比我们想象的更大,也更陌生。

参考资料:

https://x.com/wtgowers/status/2052830948685676605?s=20

https://gowers.wordpress.com/2026/05/08/a-recent-experience-with-chatgpt-5-5-pro/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内马尔女友布鲁娜惊艳世界杯看台,身披10号战袍为爱助威

内马尔女友布鲁娜惊艳世界杯看台,身披10号战袍为爱助威

星耀国际足坛
2026-06-15 13:41:19
泰国公主葬礼内场画面,让网友大开眼界,原来不是平躺而是坐着

泰国公主葬礼内场画面,让网友大开眼界,原来不是平躺而是坐着

魔都姐姐杂谈
2026-06-15 15:19:34
加盟尼克斯!直接宣布退役!生涯第二次错过总冠军

加盟尼克斯!直接宣布退役!生涯第二次错过总冠军

篮球教学论坛
2026-06-15 16:41:49
北京一男子家中离奇中毒身亡,送医后发现此毒一旦摄入就没有救治可能性!检方披露真凶:岳母再婚丈夫为夺财产下毒,男扮女装逃跑后仍落网

北京一男子家中离奇中毒身亡,送医后发现此毒一旦摄入就没有救治可能性!检方披露真凶:岳母再婚丈夫为夺财产下毒,男扮女装逃跑后仍落网

三湘都市报
2026-06-15 16:15:31
中央安全生产考核巡查组已进驻8省份明查暗访

中央安全生产考核巡查组已进驻8省份明查暗访

界面新闻
2026-06-15 11:23:24
5-1惨败!世预赛零失球神话破灭,世界杯梦碎

5-1惨败!世预赛零失球神话破灭,世界杯梦碎

铿锵格斗
2026-06-15 13:59:36
世界杯神奇一幕:55万人口小国创造历史,西班牙27次射门0进球

世界杯神奇一幕:55万人口小国创造历史,西班牙27次射门0进球

足球狗说
2026-06-16 02:05:39
从副部级降为副处级8年后,王铁再次被查

从副部级降为副处级8年后,王铁再次被查

大风新闻
2026-06-15 21:42:05
世界杯涉事VAR官员将被撤职

世界杯涉事VAR官员将被撤职

体坛周报
2026-06-15 20:20:55
世乒联官宣!张本美和登世界第1,张本智和第2不保,最大赢家出炉

世乒联官宣!张本美和登世界第1,张本智和第2不保,最大赢家出炉

娱说瑜悦
2026-06-15 21:59:09
挨了中国的重拳后,马科斯已经镇不住场面,杜特尔特家族开始反击

挨了中国的重拳后,马科斯已经镇不住场面,杜特尔特家族开始反击

空天力量
2026-06-15 19:06:22
某公招面试中,一考生作答竟与标准答案一字不差!经查:参加考试命题的欧某,将试题及答案提供给邓某,由其对外招生培训,造成泄密……

某公招面试中,一考生作答竟与标准答案一字不差!经查:参加考试命题的欧某,将试题及答案提供给邓某,由其对外招生培训,造成泄密……

日照日报
2026-06-15 18:02:08
乌合之众的“爱国幻觉”与流量狂欢

乌合之众的“爱国幻觉”与流量狂欢

文史非常道毕延河
2026-06-14 09:28:31
世界杯首场0-0!西班牙最快首轮淘汰赛碰阿根廷,历史魔咒难夺冠

世界杯首场0-0!西班牙最快首轮淘汰赛碰阿根廷,历史魔咒难夺冠

侃球熊弟
2026-06-16 03:35:47
世界杯开门红!哲凯赖什传射,伊萨克造3球,瑞典5-1大胜突尼斯

世界杯开门红!哲凯赖什传射,伊萨克造3球,瑞典5-1大胜突尼斯

全景体育V
2026-06-15 12:00:41
729票赞成没有一票反对!欧尔班再度掌权,冯德莱恩实在没想到

729票赞成没有一票反对!欧尔班再度掌权,冯德莱恩实在没想到

共工之锚
2026-06-15 13:50:00
准确预测黄金暴跌的人,再发重大预言

准确预测黄金暴跌的人,再发重大预言

金融界
2026-06-15 07:57:12
山东3亿北斗工程现“脆皮底座”一掰就碎,5000套设备成5000个隐患:监测滑坡的设备,自己先“滑坡”了

山东3亿北斗工程现“脆皮底座”一掰就碎,5000套设备成5000个隐患:监测滑坡的设备,自己先“滑坡”了

大象新闻
2026-06-15 09:45:14
独自上南太行失联19天的安徽小伙已找到:搜救人员在崖边发现手机,绳降120米在崖底搜寻到遗体

独自上南太行失联19天的安徽小伙已找到:搜救人员在崖边发现手机,绳降120米在崖底搜寻到遗体

极目新闻
2026-06-15 19:29:09
美国驻华使馆深夜发了条消息,全网都懵了!

美国驻华使馆深夜发了条消息,全网都懵了!

果妈聊娱乐
2026-06-15 14:32:39
2026-06-16 05:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15476文章数 66926关注度
往期回顾 全部

科技要闻

白宫一个电话,最强Claude上线三天就没了

头条要闻

西班牙遭爆冷:0-0平佛得角 亚马尔完成首秀

头条要闻

西班牙遭爆冷:0-0平佛得角 亚马尔完成首秀

体育要闻

世界杯开赛4天,亚足联依然保持不败!

娱乐要闻

黄大炜猝逝过程太离奇,母亲追查真相

财经要闻

活鼠、活蛆、农残超标 山姆回应被约谈

汽车要闻

网易X智己 夏日尊享内购会,热力收官

态度原创

家居
艺术
本地
教育
公开课

家居要闻

绿意盎然 自然之境

艺术要闻

扎哈事务所告别扎哈,更名“ZHA”

本地新闻

当年轻人重新爱上黄金,非遗有了新的打开方式

教育要闻

2026年高考结束,未来人才的核心竞争力是什么?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版