网易首页 > 网易号 > 正文 申请入驻

GPT-5.4 Pro解出1道30年未决数学题

0
分享至

2025年6月,一道困扰组合数学界30年的开放性问题,被GPT-5.4 Pro在单次对话中解决了。

不是近似答案,不是启发思路,是完整证明。问题贡献者、北卡罗来纳大学夏洛特分校数学家Will Brian确认了解法的正确性,并计划将其正式发表。更微妙的是:Brian承认,他"之前想过AI的方法可能可行,但觉得很难实现"——结果AI自己把这条路走通了。

一道什么样的题,让人类和AI都卡了这么久

这个问题属于拉姆齐理论(Ramsey Theory)的一个分支,研究的是超图(Hypergraph)中的划分结构。简单说,数学家想知道:给定一个"没有孤立点"的超图,最多能有多少个顶点,同时保证不存在某种特定大小的划分?

序列H(n)描述的就是这个上限。人类数学家此前构造的下界被认为是"次优的",甚至渐进意义上也不够好。问题的核心在于找到新的超图构造方法——这不是算力能暴力破解的,需要真正的结构性洞察。

Epoch AI设置的测试分三档:Warm-up(已知解法的简单变体)、Single Challenge(无已知解法的具体数值)、Full Problem(通用算法)。GPT-5.4 Pro直接攻破了Single Challenge档,找到了一个|V|≥64、|H|≤20且满足所有约束的超图构造。

单次对话。没有外部工具。没有人类提示"往这个方向试试"。

为什么数学家Brian的反应值得玩味

Brian的评语里有句话很关键:"它消除了我们下界构造中的一个低效之处,并且在某种意义上镜像了我们上界构造的复杂性。"

翻译一下:人类数学家其实有直觉,知道哪里可能优化,但没能自己完成。AI的解法不仅补上了缺口,还跟人类已有的上层框架形成了对称——这种"镜像"让Brian既兴奋又好奇,他说"想进一步理解为什么这招这么好用"。

这里有个反直觉的点。我们通常以为AI解数学题=算得快,但组合数学的开放问题不是靠算力堆出来的。GPT-5.4 Pro的解法被描述为"eliminates an inefficiency"——这是结构层面的洞见,不是穷举。

更耐人寻味的是后续:Brian计划把AI的想法作为"follow-on work"的起点,Barreto和Price可以选择成为合著者。学术发表的游戏规则没变,但第一作者的位置空了出来——或者说,被一段对话记录取代了。

其他模型后来也解出来了,但这正是问题所在

Epoch AI完成测试框架后,用同一套scaffold测试了更多模型:Opus 4.6 (max)、Gemini 3.1 Pro、甚至GPT-5.4的基础版(xhigh)都成功解出了这道题。

这像什么?就像你发现自家锁被一把钥匙打开后,很快发现市面上五把不同的钥匙都能开。问题的难度没有变,但"可解性"的阈值被一次性拉低了。

对数学界来说,这意味着FrontierMath——那个专门收集"AI应该还解不了"的开放问题库——可能需要重新校准。Epoch AI设计这个基准测试的初衷是找到人类仍具优势的地带,结果第一道防线这么快就出现裂痕。

对25-40岁的科技从业者,这个场景应该很熟悉:你维护的某个"护城河"技术,突然被通用方案跨过去了。不是对手多努力,是基座能力跃迁了。

产品经理视角:当"不可解"变成"已解决"之后

从工具设计的角度看,GPT-5.4 Pro的这次表现有几个值得拆解的细节。

首先是交互成本。Brian提到的是"a full transcript of the original conversation",说明解法来自自然语言对话,不是专门的证明辅助工具。这意味着数学家不需要学习新界面,用日常交流的方式就获得了突破。工具门槛的降低,往往比性能提升更改变使用模式。

其次是可验证性。AI生成的数学证明历来被质疑"幻觉"风险,但这次有完整对话记录和AI自己的write-up可供复核。Brian作为问题贡献者的背书,相当于给这个特定案例做了人工审计。规模化之后,这种审计成本怎么摊,是个开放问题。

最后是知识产权的模糊地带。Barreto和Price作为"提示工程师"可以选择成为论文合著者,但他们的贡献边界很难界定。如果同一道题换个人提示,AI给出等价解法,算独立发现还是重复工作?学术评价体系还没准备好回答这个。

Will Brian在确认解法后说,他对"为什么这招这么好用"感兴趣。这句话的潜台词是:AI给出了答案,但解释这个答案为什么成立,仍是人类的工作——至少目前是。

可如果下次,AI连"为什么好用"的解释也一并生成了呢?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
突然暴走!3场场均32+8+6,0罚球轰35分创纪录,弗拉格,慌不?

突然暴走!3场场均32+8+6,0罚球轰35分创纪录,弗拉格,慌不?

球童无忌
2026-03-25 12:49:06
余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

余承东宣布华为手机全面回归!大方公布CPU型号 支持5A网络 麒麟处理器全国产突破美国制裁

快科技
2026-03-24 15:22:21
默森:被击溃时枪手几乎没人愿拿球;不敢想巴萨能对其做什么

默森:被击溃时枪手几乎没人愿拿球;不敢想巴萨能对其做什么

懂球帝
2026-03-25 03:45:04
72年毛主席会见叶剑英,提及邓小平回京,叶剑英:我只有一个要求

72年毛主席会见叶剑英,提及邓小平回京,叶剑英:我只有一个要求

大运河时空
2026-03-24 17:45:03
转账新规来了!微信支付宝这么转钱,小心被冻结

转账新规来了!微信支付宝这么转钱,小心被冻结

另子维爱读史
2026-03-23 22:51:30
来了!A股重要利好

来了!A股重要利好

风风顺
2026-03-25 17:13:55
汇丰新任亚洲及中东CFO,曾是深圳打工人

汇丰新任亚洲及中东CFO,曾是深圳打工人

财通社
2026-03-25 21:52:51
首尔的“危险天平”:俄罗斯为何如此担心韩国援乌

首尔的“危险天平”:俄罗斯为何如此担心韩国援乌

民间胡扯老哥
2026-03-23 19:00:36
真正大爆过的6部仙侠剧,最后一部至今都无人超越

真正大爆过的6部仙侠剧,最后一部至今都无人超越

小Q侃电影
2026-03-25 19:48:17
场均40分8板7助!NBA历史首人,这就是他能拿3年1.7亿顶薪的原因

场均40分8板7助!NBA历史首人,这就是他能拿3年1.7亿顶薪的原因

篮球扫地僧
2026-03-25 15:58:44
伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

伊朗:已为未来几天的战斗准备了新的“惊喜”,可能带来“重大效果”

纵相新闻
2026-03-25 21:56:04
马震任重庆市委组织部部长

马震任重庆市委组织部部长

上观新闻
2026-03-25 21:24:26
爱国者断供8个月,乌军早该哑火!俄军空袭却遭拦截:导弹哪来的

爱国者断供8个月,乌军早该哑火!俄军空袭却遭拦截:导弹哪来的

李健政观察
2026-03-23 16:34:26
赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

深圳买房计划
2026-03-25 22:26:10
禁赛25场!3年1.62亿,乔治正式道歉!

禁赛25场!3年1.62亿,乔治正式道歉!

左右为篮
2026-03-25 12:35:22
陕西检察长陈平疑案:死前喊冤,被枪毙后家属不能收尸,直接火化

陕西检察长陈平疑案:死前喊冤,被枪毙后家属不能收尸,直接火化

午夜故事会
2024-04-15 18:31:39
美媒:万斯和鲁比奥将牵头美伊谈判

美媒:万斯和鲁比奥将牵头美伊谈判

参考消息
2026-03-25 18:44:19
卡塔尔向伊朗交60亿美元保护费? 伊朗打击升级: 瞄准以色列往死里打

卡塔尔向伊朗交60亿美元保护费? 伊朗打击升级: 瞄准以色列往死里打

林子说事
2026-03-26 01:46:07
张雪峰被曝心脏骤停抢救,前一天还在大鱼大肉,一人吃6个菜

张雪峰被曝心脏骤停抢救,前一天还在大鱼大肉,一人吃6个菜

映射生活的身影
2026-03-24 18:27:44
78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

78岁连路都走不稳还开演唱会,全网骂声一片,她却扬言回馈粉丝

洲洲影视娱评
2026-01-28 12:23:18
2026-03-26 03:00:49
像素与芯片
像素与芯片
有态度网友ytd
360文章数 2关注度
往期回顾 全部

科技要闻

红极一时却草草收场,Sora宣布正式关停

头条要闻

伊朗:正在搜捕逃亡美军

头条要闻

伊朗:正在搜捕逃亡美军

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰遗产分割复杂!是否立遗嘱成关键

财经要闻

管涛:中东局势如何影响人民币汇率走势?

汽车要闻

智己LS8放大招 30万内8系旗舰+全线控底盘秀实力

态度原创

旅游
艺术
亲子
手机
公开课

旅游要闻

“女王驾到” 上海温室花园高山杜鹃展开幕,中外游客打卡点赞,Beautiful!Amazing!Fantastic!

艺术要闻

张雪峰走了,他公司所在的这栋楼高177.8米,耗资超10亿!

亲子要闻

智利幼儿教育覆盖率仅43%,专家吁提升投资与优先地位

手机要闻

Bigme大我HiBreak Plus彩墨屏手写手机亮相,预售价1699元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版