2025年6月,一道困扰组合数学界30年的开放性问题,被GPT-5.4 Pro在单次对话中解决了。
不是近似答案,不是启发思路,是完整证明。问题贡献者、北卡罗来纳大学夏洛特分校数学家Will Brian确认了解法的正确性,并计划将其正式发表。更微妙的是:Brian承认,他"之前想过AI的方法可能可行,但觉得很难实现"——结果AI自己把这条路走通了。
一道什么样的题,让人类和AI都卡了这么久
这个问题属于拉姆齐理论(Ramsey Theory)的一个分支,研究的是超图(Hypergraph)中的划分结构。简单说,数学家想知道:给定一个"没有孤立点"的超图,最多能有多少个顶点,同时保证不存在某种特定大小的划分?
序列H(n)描述的就是这个上限。人类数学家此前构造的下界被认为是"次优的",甚至渐进意义上也不够好。问题的核心在于找到新的超图构造方法——这不是算力能暴力破解的,需要真正的结构性洞察。
Epoch AI设置的测试分三档:Warm-up(已知解法的简单变体)、Single Challenge(无已知解法的具体数值)、Full Problem(通用算法)。GPT-5.4 Pro直接攻破了Single Challenge档,找到了一个|V|≥64、|H|≤20且满足所有约束的超图构造。
单次对话。没有外部工具。没有人类提示"往这个方向试试"。
为什么数学家Brian的反应值得玩味
Brian的评语里有句话很关键:"它消除了我们下界构造中的一个低效之处,并且在某种意义上镜像了我们上界构造的复杂性。"
翻译一下:人类数学家其实有直觉,知道哪里可能优化,但没能自己完成。AI的解法不仅补上了缺口,还跟人类已有的上层框架形成了对称——这种"镜像"让Brian既兴奋又好奇,他说"想进一步理解为什么这招这么好用"。
这里有个反直觉的点。我们通常以为AI解数学题=算得快,但组合数学的开放问题不是靠算力堆出来的。GPT-5.4 Pro的解法被描述为"eliminates an inefficiency"——这是结构层面的洞见,不是穷举。
更耐人寻味的是后续:Brian计划把AI的想法作为"follow-on work"的起点,Barreto和Price可以选择成为合著者。学术发表的游戏规则没变,但第一作者的位置空了出来——或者说,被一段对话记录取代了。
其他模型后来也解出来了,但这正是问题所在
Epoch AI完成测试框架后,用同一套scaffold测试了更多模型:Opus 4.6 (max)、Gemini 3.1 Pro、甚至GPT-5.4的基础版(xhigh)都成功解出了这道题。
这像什么?就像你发现自家锁被一把钥匙打开后,很快发现市面上五把不同的钥匙都能开。问题的难度没有变,但"可解性"的阈值被一次性拉低了。
对数学界来说,这意味着FrontierMath——那个专门收集"AI应该还解不了"的开放问题库——可能需要重新校准。Epoch AI设计这个基准测试的初衷是找到人类仍具优势的地带,结果第一道防线这么快就出现裂痕。
对25-40岁的科技从业者,这个场景应该很熟悉:你维护的某个"护城河"技术,突然被通用方案跨过去了。不是对手多努力,是基座能力跃迁了。
产品经理视角:当"不可解"变成"已解决"之后
从工具设计的角度看,GPT-5.4 Pro的这次表现有几个值得拆解的细节。
首先是交互成本。Brian提到的是"a full transcript of the original conversation",说明解法来自自然语言对话,不是专门的证明辅助工具。这意味着数学家不需要学习新界面,用日常交流的方式就获得了突破。工具门槛的降低,往往比性能提升更改变使用模式。
其次是可验证性。AI生成的数学证明历来被质疑"幻觉"风险,但这次有完整对话记录和AI自己的write-up可供复核。Brian作为问题贡献者的背书,相当于给这个特定案例做了人工审计。规模化之后,这种审计成本怎么摊,是个开放问题。
最后是知识产权的模糊地带。Barreto和Price作为"提示工程师"可以选择成为论文合著者,但他们的贡献边界很难界定。如果同一道题换个人提示,AI给出等价解法,算独立发现还是重复工作?学术评价体系还没准备好回答这个。
Will Brian在确认解法后说,他对"为什么这招这么好用"感兴趣。这句话的潜台词是:AI给出了答案,但解释这个答案为什么成立,仍是人类的工作——至少目前是。
可如果下次,AI连"为什么好用"的解释也一并生成了呢?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.