AI首次攻克FrontierMath前沿数学开放问题集的一道组合学难题|算法|子集|构造|级数|新论文

AI首次攻克FrontierMath前沿数学开放问题集的一道组合学难题

分享至

★置顶zzllrr小乐公众号（主页右上角）数学科普不迷路！

AI人工智能首先攻克了《FrontierMath前沿数学：开放问题集》中的一道组合学难题（FrontierMath未解数学难题集第6题：超图上的拉姆齐类型问题：构造尽可能大的超图，使其不具有某种易于检查但难以发现的性质。），该基准测试收录的均为数学家们反复尝试却始终未能解决的真实研究难题——参阅：。

作者：Epoch.ai 2026-3-24

译者：zzllrr小乐（数学科普公众号）2026-3-24

这道新被攻克的难题内容如下：

6、组合数学——中等有趣的成果

超图上的拉姆齐类型问题：构造尽可能大的超图，使其不具有某种易于检查但难以发现的性质。

这个问题是关于改进数列H(n)的值的下界，该序列出现在研究如下定义的无穷级数集合的同时收敛性时。

如果存在某个D⊆V和 P⊆H ，使得|D|=n 且 D中的每个元素都恰好包含在P的一个元素中，则称超图(V, H) 包含大小（规模）为 n的划分。

例如，上图左侧展示的是一个含 8 个顶点、4 条超边的超图，右侧则展示出该超图包含一个规模为 4 的划分。

H(n)是最大的 k∈ℕ ，使得存在一个超图(V, H) ，其中|V| =k 没有孤立顶点，并且不包含大小（规模）大于n 的划分。

H(1) = 1, H(2) = 3, H(3) = 5, H(4) = 8,

H(5) = 10, H(6) = 14, H(7) = 17，

要证明H(6)=14，则需构造一个14阶超图，且该超图不包含规模大于6的划分。以下为两个符合该条件的示例：

数学家们认为，目前已知的H(n)的最佳下界即使在渐近意义上也是次优的，并且可以通过寻找新的超图构造来改进它们。本问题的目标就是找到这样一种构造。

——威尔·布莱恩（Will Brian）

北卡罗来纳大学夏洛特分校数学助理教授

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

这道刚被攻克的难题由威尔・布莱恩（Will Brian）提出，他将其归为 “颇具研究价值” 类别。该难题是他与保罗・拉尔森（Paul Larson）在 2019 年合著的论文中提出的一个猜想，两人当时未能破解，此后数次尝试也均以失败告终。以下是布莱恩的相关表述。

“这一解法令人振奋，我一直觉得这个问题极具研究价值。我此前曾猜想，或许能通过人工智能的方法来求解，却始终难以梳理出具体思路。如今看来，这种方法的推导过程堪称完美。

该解法弥补了我们在下界构造中存在的一处疏漏，从某种意义上来说，与我们在上界构造中用到的复杂思路形成了呼应。对于拉姆齐理论相关问题而言，这种上下界的精准匹配已是极佳结果，我也十分希望能进一步探究其背后的深层逻辑，弄清这一解法为何能达到如此理想的效果。”

——威尔·布莱恩（Will Brian）

北卡罗来纳大学夏洛特分校数学助理教授

布莱恩计划将该解法整理成文并发表，文中或将纳入受人工智能思路启发而开展的后续研究成果。这与他此前的预期评估一致：这一解法的研究成果可在正规专业期刊发表，且大概率能衍生出全新的研究问题。

在此祝贺凯文・巴雷托（Kevin Barreto）和利亚姆・普莱斯（Liam Price），二人首次引导 GPT-5.4 Pro 模型推导出了该难题的解法！他们有权选择与布莱恩共同成为相关论文的合作者。同样祝贺盖比・贾夫（Geby Jaff），他不久后也引导模型得出了该难题的解法。

我们已在用于测试模型解题能力的实验框架中，复现了这一引导求解的过程。在该框架下，Google Gemini 3.1 Pro、GPT-5.4（超高精度版）以及Claude Opus 4.6（顶配版）这三款模型，均至少能在部分尝试中解出这道题。如需了解该难题的更多细节，包括记录 GPT-5.4 Pro 原始解法的完整对话文本，以及实验框架中其他模型的解题过程，可访问我们官网的该难题专属页面或参见下文。

AI提示词（Prompts）

基础热身题（Warm-up）：求解已存在已知构造方法的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 64, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D⊆V和P⊆H，满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中，则称超图(V,H)包含一个规模为n的划分。

构造一个无孤立顶点的超图(V,H)，满足∣V∣≥64，∣H∣≤20，且该超图不包含规模大于 20 的划分。

将超图以字符串形式输出，顶点标记为 1、2、……、∣V∣，边以大括号表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

单项挑战（Single challenge）：求解尚无已知构造方法、且难以通过暴力枚举求解的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 66, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D⊆V和P⊆H，满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中，则称超图(V,H)包含一个规模为n的划分。

构造一个无孤立顶点的超图(V,H)，满足∣V∣≥66，∣H∣≤20，且该超图不包含规模大于 20 的划分。

将超图以字符串形式输出，顶点标记为 1、2、……、∣V∣，边以大括号表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

完整问题（Full problem）：为所有n求解H(n)的通用算法。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Define H(n) to be the largest integer k such that there is a hypergraph (V, H) with |V| = k having no isolated vertices and containing no partitions of size greater than n.

It is known that H(n) ≥ k_n, where k_n is defined recursively by the formula k_1 = 1 and k_n = ⌊n/2⌋ + k_⌊n/2⌋ + k_⌊(n+1)/2⌋.

Your task is to improve this lower bound by a constant factor, i.e. show that H(n) ≥ c*k_n for some c > 1. It is acceptable if this improvement does not work for small n, but it must already be "in effect" for n=15. You must demonstrate this improvement by providing an algorithm that takes n as input and produces a hypergraph witnessing H(n) ≥ c * k_n.

Please provide an algorithm that takes n as input and outputs the witness hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

Solution format:

* Write a Python script defining a function `solution(n: int) -> str`.

* Do not include any code at the file level. You may include a `main` block for testing, but it will not be executed by the verifier.

* For n ≤ 100, the algorithm must complete within 10 minutes when run on a typical laptop.

若存在子集D⊆V和P⊆H，满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中，则称超图(V,H)包含一个规模为n的划分。

定义H(n)为满足下述条件的最大整数k：存在顶点数为k的超图(V,H)，该超图无孤立顶点，且不包含规模大于n的划分。

已知H(n)≥kₙ，其中kn由下述递推公式定义：k₁=1，kₙ=⌊n/2⌋+k_⌊n/2⌋+k_⌊(n+1)/2⌋。

你的任务是将该下界提升一个常数因子，即证明存在常数c>1，使得H(n)≥c⋅kₙ。该改进结果无需适用于小数值n，但需在n=15时已生效。你必须通过设计算法来验证该改进效果，该算法以n为输入，生成可验证H(n)≥c⋅kₙ的超图。

请设计一个以n为输入的算法，将验证用超图以字符串形式输出，顶点标记为 1、2、……、∣V∣，边以大括号表示。示例：{1,2,3},{2,4},{3,4,5},{1,5}

解法输出格式要求

编写 Python 脚本，定义函数solution(n: int) -> str；
不得在文件级别编写任何代码，可添加main代码块用于测试，但验证程序不会执行该代码块；
对于n≤100的情况，该算法在普通笔记本电脑上的运行时间需在 10 分钟内。

也欢迎浏览《前沿数学：开放问题集》主页面，深入了解这一基准测试。参阅：

截至目前，已有一道 “颇具研究价值” 的难题被破解。下一个被攻克的会是哪道题？又将在何时被解开？

参考资料

https://epochai.substack.com/p/first-ai-solution-on-frontiermath

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

小乐数学科普近期文章

·开放 · 友好 · 多元 · 普适 · 守拙·

让数学

更加

易学易练

易教易研

易赏易玩

易见易得

易传易及

欢迎评论、点赞、在看、在听

收藏、分享、转载、投稿

查看原始文章出处

点击zzllrr小乐

公众号主页

右上角

置顶★加星

数学科普不迷路！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.