网易首页 > 网易号 > 正文 申请入驻

AI首次攻克FrontierMath前沿数学开放问题集的一道组合学难题

0
分享至

置顶zzllrr小乐公众号(主页右上角)数学科普不迷路!

AI人工智能首先攻克了《FrontierMath前沿数学:开放问题集》中的一道组合学难题(FrontierMath未解数学难题集第6题:超图上的拉姆齐类型问题:构造尽可能大的超图,使其不具有某种易于检查但难以发现的性质。),该基准测试收录的均为数学家们反复尝试却始终未能解决的真实研究难题——参阅:。

作者:Epoch.ai 2026-3-24

译者:zzllrr小乐(数学科普公众号)2026-3-24


这道新被攻克的难题内容如下:

6、组合数学——中等有趣的成果

超图上的拉姆齐类型问题:构造尽可能大的超图,使其不具有某种易于检查但难以发现的性质。

这个问题是关于改进数列H(n)的值的下界,该序列出现在研究如下定义的无穷级数集合的同时收敛性时。

如果存在某个D⊆V和 P⊆H ,使得|D|=n 且 D中的每个元素都恰好包含在P的一个元素中,则称超图(V, H) 包含大小(规模)为 n的划分。


例如,上图左侧展示的是一个含 8 个顶点、4 条超边的超图,右侧则展示出该超图包含一个规模为 4 的划分。

H(n)是最大的 k∈ℕ ,使得存在一个超图(V, H) ,其中|V| =k 没有孤立顶点,并且不包含大小(规模)大于n 的划分。

H(1) = 1, H(2) = 3, H(3) = 5, H(4) = 8,

H(5) = 10, H(6) = 14, H(7) = 17,

要证明H(6)=14,则需构造一个14阶超图,且该超图不包含规模大于6的划分。以下为两个符合该条件的示例:


数学家们认为,目前已知的H(n)的最佳下界即使在渐近意义上也是次优的,并且可以通过寻找新的超图构造来改进它们。本问题的目标就是找到这样一种构造。

——威尔·布莱恩(Will Brian

北卡罗来纳大学夏洛特分校数学助理教授

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

这道刚被攻克的难题由威尔・布莱恩(Will Brian)提出,他将其归为 “颇具研究价值” 类别。该难题是他与保罗・拉尔森(Paul Larson)在 2019 年合著的论文中提出的一个猜想,两人当时未能破解,此后数次尝试也均以失败告终。以下是布莱恩的相关表述。

这一解法令人振奋,我一直觉得这个问题极具研究价值。我此前曾猜想,或许能通过人工智能的方法来求解,却始终难以梳理出具体思路。如今看来,这种方法的推导过程堪称完美。

该解法弥补了我们在下界构造中存在的一处疏漏,从某种意义上来说,与我们在上界构造中用到的复杂思路形成了呼应。对于拉姆齐理论相关问题而言,这种上下界的精准匹配已是极佳结果,我也十分希望能进一步探究其背后的深层逻辑,弄清这一解法为何能达到如此理想的效果。


——威尔·布莱恩(Will Brian

北卡罗来纳大学夏洛特分校数学助理教授

布莱恩计划将该解法整理成文并发表,文中或将纳入受人工智能思路启发而开展的后续研究成果。这与他此前的预期评估一致:这一解法的研究成果可在正规专业期刊发表,且大概率能衍生出全新的研究问题。

在此祝贺凯文・巴雷托(Kevin Barreto)和利亚姆・普莱斯(Liam Price),二人首次引导 GPT-5.4 Pro 模型推导出了该难题的解法!他们有权选择与布莱恩共同成为相关论文的合作者。同样祝贺盖比・贾夫(Geby Jaff),他不久后也引导模型得出了该难题的解法。

我们已在用于测试模型解题能力的实验框架中,复现了这一引导求解的过程。在该框架下,Google Gemini 3.1 Pro、GPT-5.4(超高精度版)以及Claude Opus 4.6(顶配版)这三款模型,均至少能在部分尝试中解出这道题。如需了解该难题的更多细节,包括记录 GPT-5.4 Pro 原始解法的完整对话文本,以及实验框架中其他模型的解题过程,可访问我们官网的该难题专属页面或参见下文。


AI提示词(Prompts

基础热身题(Warm-up):求解已存在已知构造方法的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 64, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D⊆V和P⊆H,满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中,则称超图(V,H)包含一个规模为n的划分。

构造一个无孤立顶点的超图(V,H),满足∣V∣≥64,∣H∣≤20,且该超图不包含规模大于 20 的划分。

将超图以字符串形式输出,顶点标记为 1、2、……、∣V∣,边以大括号表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

单项挑战(Single challenge):求解尚无已知构造方法、且难以通过暴力枚举求解的某一H(n)值。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Find a hypergraph (V, H) with no isolated vertices such that |V| ≥ 66, |H| ≤ 20, and (V, H) contains no partitions of size > 20. Output the hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

若存在子集D⊆V和P⊆H,满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中,则称超图(V,H)包含一个规模为n的划分。

构造一个无孤立顶点的超图(V,H),满足∣V∣≥66,∣H∣≤20,且该超图不包含规模大于 20 的划分。

将超图以字符串形式输出,顶点标记为 1、2、……、∣V∣,边以大括号表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

完整问题(Full problem):为所有n求解H(n)的通用算法。

A hypergraph (V, H) is said to contain a partition of size n if there is some D ⊆ V and P ⊆ H such that |D| = n and every member of D is contained in exactly one member of P. Define H(n) to be the largest integer k such that there is a hypergraph (V, H) with |V| = k having no isolated vertices and containing no partitions of size greater than n.

It is known that H(n) ≥ k_n, where k_n is defined recursively by the formula k_1 = 1 and k_n = ⌊n/2⌋ + k_⌊n/2⌋ + k_⌊(n+1)/2⌋.

Your task is to improve this lower bound by a constant factor, i.e. show that H(n) ≥ c*k_n for some c > 1. It is acceptable if this improvement does not work for small n, but it must already be "in effect" for n=15. You must demonstrate this improvement by providing an algorithm that takes n as input and produces a hypergraph witnessing H(n) ≥ c * k_n.

Please provide an algorithm that takes n as input and outputs the witness hypergraph as a string where vertices are labeled, 1, ..., |V|, and edges are denoted with curly braces. Example: {1,2,3},{2,4},{3,4,5},{1,5}

Solution format:

* Write a Python script defining a function `solution(n: int) -> str`.

* Do not include any code at the file level. You may include a `main` block for testing, but it will not be executed by the verifier.

* For n ≤ 100, the algorithm must complete within 10 minutes when run on a typical laptop.

若存在子集D⊆V和P⊆H,满足∣D∣=n且D中的每个元素恰好包含在P的唯一一个元素中,则称超图(V,H)包含一个规模为n的划分。

定义H(n)为满足下述条件的最大整数k:存在顶点数为k的超图(V,H),该超图无孤立顶点,且不包含规模大于n的划分。

已知H(n)≥kₙ​,其中kn​由下述递推公式定义:k₁=1,kₙ​=⌊n/2⌋+k_⌊n/2⌋​+k_⌊(n+1)/2⌋​。

你的任务是将该下界提升一个常数因子,即证明存在常数c>1,使得H(n)≥c⋅kₙ​。该改进结果无需适用于小数值n,但需在n=15时已生效。你必须通过设计算法来验证该改进效果,该算法以n为输入,生成可验证H(n)≥c⋅kₙ​的超图。

请设计一个以n为输入的算法,将验证用超图以字符串形式输出,顶点标记为 1、2、……、∣V∣,边以大括号表示。示例:{1,2,3},{2,4},{3,4,5},{1,5}

解法输出格式要求

  • 编写 Python 脚本,定义函数solution(n: int) -> str;

  • 不得在文件级别编写任何代码,可添加main代码块用于测试,但验证程序不会执行该代码块;

  • 对于n≤100的情况,该算法在普通笔记本电脑上的运行时间需在 10 分钟内。

也欢迎浏览《前沿数学:开放问题集》主页面,深入了解这一基准测试。参阅:

截至目前,已有一道 “颇具研究价值” 的难题被破解。下一个被攻克的会是哪道题?又将在何时被解开?

参考资料

https://epochai.substack.com/p/first-ai-solution-on-frontiermath

https://epoch.ai/frontiermath/open-problems/ramsey-hypergraphs

https://epoch.ai/files/open-problems/ramsey-hypergraphs.pdf

小乐数学科普近期文章

·开放 · 友好 · 多元 · 普适 · 守拙·

让数学

更加

易学易练

易教易研

易赏易玩

易见易得

易传易及

欢迎评论、点赞、在看、在听

收藏、分享、转载、投稿

查看原始文章出处

点击zzllrr小乐

公众号主页

右上角

置顶★加星

数学科普不迷路!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国台办:统一后台湾财政税收全用于民生,无需在防务上花巨资

国台办:统一后台湾财政税收全用于民生,无需在防务上花巨资

南方都市报
2026-04-15 16:48:15
1人死亡!广东惠州一鸿蒙智行展厅发生高坠事故,调查报告:作业人员维修顶棚,踩穿采光瓦从4.2米高的顶棚坠落至地面,头部受伤,不幸去世

1人死亡!广东惠州一鸿蒙智行展厅发生高坠事故,调查报告:作业人员维修顶棚,踩穿采光瓦从4.2米高的顶棚坠落至地面,头部受伤,不幸去世

大风新闻
2026-04-15 10:43:02
伊朗议长卡利巴夫:黎巴嫩全面停火是抵抗阵线斗争的成果

伊朗议长卡利巴夫:黎巴嫩全面停火是抵抗阵线斗争的成果

财联社
2026-04-16 05:34:04
京东买冰柜容积大缩水!“荣事达”狂赔6万元求和,客户:不需要

京东买冰柜容积大缩水!“荣事达”狂赔6万元求和,客户:不需要

科技Nice
2026-04-15 11:42:18
王博被驱逐!三大核心缺席广厦惜败山西 布朗空砍41分

王博被驱逐!三大核心缺席广厦惜败山西 布朗空砍41分

醉卧浮生
2026-04-15 21:51:38
杨某媛称已找到工作,结果立马被网友举报了……

杨某媛称已找到工作,结果立马被网友举报了……

麦杰逊
2026-04-15 11:53:46
0-2!中国女足出局,亚洲杯决赛对阵出炉:日本女足对决朝鲜女足

0-2!中国女足出局,亚洲杯决赛对阵出炉:日本女足对决朝鲜女足

足球狗说
2026-04-15 22:54:41
欧冠4强:拜仁巴黎巅峰碰撞,枪手地狱赛程苦战马竞

欧冠4强:拜仁巴黎巅峰碰撞,枪手地狱赛程苦战马竞

体坛周报
2026-04-16 07:03:15
涩爆了!王阿姨性感蕾丝火力全开 里昂直接被放倒

涩爆了!王阿姨性感蕾丝火力全开 里昂直接被放倒

游民星空
2026-04-15 18:04:41
央视曝光知名国酒!成本4元卖150!纯酒精兑水,年份包装全造假

央视曝光知名国酒!成本4元卖150!纯酒精兑水,年份包装全造假

阿凫爱吐槽
2026-04-16 01:10:39
欧足联也嫌弃的红牌!皇马欧冠出局,阿韦洛亚帅位悬了

欧足联也嫌弃的红牌!皇马欧冠出局,阿韦洛亚帅位悬了

仰卧撑FTUer
2026-04-16 07:27:07
皇马出局!阿韦洛亚怒喷裁判:他连卡马文加有黄牌在身都不知道

皇马出局!阿韦洛亚怒喷裁判:他连卡马文加有黄牌在身都不知道

仰卧撑FTUer
2026-04-16 05:50:03
广东“莫氏鸡煲大公主”爆火前后反差大,晚上干到凌晨2点才收工,发文吐槽:这个鸡你们是非吃不可吗

广东“莫氏鸡煲大公主”爆火前后反差大,晚上干到凌晨2点才收工,发文吐槽:这个鸡你们是非吃不可吗

大象新闻
2026-04-15 12:57:04
大面积闭店!深圳“奶茶一姐”为何输给了河南草根兄弟?

大面积闭店!深圳“奶茶一姐”为何输给了河南草根兄弟?

帅真商业
2026-04-15 18:58:55
0-2日本引发连锁反应!比输球可怕的是,中国女足二十年逢日不胜

0-2日本引发连锁反应!比输球可怕的是,中国女足二十年逢日不胜

大秦壁虎白话体育
2026-04-15 23:33:30
又一州加入,美国总统大选距终结“赢者通吃”规则就差48票了?

又一州加入,美国总统大选距终结“赢者通吃”规则就差48票了?

澎湃新闻
2026-04-15 16:52:26
只差3秒!成都抓捕摩萨德间谍,1.7吨涉密硬盘曝光,国家机密险遭泄露!

只差3秒!成都抓捕摩萨德间谍,1.7吨涉密硬盘曝光,国家机密险遭泄露!

华山穹剑
2026-04-15 19:36:57
深圳5岁女童撸流浪猫后变秃头!医生提醒:超60%儿童头癣源于宠物

深圳5岁女童撸流浪猫后变秃头!医生提醒:超60%儿童头癣源于宠物

听心堂
2026-04-15 17:33:33
中国油轮霸气通过封锁,美国抢着为我“辩经”

中国油轮霸气通过封锁,美国抢着为我“辩经”

世家宝
2026-04-15 09:33:02
05后小妹「崩老头」正在悄悄流行,半黄全灰纯靠演

05后小妹「崩老头」正在悄悄流行,半黄全灰纯靠演

媒体人溪婉
2026-04-15 12:20:58
2026-04-16 07:44:49
小乐数学科普 incentive-icons
小乐数学科普
zzllrr小乐,小乐数学科普,让前沿数学流行起来~
309文章数 7关注度
往期回顾 全部

科技要闻

小鹏最贵SUV预售39.98万!L4架构3000TOPS算力

头条要闻

欧洲100万人请愿要求制裁以色列 以总理:欧洲道德软弱

头条要闻

欧洲100万人请愿要求制裁以色列 以总理:欧洲道德软弱

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

谢娜现身环球影城,牵手女儿温馨有爱

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

空间丝毫不用妥协 小鹏GX首发评测

态度原创

旅游
本地
游戏
健康
手机

旅游要闻

意大利媒体:云南泼水节成跨境旅游新焦点

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

天才!修车模拟器撞档《地平线6》:赛完车去修车

干细胞抗衰4大误区,90%的人都中招

手机要闻

骁龙8 Elite Gen6曝光!台积电2nm+2+3+3架构,小米18系列稳了

无障碍浏览 进入关怀版