网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

陶哲轩力推AlphaEvolve：解决67个不同数学问题，多个难题中超越人类最优解

2025-12-03 23:14:42　来源: 算法与数学之美

北京举报

0

分享至

陶哲轩又来安利AlphaEvolve了。

在与DeepMind高级工程师Bogdan Georgiev等人合著的新论文中，陶哲轩称其为数学发现的有力新工具。

具体来说，他们用AlphaEvolve研究了67个数学问题，涵盖组合数学、几何、数学分析与数论等多个领域。

结果发现，AlphaEvolve在可扩展性、鲁棒性、可解释性方面均优于传统工具。

更关键的是，AlphaEvolve已经可以自主发现新颖的数学构造，并在部分问题上超越人类已有的最优结果。

AI自主发现新数学构造

AlphaEvolve在67个问题的测试中，不仅复现了众多已知最优解，更在多个方面展现了其独特的发现能力。

一个关键的成就是AlphaEvolve能够自主发现人类未曾一窥的新数学构造。

例如在处理Nikodym集问题时，系统生成的初步构造虽然尚未达到最优，但它为人类研究者提供了“一个极好的人类直觉跳板” 。

基于AI提供的结构，研究人员通过人工简化和直觉推演，最终找到了一个更优的构造，改进了已知的上界，这一人机协作的成果将作为一篇独立的数学论文发表。

同样地，在算术Kakeya猜想中，AlphaEvolve也发挥了类似作用。

系统不仅将一个已知的下界从1.61226提升至1.668，其构造的解（形态上类似于离散高斯分布）还启发人类数学家建立了新的渐近关系，相关成果也即将发表。

这种启发人类研究的能力，与AlphaEvolve输出结果的可解释性紧密相关。

系统在大多数情况下生成的是结构清晰的程序代码，而非难以理解的黑盒结果，这使得人类专家可以方便地分析、归纳其发现的模式，并提炼出通用的数学公式。

积木堆叠问题便是这一特性的绝佳体现。

在该问题中，系统最初生成了一个逻辑正确的递归程序来计算积木的放置。在随后的演化中，系统内部的LLM分析了这段代码的逻辑，并自主将其重构为一个更简洁、高效的显式程序。

这个最终程序清晰地揭示了最优解与谐波数（harmonic numbers）之间的数学关系，这与人类已知的理论公式完全一致，展示了系统从复杂解法中提炼数学本质的能力。

除了方案的清晰性，AlphaEvolve在不同类型的问题设置下也表现出了强大的鲁棒性。

它能够有效处理高维度参数空间、复杂的几何约束以及基于蒙特卡洛模拟的近似评分函数。

比如这里有一个最小三角形密度问题。

研究人员最初设计了一个朴素的评分函数，但系统很快利用了该问题空间的非凸性，通过“欺骗”评分函数获得了超越理论最优的不可能分数。

为了解决这个问题，研究人员设计了一个更鲁棒的新评分函数，该函数基于问题的利普希茨连续性（Lipschitz type bounds）构造。

在切换到这个更复杂的连续评分函数后，AlphaEvolve不再受局部陷阱的迷惑，迅速收敛到了已知的、正确的理论最优解。

并且AlphaEvolve具备了出色的泛化能力，来看IMO 2025的第6题。

研究人员只在输入n为完全平方数时才对系统进行评分。这种“信息限制”反而迫使AlphaEvolve去寻找这些稀疏实例背后的共同结构模式，而不是对每个n进行“过拟合”。

最终，系统成功发现并输出了在所有完全平方数n上均达到最优的通用构造，展现出了归纳能力。

在实际应用中，AlphaEvolve的效率极高，仅需少量高质量提示即可驱动。论文指出，来自领域专家的提示（expert guidance）往往能显著提升最终构造的质量，表明系统对人类输入具有高度的敏感性。

同时，该系统在架构上支持并行化，允许研究人员在多个问题实例或同一问题的不同参数设置上同时运行探索，并能自动迁移成功的搜索策略，这在处理多参数的几何类问题时尤其高效。

AlphaEvolve工作模式

AlphaEvolve并非一个单一流程的系统，而是通过不同“工作模式”适应不同类型的数学问题探索任务。

该系统主要在两种不同的模式下运行——“搜索模式”（search mode）和“泛化模式”（generalizer mode）。

“搜索模式”是系统最常用的模式，其目标是高效地发现最优的数学构造，而不必关心构造过程是否具有可解释性或普适性。在这种模式下，AlphaEvolve演化的不是直接生成构造的程序，而是演化用于搜索构造的程序。

每一个被演化的程序本身就是一个“搜索启发式算法”（search heuristic）。

评估器会给予这些启发式算法一个固定的时间预算，算法的得分取决于它在此预算内能找到的最佳构造的质量。

这种方式解决了LLM调用（缓慢且昂贵）与传统局部搜索（快速且廉价）之间的速度差异——一次缓慢的LLM调用用于生成一个高效的搜索策略，该策略随后可以触发大规模的廉价计算，自主探索数百万个候选构造。

系统演化的是一系列“改进器”（improver）函数，它们动态地适应搜索进程，早期可能偏好进行广泛探索的启发式算法，而当接近最优解时，则会演化出更精细的、针对特定问题进行优化的算法。

“泛化模式”则更具挑战性。

其目标是让AlphaEvolve编写一个能够解决任意给定参数n的问题的通用程序。系统的评估方式是考察该程序在一系列不同n值上的综合表现。

这种模式的期望是，通过让系统观察自己在小规模n上找到的最优解，它能够自主“发现模式”，并将其归纳推广为一个适用于所有n的通用公式或算法。

总之，AlphaEvolve展示了AI引导的演化搜索如何补充人类的直觉，为数学研究提供了一个强大的新范式。

论文地址：
https://arxiv.org/abs/2511.02864

文章来源：量子位。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

西班牙队把法国队溜到崩溃佛得角的含金量还在上升

三湘都市报 2026-07-15 14:56:02
264 跟贴 264
河南商水县两财政项目完工，劳务分包负责人投诉：工钱仅结算5万

澎湃新闻 2026-07-15 16:18:05
14750 跟贴 14750

外媒：中国出台扩大消费五年规划

参考消息 2026-07-15 16:04:14
19043 跟贴 19043

姆巴佩遭到对手严重限制被"隐身" 吞下"三届最差战绩"

澎湃新闻 2026-07-15 13:42:28
705 跟贴 705
见证英格兰队被宿敌淘汰，贝克汉姆抱头痛哭，赛后发声：这是场令人心碎的比赛

红星新闻 2026-07-16 10:49:06
204 跟贴 204

女子清晨偷走停在店门口的自行车，得知车主报警后，连夜送还

星视频 2026-07-15 21:45:58
45 跟贴 45

印度知名学者：为什么我们要替别人去和中国作对呢

环球网资讯 2026-07-16 06:34:21
149 跟贴 149
又一架歼-35绿皮机画面披露细节满满

看看新闻Knews 2026-07-15 21:25:06
732 跟贴 732

中国和俄罗斯投了弃权票

政知新媒体 2026-07-15 20:12:24
1642 跟贴 1642
乌对俄船只发动“史无前例”袭击，国际海事组织发声

参考消息 2026-07-15 14:28:29
895 跟贴 895
科创板史上最大IPO今日申购！打新攻略来了，长鑫科技中一签或赚2万元

红星新闻 2026-07-16 11:19:33
13 跟贴 13
三预警齐发：今天全面影响湖北午后尽量少出门

界面新闻 2026-07-16 06:54:16
0 跟贴 0
利雅得胜利俱乐部陷财务危机，C罗443万元日薪无力支付

鲁中晨报 2026-07-15 17:13:25
863 跟贴 863
海关总署：在全球高温多发的情况下，我国空调、电扇、冰箱等“清凉”家电合计出口了1079.1亿元，为全球消费者送去了阵阵“清凉”

政知新媒体 2026-07-14 13:41:53
1839 跟贴 1839
一个湖北商人为何决定现在下场造车？

界面新闻 2026-07-15 19:39:58
72 跟贴 72
巴黎多处知名景点：缩短开放时间；有中国游客透露：高温影响行程，改成瞎溜达

南方都市报 2026-07-14 20:05:15
1872 跟贴 1872
二季度GDP增长4.3%，怎么看？

澎湃新闻 2026-07-16 07:18:04
23 跟贴 23
联合国：霍尔木兹海峡必须保持航运自由，反对限制船舶通行

澎湃新闻 2026-07-15 18:38:40
85 跟贴 85
考辛斯：詹姆斯是传奇，他没有得到体面的告别

文汇报 2026-07-15 18:21:28
301 跟贴 301
教育部增设27个职业教育新专业 2027年开始招生

界面新闻 2026-07-16 10:06:03
304 跟贴 304
宝马7系限量版新车开售，售价121.8万元

界面新闻 2026-07-16 11:21:05
4 跟贴 4
LÀ HAUT「造·极」Serendipity Jewelry 于巴黎发布高级珠宝系列

环球网资讯 2026-07-16 11:07:42
3 跟贴 3
江水上涨，宣城一检修工来不及撤离，被困于激流之中，还好

安徽吃喝玩乐 2026-07-16 12:36:28
0 跟贴 0
全网怒批！救护车不能变 “货拉拉”，比拉水果更刺眼的，是那层没撕掉的 “急救皮”

医客 2026-07-16 12:38:00
0 跟贴 0
别让陈规陋习成为乡村归属感的“拖油瓶”

新浪财经 2026-07-16 12:39:29
0 跟贴 0
【微济阳】事发济阳沟杨浮桥附近！一辆货车失控撞树，司机被困

微济阳 2026-07-16 12:39:08
0 跟贴 0

A股午评：创业板指半日跌1.73%，制冷剂、玻纤、半导体等概念走弱

A股午评：创业板指半日跌1.73%，制冷剂、玻纤、半导体等概念走弱

界面新闻

2026-07-16 11:33:22

月入5万，陪人爬山：爬着爬着，变味了

月入5万，陪人爬山：爬着爬着，变味了

番外行

2026-05-20 07:58:21

《油炸虫子》童星布莱克·加勒特死因公布：急性芬太尼中毒

《油炸虫子》童星布莱克·加勒特死因公布：急性芬太尼中毒

生活观察员啊

2026-07-15 01:17:16

中国请俄方“免开尊口”，除非按中国的条件来，否则没什么好谈的

中国请俄方“免开尊口”，除非按中国的条件来，否则没什么好谈的

霁寒飘雪

2026-07-16 11:41:46

通报停职还没完！霸占车位彭某接连受挫，遴选成绩引发网友热议

通报停职还没完！霸占车位彭某接连受挫，遴选成绩引发网友热议

社会日日鲜

2026-07-15 11:11:59

2-1逆转！梅西助攻双响，刷爆世界杯纪录，4大魔咒，等待梅西打破

2-1逆转！梅西助攻双响，刷爆世界杯纪录，4大魔咒，等待梅西打破

砚底沉香

2026-07-16 05:22:29

8点30分准时起飞，俄末日飞机抵华，普京宣布复仇，乌克兰闯大祸

8点30分准时起飞，俄末日飞机抵华，普京宣布复仇，乌克兰闯大祸

忠于法纪

2026-07-16 09:22:12

他是文强的儿子，父亲被执行死刑母亲被判8年，他现在又是如何呢

他是文强的儿子，父亲被执行死刑母亲被判8年，他现在又是如何呢

磊子讲史

2026-07-04 16:53:05

中国正式改口！以后不叫“日本政府”了，新称呼传递的信号不一般

中国正式改口！以后不叫“日本政府”了，新称呼传递的信号不一般

潘冹旅行浪子

2026-06-23 00:04:49

陆家嘴基金女销售自曝行业潜规则！

陆家嘴基金女销售自曝行业潜规则！

大财可富司机

2026-07-15 10:31:26

人类史上几乎没有哪一位领袖，能像斯大林这样，对自己身边的同僚和战友，展开如此彻底的清洗

人类史上几乎没有哪一位领袖，能像斯大林这样，对自己身边的同僚和战友，展开如此彻底的清洗

人生录

2026-07-10 16:42:29

本届世界杯决赛无论如何，都将创造历史，可西班牙赢面为何大

本届世界杯决赛无论如何，都将创造历史，可西班牙赢面为何大

歪歌社团

2026-07-16 08:05:33

9次成功过人+2次助攻，梅西成有统计以来世界杯淘汰赛首位做到球员

9次成功过人+2次助攻，梅西成有统计以来世界杯淘汰赛首位做到球员

懂球帝

2026-07-16 06:56:10

上海立大功！交大团队研究发现：中药葛根素让肠道“少吸油”40%

上海立大功！交大团队研究发现：中药葛根素让肠道“少吸油”40%

药师华子

2026-07-14 11:36:37

王晶点评周星驰新片：是其近十年拍得最好的作品，武戏不输《少林足球》，但文戏缺少吴孟达、黄一飞等黄金配角略显不足

王晶点评周星驰新片：是其近十年拍得最好的作品，武戏不输《少林足球》，但文戏缺少吴孟达、黄一飞等黄金配角略显不足

极目新闻

2026-07-15 20:30:28

半山豪宅、古董字画、股权分红，数亿资产谁继承？施南生早有遗嘱

半山豪宅、古董字画、股权分红，数亿资产谁继承？施南生早有遗嘱

林轻吟

2026-07-16 07:04:51

被碾压！法媒怒了，六问德尚：为什么不早点弃用他们三个？

被碾压！法媒怒了，六问德尚：为什么不早点弃用他们三个？

童叔不飙车

2026-07-15 21:22:56

梅根72小时紧急救夫，哈里连遭重创，这对夫妻的真相终于藏不住了

梅根72小时紧急救夫，哈里连遭重创，这对夫妻的真相终于藏不住了

全球奇趣娱乐八卦

2026-07-16 05:55:11

2028若此人竞选成功，和平统一窗口或完全关闭，解放军已亮明底线

2028若此人竞选成功，和平统一窗口或完全关闭，解放军已亮明底线

影孖看世界

2026-07-15 23:03:17

Here we go！罗马诺：37岁奥巴梅扬加盟拉科，转会费150万欧

Here we go！罗马诺：37岁奥巴梅扬加盟拉科，转会费150万欧

懂球帝

2026-07-16 01:15:06

算法与数学之美

分享知识，交流思想

5661文章数 64622关注度

往期回顾全部

科技要闻

SpaceX一度跌破发行价，较高点回落约40%

头条要闻

阿根廷FIFA积分登世界第一阿根廷队长：这届太疯狂了

头条要闻

阿根廷FIFA积分登世界第一阿根廷队长：这届太疯狂了

体育要闻

逆天6后卫神阵，图赫尔活活坑死英格兰

娱乐要闻

黄晓明回应赈灾车辆发生交通意外

财经要闻

长鑫科技批量造富：8名高管身家过亿

汽车要闻

零百加速1.96秒腾势Z国内预售价68万起/四季度上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

手机

艺术

房产

军事航空

教育要闻

看了这3个进精神科的家庭，我决定换个思路养孩子……

手机要闻

荣耀MagicOS 10 7月更新首批推送：动效更丝滑还能远程帮长辈用手机

艺术要闻

赵培智 2026年油画作品集（29幅）

房产要闻

海南中考又爆了，800分以上超2万人！

军事要闻

美军称已恢复对伊朗的海上封锁

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版