网易首页 > 网易号 > 正文 申请入驻

突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体一夜屠龙

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】谷歌DeepMind重磅推出AlphaEvolve,最强通用AI智能体横扫数学难题!它不仅推动了300年「接吻数难题」,一举颠覆了56年前Strassen算法神话。而且,还在AI训推、TPU设计、数据中心领域,展现出了极强的实力。

就在刚刚,谷歌DeepMind祭出终极AI智能体——AlphaEvolve,一个由Gemini驱动的进化编码神器。

历时一年半,它的出世,直接炸翻了算法界。


AlphaEvolve核心机制,是将谷歌Gemini解决创造性问题的能力和能验证答案的自动评估器相结合,然后用进化框架来优化最有潜力的想法。

它用48次标量乘法,搞定4x4复数矩阵乘法,改进了1969年Strassen最优算法。

AlphaEvolve不仅仅是矩阵乘法屠龙刀,还是个跨界狂魔。

DeepMind团队让其解决数学分析、几何、组合学、数论等领域的50+开放问题。



菲尔兹奖得主陶哲轩等大佬亲自出题,谷歌论文致谢

在约75%题目中,它重新发现了最前沿解法;在20%题目中,它直接碾压了已知最佳解。

AlphaEvolve最炸裂的战绩,便是改进了困扰数学家300多年的「接吻数问题」!


Wikipedia已更新至谷歌DeepMind的最新数据

甚至,AlphaEvolve让谷歌数据中心效率飙升,平均回收了0.7%的计算资源。

此外,它还能提升芯片设计和AI训练过程的效率,包括训练它自己所使用的LLM。

AI初创创始人Justin Halford惊叹AlphaEvolve超人编码能力,并称编程将其十年内迎来AlphaGo时刻。


利用LLM设计更好的算法

2023年,谷歌首次展示了LLM的惊人能力:生成用计算机代码编写的函数,不仅能帮助发现开放科学问题的新知识,还能证明其正确性。

这一突破,为算法设计开启了全新篇章。


论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf

如今,谷歌AlphaEvolve更进一步,超越了单个函数的生成,进化出能够优化整个代码库,并开发更复杂算法的能力。

AlphaEvolve通过利用谷歌一系列SOTA模型,协同生成计算机程序,以代码形式实现高效的算法解决方案。

其中,最快、最高效的Gemini Flash最大程度地拓展了探索性思路的范围,而性能最强的Gemini Pro则通过富有洞察力提供关键优化建议。

AlphaEvolve的核心在于,其智能的算法生成与进化机制,如下图所示。


提示词采样器为语言模型构建提示词,随后语言模型会生成新的程序。生成的程序会经过评估模块的评估并存储于程序数据库中,该数据库采用进化算法来决定哪些程序会被用于后续的提示词构建

AlphaEvolve还引入了自动评估指标,来验证、运行和评估候选程序。

它对提供的每个解决方案的准确性和质量,进行客观、可量化的评估。

这种系统化方法确保了算法优化透明度,尤其在数学、计算机科学等需要精确衡量进展的领域,展现出巨大的潜力。

发现矩阵乘法算法

颠覆56年最优解神话

AlphaEvolve的威力究竟有多炸裂?

它能为复杂的数学问题提出新方法。

在提供最小代码框架后,它便能设计出全新的基于梯度优化程序的组件发现了多种用于矩阵乘法的新算法。

AlphaEvolve开发的多种算法,在14个不同矩阵乘法任务上实现了技术突破。


其中,最耀眼的成果,是用48次标量乘法来完成4x4复数矩阵乘法,彻底颠覆了Strassen算法的「最优解」神话。

过去56年间,在特征为0的任意数域中,设计少于49次乘法的算法,始终是悬而未决的难题。

在求解过程中,AlphaEvolve对初始程序进行了重大改进,通过多项原创性设计逐步优化算法。


Strassen算法

不仅如此,相较于前辈AlphaTensor,AlphaEvolve简直开了挂。

前者还在二进制算术下,对4x4矩阵做小修小补,后者直接杀入复数矩阵,效率飙升。

300年亲吻数难题再获突破

为了测试AlphaEvolve的极限,谷歌DeepMind还将其投入了数学分析、几何、组合学和数论中的50多个开放问题。


在短短几小时内,AlphaEvolve完成了大多数问题的设置,展现出惊艳的灵活性。

更令人震撼的是,它在大约75%情况下,重新发现了最先进的解决方案;在20%情况下,改进了已知的最佳解决方案,并在相应的开放问题上取得了进展。

以困扰数学家300多年「亲吻数」难题为例,AlphaEvolve在11维空间中,发现了593个外球的配置,刷新了该问题的下限。

这一突破不仅让几何界为之沸腾,更呈现了AlphaEvolve在高维数学空间无敌探索力。

几何学中,数学空间的亲吻数被定义为一种空间排布下非重叠单位球体的最大数量。其中,所有的单位球体都与一个中心单位球体相切

此外,在这三个不同领域,AlphaEvolve取得的其他成果:

分析学领域

· 自相关不等式:AlphaEvolve在多个自相关不等式问题上,改进了已知最优界值。

有网友表示,陶哲轩还曾尝试开发一个AI,来验证分析中的估计,而且自己几年前曾梦想过的事情,正在变为现实。


· 不确定性原理:AlphaEvolve通过优化傅里叶分析中不确定性原理构造,生成了一种改进的配置,略微提高了上界。

组合数学与数论

· Erdős最小重叠问题:AlphaEvolve为最小重叠问题建立了新的上界,小幅超越了此前记录


几何与堆积

· 亲吻数问题

·堆积问题AlphaEvolve在多个问题上取得突破:在给定形状内布置N个点,优化最大与最小距离比;实现多边形最优嵌套填充;改进Heilbronn问题变体(构造避免形成小面积三角形的点集)

重构计算生态系统

效率成倍飙升

当然,AlphaEvolve的突破不局限于数学,其实际应用已深刻改变了谷歌的计算生态系统。

在过去一年中,谷歌将AlphaEvolve发现的算法,部署到数据中心、硬件、软件等多个领域。

这些算法优化措施,显著提升了计算效率,尤其在AI和计算基础设施中成倍放大。


AlphaEvolve助力谷歌实现了更高效的数字生态系统,涵盖从数据中心调度、硬件设计到AI模型训练的各个环节

这些改进不仅降低了能耗和运营成本,还为所有用户构建一个更强大、更可持续的数字生态系统。

数据中心调度 :节省0.7%计算资源

在优化谷歌庞大的数据中心调度系统Borg时,AlphaEvolve发现了一种简单但非常有效的启发式方法,显著提升计算资源效率。

这个解决方案已投入生产一年多,平均持续回收谷歌全球0.7%的计算资源。

这意味着,在相同的计算资源消耗下,任何时刻数据中心都能完成更多的任务。

更令人叹服的是,AlphaEvolve的解决方案不仅性能强大,其代码还具备显著的运营优势:可解释性、易调试性、可预测性和易部署性。

设计谷歌下一代TPU

AlphaEvolve的触角还延伸到了硬件设计领域。

在优化谷歌下一代TPU时,它提出了一种Verilog重写方案,精准删除了用于矩阵乘法的关键、高度优化的算术电路中冗余位。

至关重要的是,这个方案必须通过了严格的验证流程,确保了修改后的电路保持功能正确性。


网友表示,这一改进代表了Gemini对TPU算术电路的首次直接贡献

目前,它已经被集成到了谷歌即将推出的TPU中。

通过在芯片设计师的标准语言中提出修改建议,AlphaEvolve架起了AI和硬件工程师之间桥梁,加速未来专用芯片的设计。

内核加速23%,优化时间缩短至数天

AlphaEvolve在AI训练和推理方面的突破,更是令人瞠目结舌。

通过找到更优的方法,将大型矩阵乘法分解为更易于处理的子问题,AlphaEvolve将Gemini架构中关键内核加速了23%,让训练时间缩短了1%。

在AI模型动辄消耗海量计算的今天,这一效率提升将节省巨大成本和能源消耗。

不仅如此,AlphaEvolve还将内核优化的工程时间,从专家数周砍到了自动实验的几天时间,大幅加速研究人员创新步伐。

AlphaEvolve还可以优化底层GPU指令。

这个极其复杂的领域通常已经通过编译器进行了大量优化,因此,人工优化往往难以奏效。

AlphaEvolve在基于Transformer的AI模型中,对FlashAttention内核实现高达32.5%的加速。

这种优化有助于专家查明性能瓶颈,并轻松地将改进纳入其代码库中,从而提高他们的生产力,并为未来节省计算资源和能源提供可能。

参考资料:

https://www.nature.com/articles/d41586-025-01523-z

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

时时有聊
2025-11-07 09:15:43
佩洛西宣布退休计划,特朗普回应:她是个邪恶的女人,退休对国家是大贡献

佩洛西宣布退休计划,特朗普回应:她是个邪恶的女人,退休对国家是大贡献

环球时报国际
2025-11-07 12:56:30
没带勺子来新疆的人,都后悔了

没带勺子来新疆的人,都后悔了

穷游网
2025-11-07 18:09:25
两弹一星元勋姚桐斌,被一闷棍结束生命,年仅46岁

两弹一星元勋姚桐斌,被一闷棍结束生命,年仅46岁

霹雳炮
2025-11-01 21:05:52
预判了詹姆斯的预判,湖人交易东契奇是神来之笔,重新掌握主动权

预判了詹姆斯的预判,湖人交易东契奇是神来之笔,重新掌握主动权

摸神drose
2025-11-07 21:57:38
反转!传翁帆未入职清华,担忧之事发生了,学校官网披露更多细节

反转!传翁帆未入职清华,担忧之事发生了,学校官网披露更多细节

秋姐居
2025-11-07 14:31:53
全运会乒乓球大爆冷,首位世界冠军被淘汰,无缘16强,陈幸同险胜

全运会乒乓球大爆冷,首位世界冠军被淘汰,无缘16强,陈幸同险胜

以茶带书
2025-11-07 18:06:41
山姆退卡潮愈演愈烈!阿里高管遭全网抵制,员工哭诉天塌了

山姆退卡潮愈演愈烈!阿里高管遭全网抵制,员工哭诉天塌了

吃瓜局
2025-11-06 20:33:10
掘金复仇勇士成功!不是巴特勒,不是格林,输球罪人是这著名三傻

掘金复仇勇士成功!不是巴特勒,不是格林,输球罪人是这著名三傻

安海客
2025-11-08 13:38:03
郑丽文重磅承诺:要全面执政,卢秀艳撕下伪装,“反郑联盟”形成

郑丽文重磅承诺:要全面执政,卢秀艳撕下伪装,“反郑联盟”形成

阿钊是个小小评论员
2025-11-08 03:11:11
穆里尼奥暂停新闻发布会,并保持沉默,与名宿女儿一起力挺科斯塔

穆里尼奥暂停新闻发布会,并保持沉默,与名宿女儿一起力挺科斯塔

穆里尼奥主义者
2025-11-08 10:02:10
何超琼戴大钻石耳饰,笑容灿烂,她的头发白了,眼角细纹越看越美

何超琼戴大钻石耳饰,笑容灿烂,她的头发白了,眼角细纹越看越美

情感大头说说
2025-11-08 11:05:29
预制板房或将“全面拆除”?新规之下,一切都变了,2种方式安置

预制板房或将“全面拆除”?新规之下,一切都变了,2种方式安置

巢客HOME
2025-11-08 05:10:03
白所成被抓前有多狂?杀人只需一句话,对断电制裁放狠话:无所谓

白所成被抓前有多狂?杀人只需一句话,对断电制裁放狠话:无所谓

凡知
2025-11-07 16:10:32
F1巴西:维斯塔潘机会来了?冲刺赛和排位赛或因暴风雨而延期举行

F1巴西:维斯塔潘机会来了?冲刺赛和排位赛或因暴风雨而延期举行

体育妞世界
2025-11-08 14:19:36
武僧一龙拒绝扇耳光大赛,呼吁中国人都别参与这项残害身体的运动

武僧一龙拒绝扇耳光大赛,呼吁中国人都别参与这项残害身体的运动

杨华评论
2025-11-07 21:49:27
日本男人整日饮酒,为啥还能寿命世界第一?这几点一般人未必做到

日本男人整日饮酒,为啥还能寿命世界第一?这几点一般人未必做到

涵豆说娱
2025-11-05 16:38:21
恭喜!23岁落选港姐正式签约TVB,前艺人爸爸分享喜悦

恭喜!23岁落选港姐正式签约TVB,前艺人爸爸分享喜悦

日落于西
2025-11-07 17:02:50
上海行长陆振华:豢养32位女员工,专挑肤白貌美,个个死心塌地

上海行长陆振华:豢养32位女员工,专挑肤白貌美,个个死心塌地

凯裕说故事
2024-10-08 15:50:00
反转!库尼亚力劝拉特克利夫:曼联必须推翻这位巨星离队决定

反转!库尼亚力劝拉特克利夫:曼联必须推翻这位巨星离队决定

奶盖熊本熊
2025-11-08 12:17:14
2025-11-08 15:35:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13815文章数 66238关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

头条要闻

特朗普:南非对白人搞"屠杀" G20峰会美国不去了

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

梁婷为辛芷蕾发声:没什么可质疑的

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

健康
旅游
家居
教育
数码

超声探头会加重受伤情况吗?

旅游要闻

做广东旅游“优质守护者”!七协会发出优质服务倡议

家居要闻

现代自由 功能美学居所

教育要闻

张桂梅:宋佳年轻漂亮,但“有些脾气还是像我”

数码要闻

每周一部原创:苹果高管透露 2026 年 Apple TV 内容“轰炸”计划

无障碍浏览 进入关怀版