网易首页 > 网易号 > 正文 申请入驻

谷歌Agent深夜炸场:不止解决300年数学难题、发明新算法、改进芯片设计

0
分享至

今日凌晨,Google DeepMind 发布了一款用于设计高级算法的进化编码智能体(agent)——AlphaEvolve

据介绍,通过将大语言模型(LLM)的创造力与自动评估器相结合,AlphaEvolve 设计了一种更快、更通用的矩阵乘法算法(用于机器学习的基础运算),并为开放式数学问题找到了新的解决方案。

这标志着人类在利用人工智能(AI)技术解决数学和科学领域的重大问题方面迈出了重要一步。

研究团队表示,他们将 AlphaEvolve 应用于研究数学中的分析、组合学、几何等一系列开放性问题。他们发现,对于 75% 的问题,AlphaEvolve 复现了已知的最优解。在 20% 的情况下,它找到了超越任何已知解决方案的新最优解。但在另外 5% 的情况下,AlphaEvolve 找到的解决方案要比已知的最优方案更差。

此外,AlphaEvolve 还可以提高谷歌数据中心、芯片设计和 Gemini 训练流程的效率

Google DeepMind 高级研究科学家 Alexander Novikov 表示:“你可以用一个系统做这么多不同的事情,这非常令人惊讶。”

论文链接:

https://arstechnica.com/ai/2025/05/google-deepmind-creates-super-advanced-ai-that-can-invent-new-algorithms/

设计更好的算法

AlphaEvolve 是一个编码 agent,它不仅能够发现单一函数,还能实现整个代码库的进化,开发出更复杂的算法。

据介绍,AlphaEvolve 利用 Gemini Flash(速度最快、效率最高,最大限度地拓宽了探索思路的广度)和 Gemini Pro(功能最强大,提供了具有洞察力的关键深度建议),提出计算机程序,以代码形式实现算法解决方案。

图|提示(prompt)采样器如何首先为语言模型组装提示,然后生成新的程序。这些程序由评估员进行评估,并存储在程序数据库中。该数据库采用进化算法,决定哪些程序将用于未来的提示。

AlphaEvolve 使用自动评估指标对提出的方案进行验证、运行和评分。这些指标为每个解决方案的准确性和质量提供了客观、可量化的评估。这使得 AlphaEvolve 在数学和计算机科学等可以清晰、系统地衡量进展的广泛领域特别有用。

优化计算生态系统

谷歌表示,在过去的一年中,他们在计算生态系统(包括数据中心、硬件和软件)中部署了 AlphaEvolve 发现的算法,每一项改进的影响都会在他们的人工智能和计算基础设施中倍增,从而帮助构建一个更强大、更可持续的数字生态系统。

图|从数据中心调度和硬件设计到人工智能模型训练,AlphaEvolve 帮助谷歌提供更高效的数字生态系统。

改进数据中心调度

谷歌表示,AlphaEvolve 发现了一种简单但效果显著的启发式方法,可以帮助博格公司更高效地调度谷歌的数据中心。这一解决方案已投入使用一年多,平均可持续回收谷歌全球 0.7% 的计算资源。这种持续的效率提升意味着,在任何特定时刻,同样的计算资源可以完成更多任务。AlphaEvolve 的解决方案不仅带来了强大的性能,还提供了人类可读代码的显著操作优势:可解释性、可调试性、可预测性和易部署性。

协助硬件设计

AlphaEvolve 提出了 Verilog 重写方案,删除了矩阵乘法关键、高度优化算术电路中不必要的位。最重要的是,该建议必须通过鲁棒的验证方法,以确认修改后的电路保持功能正确性。这项建议被集成到即将推出的谷歌定制 AI 加速器张量处理单元(TPU)中。通过用芯片设计人员的标准语言提出修改建议,AlphaEvolve 促进了 AI 和硬件工程师之间的合作,从而加速了未来专用芯片的设计

加强 AI 训练和推理

AlphaEvolve 加快了 AI 的性能和研究速度。通过找到将大型矩阵乘法运算划分为更易于管理的子问题的更智能方法,AlphaEvolve 将 Gemini 架构中的这一重要内核加速了 23%,从而将 Gemini 的训练时间缩短了 1%。由于开发生成式 AI 模型需要大量计算资源,因此每提高一个效率,就能节省大量资金。除了性能提升,AlphaEvolve 还大大减少了内核优化所需的工程时间,从专家数周的努力缩短到自动实验的数天,使研究人员能够更快地进行创新。

AlphaEvolve 还能优化低级 GPU 指令。这一极其复杂的领域通常已经由编译器进行了大量优化,因此人类工程师通常不会直接对其进行修改。AlphaEvolve 对基于 Transformer 的 AI 模型中的 FlashAttention 内核实现了高达 32.5% 的提速。这种优化可以帮助专家找出性能瓶颈,并轻松地将改进措施纳入代码库,从而提高他们的工作效率,并在未来节省计算和能源。

推动数学和算法发现的前沿发展

AlphaEvolve 还能够提出解决复杂数学问题的新方法。AlphaEvolve 为计算机程序提供了一个最小的编码骨架,它设计了基于梯度的优化程序的许多组件,发现了矩阵乘法的多种新算法,这是计算机科学中的一个基本问题。

视频|AlphaEvolve 为发现更快的矩阵乘法算法而提出的修改列表。AlphaEvolve 对多个组件提出了大量修改建议,包括优化器和权重初始化、损失函数和超参数扫描。这些变化非常不简单,在进化过程中需要 15 次突变。

AlphaEvolve 发现了一种使用 48 次标量乘法进行 4x4 复值矩阵乘法的算法,改进了 Strassen 1969 年的算法。

为了研究 AlphaEvolve 的广度,谷歌团队将该系统应用于数学分析、几何、组合学和数论中的 50 多个开放问题。该系统的灵活性使我们能够在数小时内完成大部分实验。在大约 75% 的情况下,AlphaEvolve 重新发现了最先进的解决方案。

在 20% 的情况下,AlphaEvolve 改进了之前已知的最佳解决方案,在相应的未决问题上取得了进展。例如,它推进了接吻数问题。300 多年来,这个几何难题一直吸引着数学家,它涉及到接触一个共同单位球的非重叠球的最大数量。AlphaEvolve 发现了一个由 593 个外球组成的构型,并在 11 维中建立了一个新的下限。

解决更广泛的问题

AlphaEvolve 展示了从发现特定领域的算法到开发更复杂的算法,以应对广泛的现实世界挑战的过程。未来,随着 LLM 能力的提高,尤其是当它们在编码方面变得更加出色时,AlphaEvolve 将不断改进。

谷歌团队表示,虽然 AlphaEvolve 目前正被应用于数学和计算机领域,但其通用性意味着它可以应用于任何问题,其解决方案可以被描述为算法并自动验证。

或许在未来,AlphaEvolve 可以在材料科学、药物发现、可持续发展以及更广泛的技术和商业应用等更多领域带来变革。

整理:学术君

如需转载或投稿, 请直接在公众号内留言

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

学医后才知道,保护心血管最好的运动,不是快走慢跑,而是这个

垚垚分享健康
2026-03-26 13:09:39
奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

奥恰洛夫:我从圈内听说,樊振东明年甚至有可能再换一次俱乐部

懂球帝
2026-03-26 11:24:21
巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

巴蒂:曾想成为大罗那样的前锋但我做不到;哈兰德让我很惊讶

懂球帝
2026-03-26 11:02:09
一路走好!中医大师黄贵华疑因心脏骤停去世,和张雪峰有相同习惯

一路走好!中医大师黄贵华疑因心脏骤停去世,和张雪峰有相同习惯

冷紫葉
2026-03-26 18:24:16
英国以国家安全为由否决了中企在苏格兰建厂计划,外交部:中英经贸绿色合作的本质是互利共赢,不应受到泛政治化、泛安全化的冲击

英国以国家安全为由否决了中企在苏格兰建厂计划,外交部:中英经贸绿色合作的本质是互利共赢,不应受到泛政治化、泛安全化的冲击

潇湘晨报
2026-03-26 16:25:20
美军继续调兵,伊朗已在哈尔克岛布雷备战!鸽派将军们坚持打下去

美军继续调兵,伊朗已在哈尔克岛布雷备战!鸽派将军们坚持打下去

鹰眼Defence
2026-03-26 16:06:38
美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

美军第82空降师3000人出兵,危急时刻,伊朗特种兵亮剑56冲和FPV

沧海旅行家
2026-03-26 13:11:41
高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

高速停车区卫生间,满地手纸无从下脚;甘肃高速回应:是个待开发停车区,已打扫干净

大风新闻
2026-03-26 18:19:03
蛊惑人心 1:独狼瘸东

蛊惑人心 1:独狼瘸东

金昔说故事
2026-03-26 19:57:07
经济学家巴曙松被带走调查?港交所回应

经济学家巴曙松被带走调查?港交所回应

澎湃新闻
2026-03-25 20:01:16
60年前,金门战役里被俘的3000名我军将士,如今都怎么样了

60年前,金门战役里被俘的3000名我军将士,如今都怎么样了

老范谈史
2026-03-17 09:58:57
纪念张雪峰的三个理由

纪念张雪峰的三个理由

阿亮评论
2026-03-25 09:20:28
骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

骑士两大败因出炉,哈登赛季新高!阿特金森直言不讳,米切尔无奈

鱼崖大话篮球
2026-03-26 11:49:12
A股最惨股票!43个跌停从106元跌到0.07元,股民被连根拔起

A股最惨股票!43个跌停从106元跌到0.07元,股民被连根拔起

财经市界
2026-03-10 08:42:16
小米把这套系统藏了15年,今天终于拔了插头

小米把这套系统藏了15年,今天终于拔了插头

我是一个粉刷匠2
2026-03-26 10:29:50
以军对伊朗基础设施发动大规模打击

以军对伊朗基础设施发动大规模打击

新华社
2026-03-26 12:29:02
大意了!张雪峰不同时段坐姿,证明他越来越疲惫了,可惜错过了

大意了!张雪峰不同时段坐姿,证明他越来越疲惫了,可惜错过了

魔都姐姐杂谈
2026-03-26 10:53:11
“14天12板”!000908,复牌后上演“地天板”

“14天12板”!000908,复牌后上演“地天板”

大众证券报
2026-03-26 17:58:54
浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

浅色系穿搭!这个组合让你在健身房瞬间吸引眼球!

独角showing
2025-12-31 21:08:57
男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

男子买菜顺手买体彩!花4元中698万 先上班再领奖 现场捐2000元

念洲
2026-03-26 13:12:32
2026-03-26 20:31:00
学术头条
学术头条
致力于学术传播和科学普及,重点关注AI4Science、大模型等前沿科学进展。
1430文章数 5081关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
时尚
亲子
旅游
公开课

转头就晕的耳石症,能开车上班吗?

皮衣+裙,高级到炸

亲子要闻

这就是引导型老师的厉害吗?

旅游要闻

鲁冰花开啦!快来新乡南太行八里沟 赴一场春日之约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版