网易首页 > 网易号 > 正文 申请入驻

打破56年数学铁律!谷歌AlphaEvolve自我进化实现算法效率狂飙

0
分享至

数学能力几乎和AlphaGo的围棋水平一样?!

这是研究员对AlphaEvolve的最新评价,就在不久之前,谷歌DeepMind联合陶哲轩等一众顶尖科学家打造了「通用科学人工智能」AlphaEvolve,直接打破了矩阵乘法领域56年以来的效率基准。

一位谷歌前员工更是将这一成就类比为传说中的“神之一手”:

  • 太疯狂了!AlphaEvolve的数学能力相当于AlphaGo打败人类的“神之一手”第37步。

具体而言,4x4矩阵乘法49次标量乘法效率基准已经持续56年,而AlphaEvolve直接将这个数字改写为48

别看数字只前进了一小步,但背后所代表的更快的矩阵乘法算法可谓意义重大。

不仅可以解决复杂数学难题,还能用来改进芯片设计、提高数据中心和AI训练的效率。

在谷歌内部使用中,它将Gemini架构中大型矩阵乘法运算加速了23%,从而将Gemini的训练时间缩短了1%,并且还将FlashAttention提速了32.5%。

那么接下来的问题是——

AlphaEvolve是如何做到的?背后藏着哪些核心技术原理?

在AlphaEvolve发布后的第一时间,知名播客《Machine Learning Street Talk》第一时间采访到了其背后的两位核心研究员:Alexander Novikov(左下)和Matej Balog(右下)。

在1个多小时的交谈中,关于AlphaEvolve如何改进矩阵乘法的详细过程、背后的技术原理以及中间遇到了哪些问题来了个一次性大公开。

网友们纷纷表示,很高兴看到更多干货流出~

Okk,以下为重点内容整理。

秘诀在于让AI“完全自由探索”

AlphaEvolve的一大作用,就是推进数学和算法发现的前沿。

其中最重要的成果之一,当属改进了Strassen于1969年提出的算法,它发现了一种使用48次标量乘法来对4x4复值矩阵进行乘法运算的算法。

关于取得这次突破的详细过程,两位研究人员揭示了几个关键环节。

大约两年前,谷歌开发了Alpha Tensor这个专门用于发现矩阵乘法算法的强化学习Agent,其前身就是著名的通用棋类AI“AlphaZero”,而AlphaZero更是在AlphaGo的基础上发展而来。

虽然Alpha Tensor确实能找到一些更快的算法,但使用范围仅限于布尔矩阵(即矩阵中的每个元素只有0或1),对普通实数/复数矩阵无突破。

于是,AlphaEvolve基于Alpha Tensor框架,进一步引入了进化算法,通过迭代生成、评估和优化候选算法来探索更优解。

与人类设计的算法不同,AlphaEvolve不依赖一些预设的“经验法则”或“设计套路”,比如习惯将问题固定分块(几X几),而是完全放开限制自由探索。

之所以这样做,是因为传统算法的“对称性陷阱”可能将搜索空间限制在局部最优(如49次乘法),从而错过更高效但结构非常规的算法。

最终,当研究人员主动让AlphaEvolve搜索复数矩阵乘法算法(比实数更一般化)时,他们意外发现复数算法在实数域同样有效

因此他们立即扩大搜索空间(更复杂的运算组合),结果找到了一个仅需48次乘法的复数算法,优于Strassen递归的49次,并且该算法也进一步通过了数学验证。

而在突破4x4矩阵乘法算法后,他们还挑战了规模更大的矩阵,如5×5、6×6矩阵。

不过遗憾的是,AlphaEvolve未能超越现有最优解(如6×6因搜索空间爆炸且未引入对称性偏置)

研究人员表示,这可能是因为更大矩阵需要特定归纳偏置(如对称性)来缩小搜索空间,而AlphaEvolve的通用性在此成为劣势。

换句话说,今后人们还需要在完全开放搜索约束之间寻找平衡。

但不可否认的是,AlphaEvolve的一大优势在于开箱即用,研究员Matej Balog表示:

  • 它不仅能用于数学和科学问题的新发现,还能找到可以直接部署到谷歌关键计算堆栈中的算法。
  • 这对我来说是前所未有的体验,甚至超出了我的预期。

AlphaEvolve背后核心技术

AlphaEvolve不是试图生成解决方案,而是像inception一样生成生成解决方案的东西,它能够设计非常先进的算法。

研究人员提到,AlphaEvolve的高级架构是一种进化算法。对于系统提供的任何代码段,都可以自动评价它是否好以及有多好,然后继续迭代。

在这种评估和迭代的循环中,系统能够识别最好的代码,然后将它“喂”给LLM。

Gemini大语言模型体系

AlphaEvolve以Gemini FlashGemini Pro模型为基础,同时调用二者的功能。

Gemini Flash用于提升速度,快速处理大量数据、广泛洞察信息,在生成算法代码时,能够快速筛选大量代码片段。

Gemini Pro负责提升深度理解,深入挖掘潜在规律,在筛选的代码片段中选择最符合需求的部分进行整合。

进化算法框架

进化算法是AlphaEvolve实现算法优化创新的核心机制。

借鉴“适者生存”理念,对Gemini 大语言模型生成的多样化代码初始种群的每个算法进行适应度评估,对表现优异的代码保留、变异或组合,投入下一轮优化。

这种选择机制能够确保优质算法的基因被保留,在持续迭代过程中,算法种群的整体性能逐渐提升,逐渐逼近最优解。

研究人员表示,进化算法不仅应用在筛选算法的过程中,还应用于优化提示词上。比如,在改进特定问题之前,会让系统对此问题的提示词本身提出修改建议。

然后在给出的修改后的提示词中精心挑选一组能够更好地实现目标的提示。

自动化评估系统

自动化评估系统是AlphaEvolve对生成算法进行全面量化评价、筛选的关键模块。

通过多维度指标设定、自动化测试执行、评估结果反馈与迭代引导保障算法的持续优化。

研究人员表示,评估指标会有一个非常微妙的限制,他举了一个具体的例子,比如在问题定义中内置时间约束,只关注能够在10分钟之内取得进展的搜索算法,探索算法空间。

系统具备将待评估算法集成到测试环境的能力,通过多场景测试更全面地给出评估结果。

评估结果不仅用于筛选算法,还能为算法的进一步优化提供方向。

比如,某个矩阵乘法算法在准确性方面表现良好,但效率较低,那么后续的优化可能会集中在改进计算流程、减少不必要的计算步骤上。

基于评估结果,自动化评估系统会将表现优秀的算法传递给进化算法模块,作为下一代算法的基础。

异步分布式运行架构

异步分布式运行架构是AlphaEvolve实现高效、灵活算法优化的关键架构。

在进化算法框架中,种群的不同算法可以在异步分布式架构下并行进化,每个计算节点负责种群中的一部分个体。

例如,在与Gemini大模型的交互中,一些节点可以用来生成针对不同问题的算法代码,而另一部分可以用来进行数据优化处理。

在适用度评估过程中,不同的节点可以分别负责计算某个算法在准确率、效率、资源占用等不同指标上的得分。

从算法→模型,形成优化闭环

聊到最后,两位研究人员还总结了有关AlphaEvolve的几个重要发现。

第一,其性能直接受益于基础语言模型的提升

当前AlphaEvolve主要采用混合模型策略,鉴于模型性能与算法发现效率存在明确正相关,因此未来可进一步提升基础模型能力。

第二,当前已初步实现递归自我改进,即AI已经展现出自我增强的潜力。

一旦将改进后的算法应用到基础模型,最终将形成一个自我优化的闭环。例如一开头提到的,将Gemini架构中大型矩阵乘法运算加速了23%,从而将Gemini的训练时间缩短了1%。

第三,当前实际资源消耗呈现高度灵活性

具体来说,简单问题几乎能即时解决,而类似矩阵乘法这样的复杂问题往往需数百小时计算,系统目前能自动匹配问题难度调整资源投入。

除了遵循以上发现进行改进,未来还要在核心保持人机协作的同时提升自动化水平,以代替目前人类占主导的情形。

总之,通过以上详细介绍,有网友再次意识到了AlphaEvolve的重要性:

  • 我们正在开发一项能够催生真正新技术的技术。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚刚!许家印当庭认罪!2万亿巨债谁来买单?

刚刚!许家印当庭认罪!2万亿巨债谁来买单?

澳洲红领巾
2026-04-14 14:18:38
NBA官方:东契奇再度加冕得分王 约基奇荣获篮板&助攻王

NBA官方:东契奇再度加冕得分王 约基奇荣获篮板&助攻王

北青网-北京青年报
2026-04-14 20:04:19
新能源车的「斩杀线」上,站满老司机

新能源车的「斩杀线」上,站满老司机

最人物
2026-04-14 14:25:52
蔡振华现状:65岁圆满无遗憾,享受退休生活,唯独37岁儿子让他愁

蔡振华现状:65岁圆满无遗憾,享受退休生活,唯独37岁儿子让他愁

洲洲影视娱评
2026-04-14 13:58:26
网曝钟丽缇代孕要了个男孩,老公张伦硕态度坚决,二人备孕近10年

网曝钟丽缇代孕要了个男孩,老公张伦硕态度坚决,二人备孕近10年

萌神木木
2026-04-14 17:36:04
【早报】今夜没有奇迹!巴黎马竞晋级欧冠四强

【早报】今夜没有奇迹!巴黎马竞晋级欧冠四强

体坛周报
2026-04-15 07:59:22
1.7亿欧豪购沦为笑柄!利雅得新月双线崩盘,本泽马成悲情背景!

1.7亿欧豪购沦为笑柄!利雅得新月双线崩盘,本泽马成悲情背景!

田先生篮球
2026-04-14 22:49:11
英伟达首席科学家:以前8个人干10个月的活,现在一个晚上搞定了

英伟达首席科学家:以前8个人干10个月的活,现在一个晚上搞定了

顶级大佬思维
2026-04-14 18:13:14
美军“冒死”营救飞行员,救人还是“挽尊”?魏东旭:代价高昂,执行秘密任务的特种部队无奈“暴露”

美军“冒死”营救飞行员,救人还是“挽尊”?魏东旭:代价高昂,执行秘密任务的特种部队无奈“暴露”

上观新闻
2026-04-14 19:45:02
39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

39岁前国脚现状:定居美国踢野球,早已财富自由,有2个可爱女儿

揽星河的笔记
2026-04-14 15:18:30
凯蒂佩芮爆性侵女演员!遭控「下体磨脸」恶到吐 拿美签封口20年

凯蒂佩芮爆性侵女演员!遭控「下体磨脸」恶到吐 拿美签封口20年

ETtoday星光云
2026-04-14 09:56:57
郑丽文台湾东吴大学演讲:名人的话听听就好,原创比什么都重要

郑丽文台湾东吴大学演讲:名人的话听听就好,原创比什么都重要

爆角追踪
2026-04-14 14:38:45
“保安喷辣椒水赶人”后续:深圳一售楼处从抢购到冷清

“保安喷辣椒水赶人”后续:深圳一售楼处从抢购到冷清

极目新闻
2026-04-14 23:19:23
曾志伟寿宴,叶子楣抢尽风头,邱淑贞颜值崩塌,和温碧霞像两代人

曾志伟寿宴,叶子楣抢尽风头,邱淑贞颜值崩塌,和温碧霞像两代人

有范又有料
2026-04-14 15:43:41
曝大闹昆明候机厅:狂踹工作人员,闹事母女正脸曝光,孩子受牵连

曝大闹昆明候机厅:狂踹工作人员,闹事母女正脸曝光,孩子受牵连

奇思妙想草叶君
2026-04-14 17:03:12
吴千语现身上海红毯!真空上阵副乳太抢镜,小腹微凸被疑有“喜”

吴千语现身上海红毯!真空上阵副乳太抢镜,小腹微凸被疑有“喜”

天天热点见闻
2026-04-15 05:22:59
别再尬演情妇了!一脸疲态、五大三粗,这是迷倒男人该有的皮囊?

别再尬演情妇了!一脸疲态、五大三粗,这是迷倒男人该有的皮囊?

白面书誏
2026-04-14 14:09:53
气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

气温回暖,猝死的人越来越多?医生强调:宁睡到中午,也别做5事

医学原创故事会
2026-04-14 23:52:04
46天损失2700亿,伊朗扛不住?中东5国收通知,必须赔偿战争损失

46天损失2700亿,伊朗扛不住?中东5国收通知,必须赔偿战争损失

头条爆料007
2026-04-14 19:06:45
脸没恢复就别出来拍剧了,顶着肿胀脸、笨重假发套,太让人出戏了

脸没恢复就别出来拍剧了,顶着肿胀脸、笨重假发套,太让人出戏了

白面书誏
2026-04-14 18:34:11
2026-04-15 08:11:00
量子位 incentive-icons
量子位
追踪人工智能动态
12469文章数 176448关注度
往期回顾 全部

科技要闻

离职同事"炼化"成AI?这届公司不需要活人了

头条要闻

与伊朗谈判破裂后 特朗普最新表态

头条要闻

与伊朗谈判破裂后 特朗普最新表态

体育要闻

带出中超最大黑马!他让球迷们“排队道歉”

娱乐要闻

网曝钟丽缇代孕要了个男孩 备孕近10年

财经要闻

许家印认罪,他和恒大还有多少欠债?

汽车要闻

售12.99万起/续航2000km 风云T9L上市

态度原创

家居
数码
艺术
本地
公开课

家居要闻

现代融合 自然灵动

数码要闻

小米REDMI Buds 8无线耳机官方超前开箱,新增防丢查找功能

艺术要闻

江青康生绝密信曝光,草书笔迹生硬引发热议!

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版