史诗时刻！AlphaGo神之一手突现，谷歌AI颠覆科研极限？|算法|李世石|谷歌ai|知名企业|alphago|deepmind

分享至

新智元报道

编辑：Aeneas

【新智元导读】太疯狂了，AlphaGo的「第37步」时刻，已经来临。谷歌的AlphaEvolve，让我们从此进入AI创造科学的时代，人类科研将彻底颠覆！背后的研究者也首次接受采访，揭秘研究过程中的一些惊人细节。

这周，谷歌DeepMind扔出了重磅炸弹——AlphaEvolve。

但许多人，仿佛还未意识到这个AI的意义。

可以这么说，AlphaEvolve，就是数学界AlphaGo的「第37步」时刻，堪称疯狂。

谷歌的这个AI，取得了人类未曾发现的数学成果。

比如，它改进了改进了4x4矩阵乘法，将运算次数从49次减少到48次，这是自1969年Strassen算法提出以来，56年内的突破！

另外，它还推进了六边形填充问题的研究，找到了在更大六边形内排列11个和12个六边形的更优解法，超越了人类的解决方案（在停滞16年之后）！

甚至，它一举改进了困扰数学家300多年的「接吻数问题」。

而这一切，都是靠AI自我进化、训练自己所使用的LLM而得到的。

通过自我对弈，它拥有了超人的编码能力，甚至让人预言——

十年内，编程将迎来自己的AlphaGo时刻。

而且，跟AlphaGo的「第37步」不同，AlphaEvolve展现出AI自主优化算法的能力，或将彻底改变芯片设计和数据中心效率。

谷歌CEO Pichai，对「AI训练AI」进行了生动的解释：由Gemini驱动的编码agent，优化了Gemini的训练，形成了一个数据飞轮

跟以往成果不同的是，谷歌DeepMind这次直接弄出一个通用武器。

从此，AI不仅能解决问题，还能发现新的前沿领域。这就代表着，人类集体智慧发生了一次真正的飞跃！

接下来的剧本，或许就是AI横扫各大科学难题，直接颠覆人类科研。

谷歌DeepMind

引领全人类未来

谷歌DeepMind，一直在AI改造世界这个方向引领着前沿。可以说，在将近30年里，他们都在指引着人类文明的方向。

AlphaGo通过学习人类对弈，甚至自我对弈，击败了人类冠军李世石。

AlphaZero通过自我对弈，学会围棋、国际象棋和日本将棋，被称为一种人类从未见过的智慧。

AlphaFold预测了数百万种从未通过实验测量过的蛋白质三维结构。

AlphaDev则发现了更快的排序算法。

AlphaTensor用于进行科学发现，将寻找更快矩阵乘法算法的问题构造成一个游戏，实现了重大突破。

FunSearch则将我们带到更远，通过代码演化，利用LLM寻找新的数学解决方案。

谷歌DeepMind的下一个Alpha，更是令人无比期待。

OpenAI研究员Jason Wei就表示，AlphaEvolve对于像我这样的强化学习铁杆粉丝来说，确实令人不安

所以，这次打造出AlphaEvolve的团队，究竟有哪些人物，经历了哪些探索？

就在最近，Youtube上的人气大V「Machine Learning Street Talk」，就提前获取了谷歌DeepMind的这篇论文，并采访了这项工作的研究者。

半个世纪矩阵乘法突破，研究者当场惊呆

在计算机科学领域，几乎没有问题能像矩阵乘法一样基础。

半个多世纪以来，此领域的一个特定基准，一直被认为难以突破。

因为最优算法的搜索空间极为庞大，使得穷举在实践中几乎不可能，即使对相对较小的矩阵也是如此。

1969年，Strassen通过发现一种算法，彻底改变了这一领域。该算法仅需七次标量乘法，即可乘以两个二乘二矩阵。

而就在今天，这一纪录被Alpha Evolve打破了！

而它能做到一点，连谷歌DeepMind的研究者都没想到。

对于通常情况下的矩阵，仍然没有比使用四十九次乘法进行两次Strassen更好的办法。

开始，研究者们也压根没有期待，它能找到比四十九次更好的结果，因为他们已经用AlphaTensor尝试了很长时间了。

所以，他们只是出于完整性试了一下，因为想在论文中展示这个表格而已。

结果，出乎所有人意料，一个更快的算法，居然被它发现了！

这次，算法使用了48次，而不是49次乘法，彻底打破纪录。

当看到一位同事发消息通知这一结果时，研究者表示自己简直不敢相信。

反复检查三遍后，他们终于确认——

AI不断增强的能力，可以生成全新的、可证明准确的算法，从而推动科学的边界！

跟第一版本有何区别？

根据论文，AlphaEvolve是一种进化编程智能体，显著提升了预训练LLM在复杂任务上的能力。

要知道，此前团队曾有过第一篇论文，讲的是FunSearch，原理与之非常类似。

所以，二者的区别在哪里呢？

研究者介绍说，FunSearch只是在搜索一个单一的函数，但AlphaEvolve，本质上可以作用于整个代码库。

它会在代码库中你标记的区域中进行搜索，甚至优化这些函数之间的交互。

谷歌昂贵的服务器，不用闲置了

所以，AlphaEvolve有没有可能进化出一个方法，来优化谷歌的计算基础设施呢？

出于尝试，谷歌工程师将一个候选方案放进这个AI，令人惊喜的是，它果然进化出了一个更聪明的启发式方法！

现在，这个方法已经被运用于优化谷歌内部的计算基础设施了。

要知道，在谷歌庞大的数据中心，高效安排计算任务是一项非常复杂的操作。如果操作不当，昂贵的服务器就会闲置。

而现在结果正式，这个全新方法利用了谷歌服务器群计算资源的0.7%，对于谷歌来说，这是一项巨大的节省。

盗梦空间成真？

甚至，在另一个自我改进的实例中，它甚至找到了加速Gemini模型训练的方法，这，就为AlphaEvolve本身提供了动力。

这个实例之所以如此有趣，是因为它不仅生成了解决方案，还生成了产生这些方案的程序。

也就是说，Alpha Evolve像《盗梦空间》一样。

甚至研究者表示，在检查代码时，他不仅想到，这看起来完全就是一种数学洞察，或者一种数学假设！

事实也证明了，它们的确对改进结果非常关键。

而Alpha Evolve另外一个有趣的点，就是它仍然非常依赖「人类参与其中」。

过程中，人类负责识别哪些内容是有趣的，找到那些有明确评估标准的问题，将候选解决方案纳入循环中。

然后，Alpha Evolve就会遍历这个可能性的锥体，在过程中不断跳跃，将这个循环继续下去。

所以，Alpha Evolve也预示了一种AI的未来——人类和AI之间，有着强大的协作循环。

曾经有一个「死掉的互联网」的理论，指的是在未来，网上大部分内容都将由AI生成，而且非常表面化、非常肤浅。

而此时，就需要人类来指导AI、改进结果，进行迭代。

而让Alpha Evolve如此酷炫且强大的，也正是人与机器之间的这种互动。

AlphaEvolve，为何如此适合科学发现

在访谈中，主持人向研究者提问道：究竟是什么促使你们走上了进化算法的道路呢？

研究者回答说，这就跟科学发现的过程一样，是一个非常自然的选择。

进化算法能为探索过程带来多样性，确保你不会在早期就锁定在某种特定方法上，因为这种方法有可能是次优解。

最终，我们仍然需要不断探索所有的可能性，尤其是想要做出新的科学发现时。

言简意赅地说，AlphaEvolve就是一个进化算法，对于系统给出代码片段，我们都可以自动测试它好不好，有多好。

一方面，它可以把你限制在你可以解决的问题集上，而另一方面，它涵盖的问题范围又非常广泛。

LLM会给你提出各种想法，通过这个评估器，我们就可以筛选出真正重要的、能做出改变的想法。

最有潜力的代码，将被识别出来，然后专注于改进这些部分。

接下来，采访者就提出了一个重要的问题：我们什么时候才知道，这个过程要结束？

比如，可能我们觉得该终止了，但如果再多等五分钟，就会得到一个近乎完美的算法。

研究者解答了他的疑惑。

从理论上讲，的确永远无法确定如何让算法运行更久，以及会得到什么结果。

但在实践中，这并未造成任何问题。

比如可以这样设置问题：我正在尝试解决这个数学中的开放性问题，寻找能取得进展的搜索算法，但我希望10分钟内就能取得进展。

也就是说，其实我们只探索了能在10分钟内做出进展的算法空间。

当然的确存在这种可能性：如果运行更长时间，说不定还会有表现更好的算法。这个可能性永远无法消除。

那一刻，AI发生了想象力惊人的跳跃

主持人问道：你可以举出一些系统做出真正有想象力的跳跃的例子吗？

研究者表示，一个具体的例子，AlphaEvolve如何发现矩阵乘法算法的。

实际上，他们只是让它设计了一个基于梯度的搜索算法，也即一个能找出的算法的算法，或者说元算法。

第一个搜索算法，是从一个非常简单的代码框架开始的。

研究者并未给它任何东西，只告诉它「用梯度」，然后，它就写出了这些复杂的损失函数和更新函数，而且以完全出人意料的方式引入了随机性。

就在那一刻，研究者惊呼：太厉害了！

当然，这种代码也有可能是人类写出的，但他们真的会想到写出这段特定代码吗？

那一刻，他仿佛顿悟了——AlphaEvolve做的，是一些类似人类的事情，但又显然不是人类会尝试的东西。

人类具体是怎样指导AI的呢？

研究者提及了一个实验，在这个实验中，他们请几个人花了30分钟思考这个问题，记下笔记，然后指导系统完成整个过程。

可以理解为，AI榨出了这个想法的全部精华，理解了它的本质，于是引导LLM得出了这样的目标，同时做了很多优化。

听起来，这就是智能的本质——尝试很多事情，总有一件会成功。

最震撼之处：改变世界，就在当下

研究者表示，在以往，通常我们很难开发出某种科研工具，直接、立刻应用到现实世界的挑战，并产生巨大影响。

而AlphaEvolve的意义就在于，在开箱时就能同时在数学和科学问题上做出新发现，甚至还能发现可以直接部署到谷歌核心计算架构中的算法。

这，是他们此前从未经历过的事情。

AI奇点，或许已经到来了。

参考资料：

https://www.youtube.com/watch?v=vC9nAosXrJw&t=2s

https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.