网易首页 > 网易号 > 正文 申请入驻

陶哲轩看傻:三破18年数学纪录!谷歌推出「AI爱迪生」,科研不再靠灵感?

0
分享至

来源:新智元

【导读】在5月中旬,谷歌发布了AlphaEvolve。不仅30天内攻克了18年未解的难题,或将开启了一场无需「灵感」的科学革命:未来,科学家将不再依赖直觉,而是靠AI解决难题!

利用Gemini模型,它发现全新的算法。

对此,知名华人数学家陶哲轩略感惊讶。

不仅在计算机科学和数学取得重大进展,AI甚至可能影响到更广泛的科学领域。

它不仅仅是生成文本工具,更不是简单的模板生成器。它喻示了AI的无限可能,就像AlphaGo的「神之一手」,展现了人类从未做过的突破。

这甚至可能是迈向AI自我改进的一步。

在深度对话中,华人投资家Sarah Guo(郭睿)采访了谷歌DeepMind科学与战略副总裁Pushmeet Kohli(下图左),以及研究科学家Matej Balog(下图右)。

他们分享了AlphaEvolve的背后故事。 除了数学和计算机科学,他们也进一步畅想:AlphaEvolve背后的理念,是否还能颠覆更多基础科学领域?

AlphaEvolve证明靠智能取代「运气」,也能颠覆科学。 AlphaEvolve,或许正开启一场不靠「灵感」的科学革命。

AlphaEvolve:陶哲轩震惊的进步

DeepMind的使命是负责任地构建人工智能,造福人类。这些年来,DeepMind一直在科学领域寻找新算法。

AlphaEvolve有什么不一样?

Pushmeet Kohli认为区别可以从历史上来看。

一切从AlphaGo说起。

AlphaGo不仅能够高效地探索围棋的所有可能局面,而且能够提出当时最佳走法。在几十年的围棋历史中,人类都没有发现这种下法。

某种意义上,AlphaGo是AI智能体。在庞大的搜索空间中,它可以高效探索并提出最优解。这种能力让人们感到惊讶,因为围棋非常复杂,科学家们认为AI能够在这一领域取得突破还需要很长时间。

从AlphaGo的工作中,DeepMind得到启发:

如果AI能够如此高效地搜索围棋的所有可能局面,那么是否可以利用类似的思想去搜索算法空间呢?

这就是开始研发AlphaTensor工作的基础。

几十年来,人们认为矩阵乘法的复杂度是立方级别的。也就是说,如果你有两个矩阵,矩阵的维度是n,那么计算的时间复杂度是n³。

50多年前,德国数学家Strassen提出了一种非常反直觉的方法,证明了:实际上,矩阵乘法的复杂度比原来预想的要低。

通过搜索,AlphaTensor发现了比之前所知的算法更高效的解决方案。它不仅在效率上超越了传统算法,而且这个结果还证明了AI可以实现超人级别的突破。

但问题是,AlphaTensor专门针对矩阵乘法设计。那么,能否将这种方法推广到更一般的问题中呢?这就引出了对AlphaEvolve的进一步探索。

AlphaEvolve不仅能够处理特定的任务,它更具普适性,可以处理更广泛的问题。

AlphaEvolve利用了与AlphaTensor相似的进化算法。但它不再局限于矩阵乘法的特定问题,而是能够在更广泛的编程空间中搜索,提出解决方案。

不断进化,自我改进

听起来AlphaEvolve类似于进化选择对吧?它是如何进行每一代的改进的?

在每一代过程中,AlphaEvolve不断改进,每一代都基于上一代的强解进行优化。

通过基因池和评估函数,确保每一代的改进都能够提高整体的解的质量,同时保持了多样性,以便在庞大的搜索空间中发现最佳解决方案。

那这种进化过程的规模如何呢?如何控制模型的迭代次数?

关于这个问题,AlphaEvolve有一个很棒的特性,就是它能够适应问题的难度。

如果AlphaEvolve被要求解决一个相对简单的问题,它几乎能立即得到答案;但如果是一个非常复杂的问题,那么解决方案可能需要更长时间,更多的代次来不断改进。

但令人欣慰的是,AlphaEvolve可以持续改进,即使是在面对难度极大的问题时,它仍能不断提高。

这非常有价值,因为在持续优化时,许多传统的系统往往会在早期就遇到瓶颈,无法继续改进。

至于预测需要多少代才能达到最优解,这个问题比较复杂。问题的难度,无法预料,尤其是在科学领域,一些看似简单的问题实际上可能非常难,反之亦然。但幸运的是,只要持续运行AlphaEvolve,它会随着时间的推移不断得到更好的结果。

对编码智能体的意义

与一般的编码智能体相比,AlphaEvolve有何不同之处?

与一般的编码智能体相比,AlphaEvolve的优势在于它能够处理更复杂的任务,并且具有更高的效率和创造性。

在面对复杂或模糊的任务时,大多数通用编码智能体,容易陷入困境或产生错误,因为它们通常依赖于直接的任务说明,而这些说明往往不够精确,或者它们没有很强的判断能力。

而AlphaEvolve则依赖严格的评估函数。它能够区分有效的解决方案与无效的解决方案。

它的「创造性」不仅仅体现在提出新算法上,还表现在对解决方案进行有效评估和优化的能力上。

每当提出一个新解决方案时,评估函数会帮助判断它是否有效。

例如,在优化数据中心调度时,评估函数可能是一个模拟器,它能够根据给定的调度算法来判断该算法在现实中的表现如何。

这个评估过程帮助Alpha Evolve更准确地搜索解决方案空间。

那对于开发者来说,设计好的评估函数确实非常具有挑战性。你需要明确什么样的结果才是好的解决方案。在某些情况下,开发者可以使用现有的模拟器来进行评估,而在其他更复杂的情况下,可能需要开发定制化的评估工具。

评估函数不仅要能判断方案的好坏,还要能够在不同的任务中灵活应用。比如,在数据中心调度优化问题中,评估函数的复杂性可能远高于一些较简单的任务。

这也是为什么强调评估函数在AI系统中的重要性,只有拥有了精确的评估函数,AI才能有效地进行创新。

左图:AlphaEvolve为谷歌的工作负载和容量量身定制的启发式函数;右图:对该启发式评分函数的可视化展示

科学家转变角色

Matej Balog和Pushmeet Kohli都认为:未来,科学家的角色会发生一些变化。

可以想象,在未来,科学家们将更多地专注于如何定义问题、设计评估函数,以及如何解释AI生成的结果。

AI将成为科学家们的强大工具,帮助他们更快解决复杂的问题。

AI不仅仅给出答案,还提供算法,科学家们可以通过研究算法来理解背后的原理,这对于深入理解问题和解决方案非常重要。

这正是AlphaEvolve称霸多个领域的原因。

数学家和科学家不仅能看到最终的解决方案,还能理解到达这个解的路径,这种新的视角对推动科学发展至关重要。

此外,AlphaEvolve不仅仅推动技术创新,还有助于科学家发掘新的思维方式,挑战现有的认知框架。

AlphaEvolve的问世,标志着科学研究进入了一个崭新的时代。它不仅在算法领域创造了奇迹,更为未来的科学革命铺设了道路。

在AlphaEvolve的推动下,或许我们即将见证:科学,不再依赖「灵感」,而是靠「智能」

参考资料:

https://www.youtube.com/watch?v=2Fs6VZpsiMQ

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《镖人》冲击全球冠军,差距仅200万,吴京成中国第一巨星

《镖人》冲击全球冠军,差距仅200万,吴京成中国第一巨星

影视高原说
2026-03-29 16:14:04
俄罗斯提供情报?伊朗击毁美军预警机!俄代表团在美受高规格接待

俄罗斯提供情报?伊朗击毁美军预警机!俄代表团在美受高规格接待

鹰眼Defence
2026-03-29 17:12:53
卡位战,斯普利特:下轮对阵快船是本赛季最重要的一场比赛

卡位战,斯普利特:下轮对阵快船是本赛季最重要的一场比赛

懂球帝
2026-03-30 11:16:21
天生就好色的3个星座,有你吗?

天生就好色的3个星座,有你吗?

同道大叔
2026-03-16 22:01:59
伊朗大捷!用一场标志性大胜,打出美国 81 年最大战损的记录?

伊朗大捷!用一场标志性大胜,打出美国 81 年最大战损的记录?

社会日日鲜
2026-03-30 07:22:07
弟弟5岁走失,20年后哥哥求职,看到老板戴父亲遗物当场痛哭

弟弟5岁走失,20年后哥哥求职,看到老板戴父亲遗物当场痛哭

源远讲堂
2025-11-04 09:22:19
8天2冠后连续直播4小时!35岁张水华被指嘴唇发紫 心脏有问题?

8天2冠后连续直播4小时!35岁张水华被指嘴唇发紫 心脏有问题?

风过乡
2026-03-30 06:37:09
案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

案例:复旦博士姜文华判处死刑,女学生曝光其习惯,有一点很奇怪

清茶浅谈
2025-01-18 15:14:28
伊朗发动第86波打击,以色列一工业区遭袭,危险物质泄漏!以军政要员:以军多线作战兵力吃紧,濒临崩溃

伊朗发动第86波打击,以色列一工业区遭袭,危险物质泄漏!以军政要员:以军多线作战兵力吃紧,濒临崩溃

扬子晚报
2026-03-30 07:40:45
心源性猝死来势汹汹!呼吁:每家备好6样东西,关键时刻能救命!

心源性猝死来势汹汹!呼吁:每家备好6样东西,关键时刻能救命!

阿兵科普
2026-03-28 20:08:11
伊朗官员称计划对通过霍尔木兹海峡船只实施准入和收费制度

伊朗官员称计划对通过霍尔木兹海峡船只实施准入和收费制度

新京报
2026-03-30 15:09:08
重大资产重组!688693,复牌“20cm”涨停

重大资产重组!688693,复牌“20cm”涨停

数据宝
2026-03-30 10:58:38
周乙离世十年,顾秋妍在旅途中被名军官拦住,对方交给她一段话

周乙离世十年,顾秋妍在旅途中被名军官拦住,对方交给她一段话

不易一字
2026-03-27 16:53:54
张兰欺诈转移资产实锤!2亿名画遭美国扣押,9.8 亿欠债啥时候还清

张兰欺诈转移资产实锤!2亿名画遭美国扣押,9.8 亿欠债啥时候还清

烟浔渺渺
2026-03-30 12:00:52
谁赢,他们帮谁,伊朗等来最大强援,美陷入死局,后悔也来不及了

谁赢,他们帮谁,伊朗等来最大强援,美陷入死局,后悔也来不及了

阿伧说事
2026-03-28 01:58:57
中国科学院院士:全固态电池或至少再等5年

中国科学院院士:全固态电池或至少再等5年

财联社
2026-03-29 22:12:28
国足:国足VS喀麦隆前瞻!张玉宁状态火热,王钰栋努力打破进球荒

国足:国足VS喀麦隆前瞻!张玉宁状态火热,王钰栋努力打破进球荒

汇讯云谈
2026-03-30 13:19:53
强势切入,巴基斯坦单舰闯入中东交战区,中国造战舰硬刚全场

强势切入,巴基斯坦单舰闯入中东交战区,中国造战舰硬刚全场

知识TNT
2026-03-30 12:19:39
决裂!曼城王牌铁心走人!瓜帅彻底用废蓝月真核

决裂!曼城王牌铁心走人!瓜帅彻底用废蓝月真核

澜归序
2026-03-30 04:21:45
我在西班牙呆了8年,说句可能不太好听的大实话,不要急着反驳我

我在西班牙呆了8年,说句可能不太好听的大实话,不要急着反驳我

世界圈
2026-03-19 13:02:46
2026-03-30 15:35:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4616文章数 37441关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

美国如果发动地面战 本次战事军费或突破10万亿美元

头条要闻

美国如果发动地面战 本次战事军费或突破10万亿美元

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

亲子
教育
游戏
手机
公开课

亲子要闻

何怡华:做胎儿心脏守护者

教育要闻

关注!西城市重点中学招聘教师啦

死亡游戏里打麻将?桐姥爷和亚丝娜现身《刀剑神域》联

手机要闻

古尔曼:若苹果在自家地图应用中引入广告,或将“激怒用户”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版