网易首页 > 网易号 > 正文 申请入驻

一周两破18年数学纪录!陶哲轩惊叹:AlphaEvolve带来久违「加速度」

0
分享至

  新智元报道

  编辑:犀牛

  【新智元导读】人类数学家与AlphaEvolve携手,一周内两次刷新18年未破的数学纪录!展现AI与人类协作的惊人潜力。AI如侦察兵广度扫描,人类专家深度优化,双引擎驱动下,科学前沿正在加速推进!

  AI正在与人类协作加速推进科学前沿。

  一周之内,一项18年的数学纪录连续两次被刷新!

  先是在5月14日,DeepMind的AlphaEvolve(陶哲轩有参与)发布白皮书,宣布在50多个公开难题上刷新纪录,其中就包括将和差集的θ从1.14465提升到1.1584。

  接着,在5月22号,人类数学家Robert Gerbicz又在AlphaEvolve的研究基础上,把θ推进到了1.173050!

  在数学上,这是相当大的进步。

  论文地址:https://arxiv.org/abs/2505.16105

  陶哲轩发帖由衷的感叹道:「人类与AI不同方法的互补,正是数学快速前进的原因。」

  这一次,AI的「广度扫描」与人类的「深度打磨」像双引擎一样同时驱动,给数学研究带来了久违的加速度。

  和差集问题究竟是什么?

  让我们先来了解一下这个让数学家们痴迷的问题。

  简单来说,它关乎整数集合的「和集」(A+B,集合中所有元素两两相加得到的集合)与「差集」(A-B,集合中所有元素两两相减得到的集合)之间的大小关系。

  想象你有两个装满了数字的袋子,我们叫它们袋子A和袋子B。

  和集(A+B),就是你从袋子A里拿一个数,再从袋子B里拿一个数,把这两个数加起来,所有可能的加和结果,就组成了这个「和集」。

  类似的,差集(A-B),就是从袋子A里拿一个数,从袋子B里拿一个数,用第一个数减去第二个数,所有可能的相减结果,就组成了「差集」。

  比如A={1, 2},B={3, 4},那么A+B={1+3, 1+4, 2+3, 2+4}={4, 5, 5, 6}={4, 5, 6}(集合里元素不重复),A-B={1-3, 1-4, 2-3, 2-4}={-2, -3, -1, -2}={-1, -2, -3}。

  那么,数学家们在琢磨什么呢?

  他们想找到一种特别的袋子A和袋子B(里面的数字要选得很巧),使得和集里不同结果的数量相对较少,但同时,差集里不同结果的数量却非常非常多。

  这个「非常非常多」到底能有多大,就用上面提到的那个神秘的指数θ来衡量。

  2007年,Gyarmati、Hennecart和Ruzsa通过构造一个包含约30,000个元素的集合U,确立了θ=1.14465的下界。

  这一结果在当时是加法组合学领域的重大进展,但数学家们知道,θ的上界为4/3,意味着仍有很大的改进空间。

  AlphaEvolve通过无约束搜索,找到一个包含54,265个元素的集合U,将θ的下界提升至1.1584。

  这一进步展示了AI在数学研究中的潜力:通过快速扫描大量可能性,AI能够发现人类可能忽略的构造。

  这一次Gerbicz的新进展并非打败了AlphaEvolve,而是站在它提供的新基准上,用经典思路配超大参数(超过10^43546个元素)再进一步。

  AlphaEvolve的「广角镜」

  AlphaEvolve之所以能在和差集问题上取得突破,得益于其强大的通用算法设计能力。

  它的核心机制,是将谷歌Gemini解决创造性问题的能力和能验证答案的自动评估器相结合,然后用进化框架来优化最有潜力的想法。

  论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf

  它用48次标量乘法,搞定4x4复数矩阵乘法,改进了1969年Strassen最优算法。

  AlphaEvolve不仅仅是矩阵乘法屠龙刀,还是个跨界狂魔。

  为了测试AlphaEvolve的极限,DeepMind将其投入了数学分析、几何、组合学和数论中的50多个开放问题。

  陶哲轩亲自出题参与到项目中。

  在短短几小时内,AlphaEvolve完成了大多数问题的设置,展现出惊艳的灵活性。

  更令人震撼的是,它在大约75%情况下,重新发现了最先进的解决方案;在20%情况下,改进了已知的最佳解决方案,并在相应的开放问题上取得了进展。

  以困扰数学家300多年「亲吻数」难题为例,AlphaEvolve在11维空间中,发现了593个外球的配置,刷新了该问题的下限。

  几何学中,数学空间的亲吻数被定义为一种空间排布下非重叠单位球体的最大数量。其中,所有的单位球体都与一个中心单位球体相切

  AlphaEvolve并非DeepMind首次用AI做数学:AlphaGeometry 2解决了84%的IMO几何难题,胜过人类金牌选手。FunSearch则在组合数论难题上找到新构造,被Science评论为「新工具箱」。

  这不是零和博弈

  Gerbicz的突破正是陶哲轩所说的「互补」范例——Gerbicz与AlphaEvolve之间并不是一种零和游戏。

  「将此简化为赢家和输家的零和游戏是很诱人的,但我认为,不同的方法在这里能够相互补充,共同推动数学进步,这非常棒。」陶哲轩写道。

  像AlphaEvolve这样的AI工具,其优势更在于广度而非深度。

  AI能凭借其强大的计算和模式识别能力,快速给出直觉性的判断和有潜力的方向。

  它可以像一个孜孜不倦的「侦察兵」,快速扫描广阔的战场(问题的可能性空间),找出那些可能存在宝藏(可以改进的地方)的区域。

  当AI标出「可疑区域」后,人类专家(或许也需要计算机的辅助进行精细计算)便可以集中火力,进行深度挖掘。

  这实际上揭示了一种「AI+人类」双引擎驱动数学乃至科学进步的新范式。

  在探索未知的前沿,单打独斗的时代或许正在过去,AI与人类智慧的协同,将是未来的主旋律。

  正如一句老话所说:「如果你想走得快,就一个人走;如果你想走得远,就一起走。」

  在AI的加持下,科学研究将会走得更远。

  参考资料:

  https://arxiv.org/pdf/2505.16105

  https://mathstodon.xyz/@tao/114597746207605668

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

女孩昏迷3周,脑子里却过了7年!她在梦中养大俩娃,醒来崩溃了:娃全没了...

英国那些事儿
2026-03-25 23:12:57
施海荣若下课,谁来执掌江苏女排?张常宁,沈富麟还是外教

施海荣若下课,谁来执掌江苏女排?张常宁,沈富麟还是外教

金毛爱女排
2026-03-27 00:00:04
陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

陈慧琳”太丰满了,穿抹胸都兜不住好身材,我感慨自律女人真美

章眽八卦
2026-03-08 15:36:53
38.6万元起拍!南京一民国老四合院上架拍卖

38.6万元起拍!南京一民国老四合院上架拍卖

现代快报
2026-03-26 14:34:07
光通信+CPO,逻辑最硬的11家公司

光通信+CPO,逻辑最硬的11家公司

龙头主升趋势
2026-03-25 17:51:33
75岁港星花百万在中山买房,住了两年称生活素质高,后悔搬来太晚

75岁港星花百万在中山买房,住了两年称生活素质高,后悔搬来太晚

树娃
2026-03-24 12:28:41
伊朗已通过中间人正式回应美方“15点计划”

伊朗已通过中间人正式回应美方“15点计划”

环球网资讯
2026-03-26 23:45:59
特变电工:阿玛利亚水电站项目各项基础设施建设工作正有序开展

特变电工:阿玛利亚水电站项目各项基础设施建设工作正有序开展

每日经济新闻
2026-03-26 18:09:04
别让你的无知,毁了她的高潮!男人必须掌握的技巧课

别让你的无知,毁了她的高潮!男人必须掌握的技巧课

精彩分享快乐
2026-03-06 14:01:39
伊朗获得强援,又一中东国家下场,还是美国亲自送上门的帮手

伊朗获得强援,又一中东国家下场,还是美国亲自送上门的帮手

快看张同学
2026-03-26 14:46:05
破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

破防!小县城殡仪馆大屏流出,中年人扎堆离世,网友:还争什么?

川渝视觉
2026-03-23 19:26:44
伊朗挂断王毅电话后发全球照会,萨勒曼震怒

伊朗挂断王毅电话后发全球照会,萨勒曼震怒

空间展示知识
2026-03-26 07:06:58
医生再三告知:老人同房时,需要注意6件事,不然可能麻烦就大了

医生再三告知:老人同房时,需要注意6件事,不然可能麻烦就大了

路医生健康科普
2026-03-21 15:43:25
《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

《红楼梦》成就的3段姻缘,对对恩爱到白头,活成爱情最好的模样

上官晚安
2026-03-26 06:48:44
23万大厂员工被AI替代,为何一半公司又把人请回?

23万大厂员工被AI替代,为何一半公司又把人请回?

钛媒体APP
2026-03-26 18:26:16
42岁女星宣布离婚,结束14年婚姻独自照顾三孩

42岁女星宣布离婚,结束14年婚姻独自照顾三孩

风月得自难寻
2026-03-27 02:15:04
扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

环球网资讯
2026-03-26 08:55:12
网友吐槽别糊弄老百姓了,又是天才少年发国际论文,谁家的公子?

网友吐槽别糊弄老百姓了,又是天才少年发国际论文,谁家的公子?

眼光很亮
2026-03-08 01:43:40
离那些张口闭口不离宏大叙事的人远点

离那些张口闭口不离宏大叙事的人远点

廖保平
2026-03-20 10:14:56
60年难遇的清明节,今年碰上了,牢记上坟4人不去、3人必去!

60年难遇的清明节,今年碰上了,牢记上坟4人不去、3人必去!

户外阿崭
2026-03-26 05:54:27
2026-03-27 02:52:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66720关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
艺术
亲子
数码
游戏

转头就晕的耳石症,能开车上班吗?

艺术要闻

北京大兴机场和青岛胶东机场“撞脸”,长得像就是抄袭?

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

无障碍浏览 进入关怀版