网易首页 > 网易号 > 正文 申请入驻

爱因斯坦、费曼在智能体世界复活:30分钟刷新Erdos数学问题记录

0
分享至



编辑|杜伟

用 AI 尤其是大模型、智能体解决数学问题已经成为科研界的风尚之一,就连近 90 岁高龄、德高望重的高德纳老爷子都惊叹于 Claude Opus 4.6 解决开放性问题的强大能力,直呼「Shock! Shock!」。

近日,斯坦福大学副教授 James Zou 及 TogetherAI 的两位研究者 Federico Bianchi 和 Yongchan Kwon,解锁了全新的玩法。



他们基于爱因斯坦、费曼等物理学家的「人格画像」构建了一批 AI 智能体,并为这些智能体创建了一个类似于 Kaggle 的平台,让它们可以自由发表观点、相互竞争并展开合作。



这一模式带来了意想不到的成效:仅仅用了 30 分钟,这些智能体发现了 Erdos 最小重叠问题(Erdos min overlap problem)目前已知的最佳新解

作为由数学家 Paul Erdos 提出的经典问题之一,Erdos 最小重叠问题研究的是:当两个整数集合相加时,某些和出现的「重叠次数」最少可以被压到多低。

下图展示了名为「gpt-5.2-einstein」的智能体向其他智能体发问的场景:



此外,AI 科学家之间还出现了很多有趣的涌现行为,举个有意思的例子:为了防止排行榜被刷榜,系统规定智能体提交的新解必须至少比自己前一次提交的解提升 1e-8,否则将无法提交。

于是,就有智能体拜托自己的「朋友」替自己提交结果



目前,完整的解决方案已经上传到了 GitHub 上。



项目地址:https://github.com/togethercomputer/erdos-minimum-overlap

Erdos 最小重叠问题新最优解

根据项目主页,这些智能体采取的核心思路是:利用序列线性规划,对阶梯函数构造进行优化

下图分别为 2016 年 Haugland(挪威数学家)、2025 年 5 月 AlphaEvolve(Google DeepMind 开发的 AI 智能体)、2026 年 1 月 TTT-Discover(斯坦福联合英伟达发布的 AI 科学问题发现 SOTA 解决方案)以及本文解决方案的结果对比。



针对 Erdos 最小重叠问题,以上四种解决方案得出的上界(upper bound)分别如下:



完整的验证过程与额外分析详见以下链接:

  • https://github.com/togethercomputer/erdos-minimum-overlap/blob/main/analysis.ipynb

网友热议:是新科研范式还是噱头?

对于现实世界人类科学家的「智能体分身」,不少评论认为这是一种新的科研协作范式。

「这正是我通过 SOUL.md 为每个智能体赋予独特角色的原因,不同的个性不仅增添了趣味,还能产生不同的推理路径。一个怀疑论者和一个乐观者会从完全不同的角度来攻击同一个问题。」



「拥有各自鲜明人格的智能体各自独立工作,没有会议、没有同步沟通,只是并行推进,让结果自己说话。这种内向型协作方式通过减少协调成本,仅用 30 分钟就解决了一个数学问题,而传统依赖大量沟通协调的方式却没能做到。」



不过,也有人对此泼了冷水。

「我粗略看了一下这个仓库,它看起来只是一个被包装得更复杂的提示系统。告诉一个模型它是非常聪明的物理学家,并不会真的让它变成一个非常聪明的物理学家。它本质上还是同一个模型。这里的做法似乎更糟,因为现在大模型还要先思考:某个角色会如何回答?而不是直接思考:我应该如何回答?。本质上,这相当于在真正有洞见的步骤(讨论物理)之前,多增加了一个制造噪声的步骤(假装自己是爱因斯坦)。」



评论区的各位,如何看待这种智能体协作模式呢?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
OPPO母亲节文案冒犯公序良俗,中广协、武大发声

OPPO母亲节文案冒犯公序良俗,中广协、武大发声

南方都市报
2026-05-10 20:27:01
北方迎高温“快闪” 之后,冷空气将“断崖式”降温

北方迎高温“快闪” 之后,冷空气将“断崖式”降温

中国能源网
2026-05-11 10:22:05
心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理学上有个效应:父母越勤快,孩子越自私;学会“放手”这两件事,孩子未来越成功

心理观察局
2026-05-09 09:10:22
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
烂就是烂,永远不能指望的国民党

烂就是烂,永远不能指望的国民党

超级学爸蛋总
2026-05-11 07:58:42
华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

华西村被骂死爱面子的3亿金牛,15年后成功逆袭!变身最强压舱石

三农雷哥
2026-05-10 17:46:34
有暴雨大暴雨!广东下一轮强对流天气时间,确定了

有暴雨大暴雨!广东下一轮强对流天气时间,确定了

鲁中晨报
2026-05-11 07:26:07
杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

杨鸣一句话撕开山东遮羞布:没了打封闭的铁人,平民球队只剩绝望

林子说事
2026-05-11 09:45:50
回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

回顾深圳母子神秘失踪,14年后,房东在出租屋纸箱里发现干尸

莫地方
2026-05-11 01:15:03
老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

老伴凌晨心梗,我打女儿8个电话没人接,女婿:你能不能懂点分寸

木言观
2026-05-10 07:02:33
高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

高市早苗好狠:赶在特朗普访华前,给了他一刀,连中国都没想到!

次元君情感
2026-05-10 21:14:41
梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

梁靖崑都没想到,王皓竟然因为一句话,直接被封神级赛场心理导师

汪镛的创业之路
2026-05-11 11:53:15
分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

分手29年后,肖战成国乒副总教练,而她嫁给富商,已是大学教授

做一个合格的吃瓜群众
2026-04-06 10:16:48
老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

老兵不死!周鹏续写传奇,深圳晋级四强,冲冠之路仍有短板

诺诺谈史
2026-05-11 12:24:56
这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

这跟不穿有啥区别?内裤外露、开叉开到腰,有钱人的时尚真看不懂

潮鹿逐梦
2026-03-02 17:19:02
随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

随巴萨夺得西甲冠军,拉什福德职业生涯首次夺得联赛冠军

懂球帝
2026-05-11 05:17:17
“日光盘”重现、认购破千套:楼市的信心,涨回来了?

“日光盘”重现、认购破千套:楼市的信心,涨回来了?

秦朔朋友圈
2026-05-11 00:03:51
“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

“太疯狂”!价格大跳水!深圳多家超市排长队,一上架遭疯抢!网友:刚买完

南方都市报
2026-05-11 07:55:34
尼克斯横扫费城:唐斯与恩比德的命运与角色

尼克斯横扫费城:唐斯与恩比德的命运与角色

张佳玮写字的地方
2026-05-11 06:55:13
坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

坐不住?美企CEO放话:若中国搞定先进光刻机,就会掀翻芯片格局

Thurman在昆明
2026-05-10 12:13:29
2026-05-11 13:56:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12965文章数 142648关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

头条要闻

媒体:特朗普确定本周访华 中美在东亚有个共同的敌人

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

健康
本地
家居
手机
公开课

干细胞能让人“返老还童”吗

本地新闻

用苏绣的方式,打开江西婺源

家居要闻

多元生活 此处无声

手机要闻

荣耀600系列手机开启新品预约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版