网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI不给数学家留活路？Google AlphaProof一口气攻克50多个难题!

2026-06-03 08:48:37　来源: 侃故事的阿庆

福建举报

0

分享至

近日Google DeepMind发布了AlphaProof Nexus，这个AI系统不仅能生成形式化证明，还能通过Lean证明助理的编译器进行自动验证，真正实现了“闭环”数学推理。

该系统自主解决了9个Erdős开放问题（共尝试353个），证明了44个OEIS猜想，并广泛的在优化理论、代数几何、图论、量子光学等多个领域协助解决了开放问题。其中两个Erdős问题已经悬而未决长达56年。

AlphaProof并非单一的AI模型，而是一个多Agent协作框架：

1. 基础生成-验证循环

每个“证明器子Agent”使用Gemini 3.1 Pro大模型，通过多轮对话迭代精炼证明草稿。每一轮修改后，Lean编译器立即反馈错误信息，形成“生成→编译→修正”的紧密闭环。

2. AlphaProof工具集成

子Agent可以调用AlphaProof——一个基于强化学习、已达到国际数学奥林匹克级别的定理证明系统——来处理数学上“常规但繁琐”的子目标。这就像人类数学家把计算交给计算器，自己专注于核心思路。

3. 进化式种群搜索

受AlphaEvolve启发，系统维护一个证明草稿数据库。子Agent从库中采样已有草稿进行“突变”和“杂交”，然后由专门的评级Agent（使用较便宜的Gemini 3.0 Flash）基于草稿的清晰度、合理性和新颖性进行Elo评分。这创造了一个“适者生存”的证明演化环境。

4. 全局目标缓存

系统会哈希每个待证明的子目标。一旦某个子目标被AlphaProof成功证明，结果会被缓存，供所有后续尝试复用，避免重复计算。

更关键的是AlphaProof还直接将证明成本打下来，成功证明每个Erdős问题的推理成本约为数百美元。

当然现在AlphaProof还存在许多问题，比方领域有限，目前成功主要集中在组合学、数论、凸优化等Lean的数学库已相当成熟的领域；大部分问题仍无法解决，尝试了353个Erdős问题只解决了其中的9个；证明中也经常出现幻觉。

但是AlphaProof Nexus的成果也表明，AI驱动的形式化证明搜索已迈入真正的研究级问题解决阶段。

以后数学家研究数学，必须会操控AI才行，否则很可能被替代，特别是数学专业里大量从事中低难度工作的，替代或许无法避免。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

Agent集体进化！腾讯谷歌们加码，AI打工人要普及了？

雷科技 2026-06-01 11:27:33
10 跟贴 10
17岁高中生用AI解决数学界难题，陶哲轩、Jeff Dean点赞

机器之心Pro 2026-01-26 14:24:45
0 跟贴 0

微软Build 2026：当Windows成为智能体的“一等公民”

钛媒体APP 2026-06-03 09:33:52
0 跟贴 0

Agent-World：扩展真实世界环境，让智能体与环境协同进化！

机器之心Pro 2026-05-06 12:40:24
0 跟贴 0
Claude Cowork做不好的领域，被国产黑马Agent彻底跑通了！

新智元 2026-06-03 12:10:06
0 跟贴 0

ChatGPT迎重大升级！

雷科技 2026-06-03 06:09:31
2 跟贴 2

OpenAI挖走中科大少年班校友！12岁上大学，哈佛史上最年轻正教授

量子位 2026-06-02 22:36:51
17 跟贴 17
中国创造一门新编程语言的黄金时代来了？

虎嗅APP 2025-12-23 03:54:05
0 跟贴 0

制糖工厂发布 AI 小电拼 Mirror，支持 AI Agent 原生接入

爱范儿 2026-06-03 11:19:35
0 跟贴 0
00后小哥复刻Claude最强神话模型OpenMythos

量子位 2026-04-23 11:44:18
0 跟贴 0
Agent输出到底该用谁？卡帕西转发：试试让AI输出HTML

量子位 2026-05-13 07:19:50
0 跟贴 0
王晓野：Working Agent将是下一个爆发点

量子位 2026-05-21 08:05:51
0 跟贴 0
这个时代必须以Agent为中心：三个趋势回顾

量子位 2026-04-05 02:14:15
0 跟贴 0
AI正在创造万亿价值，但GDP里可能没算进去

DeepTech深科技 2026-06-03 12:38:05
0 跟贴 0
AI Agent是科技革命中的一次真正的范式转移

量子位 2026-04-03 22:52:35
0 跟贴 0
改变数学史的“无穷大”论文，被指“偷”了别人的成果

DeepTech深科技 2026-02-28 14:28:14
0 跟贴 0
暗能量可能根本不存在？数学家向宇宙学标准模型发起挑战

质子视界 2026-06-01 23:18:40
0 跟贴 0
一个25岁年轻人用算术反手颠覆了整个数学大厦

Ping值焦虑 2026-06-03 03:53:02
0 跟贴 0
已知○○➕○＝36，求○＝？

公考客栈店小二 2026-06-02 08:00:00
0 跟贴 0
我是iPhone用户，但安卓Auto上的Gemini车载体验全面超越Siri

至顶科技 2026-05-30 22:22:22
0 跟贴 0
连加竖式计算，笑不活了

人间闲散客 2026-05-30 14:42:17
0 跟贴 0
学会逆等线模型，巧解八下最值问题

人间闲散客 2026-05-31 01:20:08
0 跟贴 0
五年级附加题，难倒学霸

郎老师趣味数学课堂 2026-06-03 09:45:20
0 跟贴 0
已知B✖️B➕B＝600，求B＝？

公考客栈店小二 2026-06-03 08:00:00
11 跟贴 11
沈乾若：分数及其运算如何难倒了美国学生？

學人Scholar 2026-05-30 16:48:31
0 跟贴 0
哈佛考试题，把毕业985的家长，都给看懵了

公考客栈店小二 2026-06-01 20:00:00
3 跟贴 3
真的惊呆了，马上做这道题目，能做的出来的吗？

公考客栈店小二 2026-06-02 18:00:00
0 跟贴 0
1978年高考题找规律，在括号中填写正确的数字

公考客栈店小二 2026-06-03 08:00:00
0 跟贴 0
填相同的符号，使等式等于35，太难了

公考客栈店小二 2026-06-02 12:00:00
0 跟贴 0
上海中考题，好多考生交白卷

郎老师趣味数学课堂 2026-05-30 07:49:53
0 跟贴 0
巧用弃九法秒求余数

梦西芝点 2026-06-01 02:37:21
19 跟贴 19
已知a×b=10，a×a=5，求ab各等于多少？

公考客栈店小二 2026-06-01 08:00:00
0 跟贴 0
谷歌母公司Alphabet宣布计划完成800亿美元股权融资

时代周报 2026-06-02 18:32:16
0 跟贴 0
安卓iOS系统正式互通新增支持三星、小米、OV、荣耀多款旗舰机型

快科技 2026-06-03 11:03:28
0 跟贴 0
Claude design限速，谷歌开源轻松做动态网页，实力打脸？

机器之心Pro 2026-04-29 17:20:04
0 跟贴 0
孩子考了96分不开心，只因这道题没做出来

郎老师趣味数学课堂 2026-06-01 18:32:03
0 跟贴 0
真正的大佬往往都是比较低调的！华叔你也敢招惹！

小龙追剧 2026-06-02 11:33:29
3 跟贴 3
越来越特立独行，韦东奕剃了个光头，拎了一个超市购物布袋

趣笔谈 2026-06-03 08:17:55
1 跟贴 1
看看还有谁不会做的，都站起来让老师看一看

公考客栈店小二 2026-06-02 08:00:00
0 跟贴 0
PsyBrain培训 | 认知计算建模专题（7.22-7.29线上）

PsyBrain脑心前沿 2026-06-03 12:11:16
0 跟贴 0

孝感方特6月17日开业，武汉人坐2号线说走就走，比去光谷还快！

孝感方特6月17日开业，武汉人坐2号线说走就走，比去光谷还快！

白浅娱乐聊

2026-06-03 00:44:21

上世纪著名的五大香烟品牌，现今仅剩两款，不认识还自称老烟民？

上世纪著名的五大香烟品牌，现今仅剩两款，不认识还自称老烟民？

南书房

2026-06-02 20:45:03

俄总统新闻秘书谈俄乌停战条件：乌军从俄各地区撤离

俄总统新闻秘书谈俄乌停战条件：乌军从俄各地区撤离

参考消息

2026-06-03 11:40:07

新长铁路仅剩6个客运站，江苏沿海居民出行何去何从？

新长铁路仅剩6个客运站，江苏沿海居民出行何去何从？

观察眼看世界

2026-06-02 19:20:03

从《装台》到《主角》，其貌不扬的郭文岗，用俩小角色赢得满堂彩

从《装台》到《主角》，其貌不扬的郭文岗，用俩小角色赢得满堂彩

暖心萌阿菇凉

2026-06-02 12:58:39

江苏养老金调整或将开始，历年调整方案，3600元能涨上120元吗？

江苏养老金调整或将开始，历年调整方案，3600元能涨上120元吗？

云鹏叙事

2026-06-02 18:42:06

上海队G4为啥输给广厦？弗格毫不客气说出心里话，说得真实在

上海队G4为啥输给广厦？弗格毫不客气说出心里话，说得真实在

老皢尾声体育解说

2026-06-03 06:55:40

0-3首败！中国男足意外崩盘，以小打大完败非洲劲旅，争冠变难了

0-3首败！中国男足意外崩盘，以小打大完败非洲劲旅，争冠变难了

侃球熊弟

2026-06-02 22:38:29

元宇宙，为什么没人提了？

快刀财经

2026-06-01 22:26:43

广西一18岁女孩半夜进入公园后失联，警方通报：女孩遗体已被找到

广西一18岁女孩半夜进入公园后失联，警方通报：女孩遗体已被找到

扬子晚报

2026-06-02 18:57:23

一场针对亚洲的无声洗劫，已经到了最高潮。

一场针对亚洲的无声洗劫，已经到了最高潮。

果妈聊娱乐

2026-06-01 08:38:41

杭州蛇患创5年新高，2米大蛇吞鸽，驱蛇药全失效

杭州蛇患创5年新高，2米大蛇吞鸽，驱蛇药全失效

吃货的分享

2026-06-03 09:47:22

小姨26岁嫁给了58岁的姨父，10年后姨父离世，小姨说为姨父守寡。谁料，姨父离世2年后，小姨却带着孩子改姓改嫁...

小姨26岁嫁给了58岁的姨父，10年后姨父离世，小姨说为姨父守寡。谁料，姨父离世2年后，小姨却带着孩子改姓改嫁...

品读时刻

2026-06-03 09:04:24

广州5个“最保值”的楼盘：别人跌成狗，它纹丝不动

广州5个“最保值”的楼盘：别人跌成狗，它纹丝不动

童童聊娱乐啊

2026-06-02 19:01:30

嘴上喊禁陆货，背地里偷偷用？台水库见底曝真相，民进党这次咋圆

嘴上喊禁陆货，背地里偷偷用？台水库见底曝真相，民进党这次咋圆

大鱼简科

2026-06-03 09:47:03

陈学冬被奚梦瑶召唤出来，妥妥专属娘家人，他为什么消失了三年

陈学冬被奚梦瑶召唤出来，妥妥专属娘家人，他为什么消失了三年

话娱论影

2026-06-03 11:38:10

难以置信！求姐姐每月资助5000元考研，“共赢式”巨婴乞讨引热议

难以置信！求姐姐每月资助5000元考研，“共赢式”巨婴乞讨引热议

火山詩话

2026-06-02 14:50:29

耿同学又举报4名学者，涉事人物全部曝光！处理他们刻不容缓

耿同学又举报4名学者，涉事人物全部曝光！处理他们刻不容缓

平老师666

2026-06-02 22:27:01

祼聊小花被富婆封杀！576给淡雅女星买意外险！

祼聊小花被富婆封杀！576给淡雅女星买意外险！

八卦疯叔

2026-06-03 12:39:46

称逛山姆是托举后续！宝妈痛哭道歉，全家信息被扒，孩子不敢上学

称逛山姆是托举后续！宝妈痛哭道歉，全家信息被扒，孩子不敢上学

童童聊娱乐啊

2026-06-03 01:06:24

侃故事的阿庆

几分钟看完一部影视剧，诙谐幽默的娓娓道来

1114文章数 8615关注度

往期回顾全部

科技要闻

员工抗议键鼠追踪，Meta让步:可暂停30分钟

头条要闻

女生被"卖"大18岁男子生娃后领证逃离后再婚生子获刑

头条要闻

女生被"卖"大18岁男子生娃后领证逃离后再婚生子获刑

体育要闻

选择中国品牌的库里，和他们的巨大野心

娱乐要闻

著名演员魏宗万去世！曾演活司马懿

财经要闻

左手通胀右手衰退，欧美当下的困局

汽车要闻

瑞虎8 PLUS/PRO非凡冠军上市限时10.19万元起售

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

房产

健康

旅游

军事航空

家居要闻

江畔轻奢观云大宅

房产要闻

突发！254亩调规，海口江东的超级学校真的快来了！

违规干细胞应用，暗藏致命隐患！

旅游要闻

栖霞：又到乡村甜蜜时百花蜜香游客来

军事要闻

伊朗媒体新发布最高领袖照片

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版