网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

AI首夺IMO银牌！DeepMind曝光三大黑科技，2025登《自然》揭秘

2025-11-16 20:58:35　来源: 易昂杨

上海举报

0

分享至

2024 年 7 月，国际数学奥林匹克竞赛（IMO）传来爆炸性消息。

Google DeepMind 的 AlphaProof 系统，首次在这项全球顶尖数学赛事中拿下银牌，这是 AI 历史上第一次达到 IMO 奖牌级别。

时隔一年多，2025 年 11 月 12 日，相关技术论文正式发表在《自然》杂志上，所有核心细节全部公开，让整个数学界和 AI 圈都为之震动。

这个能跟全球数学天才同台竞技的 AI，到底藏着什么秘密？它的出现又会带来哪些改变？

一、IMO 有多难？全球仅 1% 能拿满分的终极试炼

国际数学奥林匹克竞赛，可不是普通的数学考试。

它面向 16-19 岁的青少年，聚集了全球最顶尖的数学人才，每届都有上百个国家参赛。

比赛分两天进行，每天 4.5 小时，总共就 6 道题，满分 42 分，但难度却高到让人望而生畏。

2024 年的比赛中，全球只有不到 1% 的参赛者能拿到满分，金牌分数线更是高达 29 分。

更值得一提的是，这赛事堪称 “数学大师摇篮”，陶哲轩、Timothy Gowers 等多位菲尔兹奖得主，都曾是 IMO 的参赛选手。

AlphaProof 在这次比赛中拿到 28 分，刚好卡在银牌区间，排名能进全球前 10%，直接超越了 609 名人类参赛者中的大多数。

更让人意外的是，他还攻克了当年最难的第 6 题，这道题全球只有 5 名人类选手完全解答出来。

二、打破 “幻觉”：AlphaProof 的三大核心技术

传统 AI 解题最大的问题，就是容易 “瞎编”，也就是所谓的 “幻觉”。

明明推理过程错了，却能说出看似合理的结论，这在要求绝对严谨的数学证明中完全行不通。

为了解决这个问题，DeepMind 团队给 AlphaProof 装了三套 “杀手锏”。

首先是用对了工具 ——Lean 形式化语言。

这东西就像个严格的 “安检仪”，每一步推理都要符合逻辑规则，只要有一点错误就会被立刻检测出来，从根源上杜绝了 “幻觉”。

但 Lean 的问题是训练数据太少，标准数学库只有 20 万个定理，根本不够 AI 学习。

团队的第二个妙招，就是 “自动形式化”。

他们用微调后的 Gemini 语言模型，把 100 万个自然语言数学命题，转换成了 8000 万个 Lean 能理解的形式化语句，一下子解决了数据短缺的难题。

最关键的是第三招 —— 测试时强化学习（TTRL）。

遇到特别难的题，AlphaProof 不会硬冲，而是先生成一堆难度各异的题目变体，从简单的开始练手。

通过解决这些 “练习题” 积累经验，最后再回头攻克原题，这也是它能拿下第 6 题的关键。

除此之外，系统还借鉴了 AlphaZero 的架构，用 30 亿参数的网络搭配 “乘积节点” 搜索，能高效分解难题、集中资源突破关键点。

三、比人快还是慢？AI 解题的独特逻辑

AlphaProof 的解题节奏，跟人类选手完全不一样。

人类选手要在两天共 9 小时内完成所有题目，而 AlphaProof 处理简单题只要几分钟，碰到难题却可能要花三天时间。

对此 DeepMind 团队说得很实在，重点不是比谁快，而是验证 AI 能不能达到奥赛级别的推理能力。

毕竟现在的时间差距，随着技术进步迟早会缩小。

从解题风格来看，AlphaProof 也有明显的偏向性。

它在代数和数论领域表现突出，但在组合数学上相对较弱，目前团队还在研究背后的原因。

还有个小遗憾，现在 AlphaProof 还不能直接看懂自然语言的题目，需要人工翻译成形式语言才能工作。

不过团队已经在试验基于 Gemini 的自然语言推理系统，未来有望实现完全自主解题。

菲尔兹奖得主 Timothy Gowers 看完他的解答后，直言 “这很令人印象深刻，是显著的进步”。

剑桥大学的 AI 专家也认为，这种形式化证明能让数学成果更可信，还能促进学术合作。

四、从银牌到金牌，AI 要改写数学史？

AlphaProof 的突破，只是 AI 数学推理的一个起点。

就在今年的 IMO 竞赛中，DeepMind 又推出了全新的 Gemini Deep Think 系统，直接实现了端到端的自然语言推理。

它不用形式化语言当中介，4.5 小时内就拿到 35 分，直接达到了金牌水平，进步速度让人惊叹。

这意味着 AI 数学推理，正在从 “形式化验证” 和 “自然语言理解” 两个方向快速推进。

未来这两条路径很可能会融合，诞生出更强大的通用数学 AI 工具。

论文作者 Julian Schrittwieser 透露，目前限制 AlphaProof 的主要是 TPU 算力。

这种在推理时投入大量计算资源的模式，或许会成为 AI 优化的新方向。

更重要的是，它证明了强化学习与搜索的组合，对大语言模型同样有效，为构建更可靠的 AI 系统提供了思路。

长远来看，AI 不仅能辅助人类解决难题、验证证明，还可能发现人类没注意到的数学规律。

或许用不了多久，我们就能看到 AI 和人类数学家携手，攻克那些困扰多年的数学难题，彻底改变数学研究的范式。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

密密麻麻大批游客涌入四川网友：以为又过了遍十一

上观新闻 2025-11-17 12:19:51
36 跟贴 36
上海多区出现！紧急提醒：破坏力强大，看到立即上报！

环球网资讯 2025-11-16 21:13:14
315 跟贴 315

降息，突变！美联储，大消息！

证券时报 2025-11-16 15:37:10
890 跟贴 890

人民日报：警惕日本战略的危险转向

人民网-人民日报 2025-11-17 07:29:51
1566 跟贴 1566
公开信息披露：特朗普40多天购入至少8200万美元债券

澎湃新闻 2025-11-16 21:14:20
613 跟贴 613

交警回应放行奔丧摩托：执法既要讲规则也应保有温度

北京日报客户端 2025-11-17 11:36:12
181 跟贴 181

美“福特”号航母打击群进入加勒比海

大象新闻 2025-11-17 06:50:22
1763 跟贴 1763
日本经济学家：若中国游客减少将影响日本经济

国际在线 2025-11-17 09:47:29
2166 跟贴 2166

正大量上市！女子一口气吃3个，痛到进医院，医生提醒：不能混吃、不能空腹吃

环球网资讯 2025-11-16 17:31:46
362 跟贴 362
“打开大门干交通”，济南交通一一回应“换乘”“断头路”等问题

齐鲁壹点 2025-11-17 07:05:29
68 跟贴 68
聚焦｜辛纳、阿尔卡拉斯“各赢一次” 双巨头争霸明年继续

北青网-北京青年报 2025-11-17 09:57:09
60 跟贴 60
“令人深感不安”，法将供乌“阵风”战机？

参考消息 2025-11-17 12:37:05
18 跟贴 18
林诗栋发文告别全运会：有收获有遗憾，继续向前出发

现代快报 2025-11-17 07:38:22
246 跟贴 246
观察｜“好看第一位”和“安全是基础”冲突吗？雷军连发三博能否回答外界质疑？

澎湃新闻 2025-11-16 22:08:28
251 跟贴 251
媒体：中国又一电磁弹射舰试航可对日本形成合围之势

新民周刊 2025-11-17 09:09:38
0 跟贴 0
里夫斯：老詹肯定在家看了比赛他会思考复出后如何帮助球队

北青网-北京青年报 2025-11-16 17:51:12
309 跟贴 309
教育部、文化和旅游部同日发出赴日提醒

极目新闻 2025-11-16 21:13:56
362 跟贴 362
山村的秘密：“地下水里有金子”，村民大肆盗采地下水，大户年入上百万

新京报 2025-11-17 07:57:25
1 跟贴 1
6666元教会养“杀人蜂”，是拿生态和人命开玩笑｜新京报快评

新京报 2025-11-17 15:16:04
0 跟贴 0
刚刚，江苏下雪了！

江苏新闻 2025-11-17 11:41:35
0 跟贴 0
花甲老人沉迷“投资中奖”，民警“用魔法打败魔法”保住9万养老钱

上观新闻 2025-11-17 15:16:05
0 跟贴 0

尺度惊艳，Netflix制作的3部成人动漫，太过瘾了

尺度惊艳，Netflix制作的3部成人动漫，太过瘾了

来看美剧

2025-10-12 21:22:41

激怒中国后高市再树劲敌，两国罕见联手抗议讨血债，日本惹上事了

激怒中国后高市再树劲敌，两国罕见联手抗议讨血债，日本惹上事了

现代小青青慕慕

2025-11-17 00:28:45

原来我们都被骗了，陈若琳恋情真相大白，郭晶晶的话早有预兆

原来我们都被骗了，陈若琳恋情真相大白，郭晶晶的话早有预兆

枫尘余往逝

2025-11-04 18:47:49

春秋航空发布非自愿退改规定通知

春秋航空发布非自愿退改规定通知

半岛晨报

2025-11-16 10:38:45

有了通义和夸克，阿里为何再推千问App？

有了通义和夸克，阿里为何再推千问App？

澎湃新闻

2025-11-17 14:56:26

全运会金牌榜更新：山东笑傲榜单，三个省挂零，孤岛在哪？

全运会金牌榜更新：山东笑傲榜单，三个省挂零，孤岛在哪？

老糿尾声体育解说

2025-11-17 02:11:17

强冷空气来袭！广东最大降温幅度可达10℃

强冷空气来袭！广东最大降温幅度可达10℃

广东发布

2025-11-17 12:59:27

琉球之后，轮到苏禄国复国了，否则，何以告慰为反殖民牺牲的先辈

琉球之后，轮到苏禄国复国了，否则，何以告慰为反殖民牺牲的先辈

阿七说史

2025-11-17 08:56:12

被告律师称另有隐情：郭某或遭自己人误伤丧命，网友笑喷

被告律师称另有隐情：郭某或遭自己人误伤丧命，网友笑喷

热点菌本君

2025-11-14 14:04:47

18分大胜！穆迪32+4+8记三分，赛后鲁尼走过去，一把抱住科尔

18分大胜！穆迪32+4+8记三分，赛后鲁尼走过去，一把抱住科尔

担酒

2025-11-17 10:33:37

“快来逮捕我”，沈伯洋窜德发挑衅，不到24小时，大陆对其出重拳

“快来逮捕我”，沈伯洋窜德发挑衅，不到24小时，大陆对其出重拳

凡知

2025-11-17 14:53:14

谢霆锋没想到，离婚14年，前妻张柏芝一条动态，让他“下不来台”

谢霆锋没想到，离婚14年，前妻张柏芝一条动态，让他“下不来台”

洲洲影视娱评

2025-11-17 14:19:07

1955年，毛主席看到枪决名单后，拍案大怒：她可是咱全党的恩人！

1955年，毛主席看到枪决名单后，拍案大怒：她可是咱全党的恩人！

芊芊子吟

2025-11-08 21:45:03

韩国咖啡馆“白日宣淫”丑闻！出轨情侣缠绵80分钟，监控全拍下！

韩国咖啡馆“白日宣淫”丑闻！出轨情侣缠绵80分钟，监控全拍下！

奋斗在韩国

2025-11-16 16:47:14

黄希扬：向余望在国奥遭受巨大质疑，归队后每个人都在鼓励他

黄希扬：向余望在国奥遭受巨大质疑，归队后每个人都在鼓励他

懂球帝

2025-11-17 11:32:22

李小龙打遍天下无敌手？妻子琳达晚年透露：丈夫其实很怕一种对手

李小龙打遍天下无敌手？妻子琳达晚年透露：丈夫其实很怕一种对手

南书房

2025-11-17 10:05:03

中方向全球昭告日本越线必遭痛击话音刚落朝鲜日本要血债血偿

中方向全球昭告日本越线必遭痛击话音刚落朝鲜日本要血债血偿

娱乐督察中

2025-11-17 13:54:22

6国外援候命，高市通知全球，对华打响第二枪，中方被逼上硬菜

6国外援候命，高市通知全球，对华打响第二枪，中方被逼上硬菜

娱乐小可爱蛙

2025-11-16 10:58:54

中超末轮央视直播计划初定，CCTV5大连英博VS上海海港，5+转申花

中超末轮央视直播计划初定，CCTV5大连英博VS上海海港，5+转申花

篮球看比赛

2025-11-17 10:56:28

G20峰会遇冷，“上三常”元首同时缺席，全球格局将如何演变？

G20峰会遇冷，“上三常”元首同时缺席，全球格局将如何演变？

优趣纪史记

2025-11-17 10:10:00

欢迎大家来关注我谢谢

2276文章数 97关注度

往期回顾全部

科技要闻

营销话术反噬信任，雷军不该只是一怒了之

头条要闻

台34个团体严正抗议：拒绝成为日本军国主义的牺牲品

头条要闻

台34个团体严正抗议：拒绝成为日本军国主义的牺牲品

体育要闻

当家球星受伤后，球迷乐翻了天？

娱乐要闻

二次封后的宋佳凭什么狂妄？

财经要闻

疯狂的"吸金村"：村民大肆盗采地下水

汽车要闻

荣威M7+豆包大模型用车机AI策划说车视频怎么样？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

教育

时尚

房产

数码

家居要闻

回廊通道强化空间秩序

教育要闻

放飞气球于天际，驱散“笑气”于青春

中年女人的开挂指南，避开花衣服和紧身衣，把优雅感焊在身上

房产要闻

首开狂卖6.68亿！海口这个顶级教育红盘，引爆海口楼市！

数码要闻

微星推出中端-入门级背插主板PRO B840M-P EVO WIFI6E PZ

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版