网易首页 > 网易号 > 正文 申请入驻

AI首夺IMO银牌!DeepMind曝光三大黑科技,2025登《自然》揭秘

0
分享至

2024 年 7 月,国际数学奥林匹克竞赛(IMO)传来爆炸性消息。

Google DeepMind 的 AlphaProof 系统,首次在这项全球顶尖数学赛事中拿下银牌,这是 AI 历史上第一次达到 IMO 奖牌级别。



时隔一年多,2025 年 11 月 12 日,相关技术论文正式发表在《自然》杂志上,所有核心细节全部公开,让整个数学界和 AI 圈都为之震动。

这个能跟全球数学天才同台竞技的 AI,到底藏着什么秘密?它的出现又会带来哪些改变?

一、IMO 有多难?全球仅 1% 能拿满分的终极试炼

国际数学奥林匹克竞赛,可不是普通的数学考试。



它面向 16-19 岁的青少年,聚集了全球最顶尖的数学人才,每届都有上百个国家参赛。

比赛分两天进行,每天 4.5 小时,总共就 6 道题,满分 42 分,但难度却高到让人望而生畏。

2024 年的比赛中,全球只有不到 1% 的参赛者能拿到满分,金牌分数线更是高达 29 分。

更值得一提的是,这赛事堪称 “数学大师摇篮”,陶哲轩、Timothy Gowers 等多位菲尔兹奖得主,都曾是 IMO 的参赛选手。

AlphaProof 在这次比赛中拿到 28 分,刚好卡在银牌区间,排名能进全球前 10%,直接超越了 609 名人类参赛者中的大多数。

更让人意外的是,他还攻克了当年最难的第 6 题,这道题全球只有 5 名人类选手完全解答出来。

二、打破 “幻觉”:AlphaProof 的三大核心技术

传统 AI 解题最大的问题,就是容易 “瞎编”,也就是所谓的 “幻觉”。

明明推理过程错了,却能说出看似合理的结论,这在要求绝对严谨的数学证明中完全行不通。

为了解决这个问题,DeepMind 团队给 AlphaProof 装了三套 “杀手锏”。

首先是用对了工具 ——Lean 形式化语言。

这东西就像个严格的 “安检仪”,每一步推理都要符合逻辑规则,只要有一点错误就会被立刻检测出来,从根源上杜绝了 “幻觉”。

但 Lean 的问题是训练数据太少,标准数学库只有 20 万个定理,根本不够 AI 学习。



团队的第二个妙招,就是 “自动形式化”。

他们用微调后的 Gemini 语言模型,把 100 万个自然语言数学命题,转换成了 8000 万个 Lean 能理解的形式化语句,一下子解决了数据短缺的难题。

最关键的是第三招 —— 测试时强化学习(TTRL)。

遇到特别难的题,AlphaProof 不会硬冲,而是先生成一堆难度各异的题目变体,从简单的开始练手。

通过解决这些 “练习题” 积累经验,最后再回头攻克原题,这也是它能拿下第 6 题的关键。

除此之外,系统还借鉴了 AlphaZero 的架构,用 30 亿参数的网络搭配 “乘积节点” 搜索,能高效分解难题、集中资源突破关键点。

三、比人快还是慢?AI 解题的独特逻辑

AlphaProof 的解题节奏,跟人类选手完全不一样。

人类选手要在两天共 9 小时内完成所有题目,而 AlphaProof 处理简单题只要几分钟,碰到难题却可能要花三天时间。

对此 DeepMind 团队说得很实在,重点不是比谁快,而是验证 AI 能不能达到奥赛级别的推理能力。



毕竟现在的时间差距,随着技术进步迟早会缩小。

从解题风格来看,AlphaProof 也有明显的偏向性。

它在代数和数论领域表现突出,但在组合数学上相对较弱,目前团队还在研究背后的原因。

还有个小遗憾,现在 AlphaProof 还不能直接看懂自然语言的题目,需要人工翻译成形式语言才能工作。

不过团队已经在试验基于 Gemini 的自然语言推理系统,未来有望实现完全自主解题。

菲尔兹奖得主 Timothy Gowers 看完他的解答后,直言 “这很令人印象深刻,是显著的进步”。

剑桥大学的 AI 专家也认为,这种形式化证明能让数学成果更可信,还能促进学术合作。

四、从银牌到金牌,AI 要改写数学史?

AlphaProof 的突破,只是 AI 数学推理的一个起点。

就在今年的 IMO 竞赛中,DeepMind 又推出了全新的 Gemini Deep Think 系统,直接实现了端到端的自然语言推理。



它不用形式化语言当中介,4.5 小时内就拿到 35 分,直接达到了金牌水平,进步速度让人惊叹。

这意味着 AI 数学推理,正在从 “形式化验证” 和 “自然语言理解” 两个方向快速推进。

未来这两条路径很可能会融合,诞生出更强大的通用数学 AI 工具。

论文作者 Julian Schrittwieser 透露,目前限制 AlphaProof 的主要是 TPU 算力。

这种在推理时投入大量计算资源的模式,或许会成为 AI 优化的新方向。

更重要的是,它证明了强化学习与搜索的组合,对大语言模型同样有效,为构建更可靠的 AI 系统提供了思路。

长远来看,AI 不仅能辅助人类解决难题、验证证明,还可能发现人类没注意到的数学规律。

或许用不了多久,我们就能看到 AI 和人类数学家携手,攻克那些困扰多年的数学难题,彻底改变数学研究的范式。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不要低估日本先发制人击沉福建舰的威胁,应该学习美苏对日做法!

不要低估日本先发制人击沉福建舰的威胁,应该学习美苏对日做法!

环球策论
2025-11-19 00:10:39
先升后降!陕西即将大降温

先升后降!陕西即将大降温

鲁中晨报
2025-11-20 16:13:16
这才是真正的满分身材!肥而不腻,甜却不齁,真受不了了!

这才是真正的满分身材!肥而不腻,甜却不齁,真受不了了!

一抹暖阳
2025-10-13 10:52:31
日本专家对比中日军事实力:若发生空战和海战,还是日本更强?

日本专家对比中日军事实力:若发生空战和海战,还是日本更强?

云上乌托邦
2025-09-04 11:45:33
陕西高二女生午休时操场产子,调查后发现,孩子父亲身份不简单

陕西高二女生午休时操场产子,调查后发现,孩子父亲身份不简单

苏大强专栏
2024-07-18 20:34:57
无人扶我凌云志,我烂泥亲自爬上墙,网友:全是高手!

无人扶我凌云志,我烂泥亲自爬上墙,网友:全是高手!

夜深爱杂谈
2025-11-19 21:49:29
杭州官宣取消灵隐寺门票

杭州官宣取消灵隐寺门票

界面新闻
2025-11-19 10:37:00
1994年,厅级干部夫妇被枪杀,震动中央,凶手供出幕后是人大常委

1994年,厅级干部夫妇被枪杀,震动中央,凶手供出幕后是人大常委

阿胡
2024-02-05 14:34:41
休想回国!我国体坛三大叛徒,夺冠后不承认是国人,结局大快人心

休想回国!我国体坛三大叛徒,夺冠后不承认是国人,结局大快人心

丁鸊惊悚影视解说
2025-11-17 19:00:46
详解毕福剑事件始未,世间再无“毕姥爷”!

详解毕福剑事件始未,世间再无“毕姥爷”!

好运来好运
2024-07-30 06:39:24
相差16岁的热恋!胡彦斌吃得好?还是易梦玲找到了隐形富豪?

相差16岁的热恋!胡彦斌吃得好?还是易梦玲找到了隐形富豪?

非常先生看娱乐
2025-11-20 17:55:46
爆单!黄仁勋:卖光了!

爆单!黄仁勋:卖光了!

每日经济新闻
2025-11-20 16:26:06
多地学校临时停课!常州最新提醒

多地学校临时停课!常州最新提醒

中吴网
2025-11-20 15:42:05
归化了13人也没用!亚洲球队钻了国际足联漏洞,仍无缘世界杯

归化了13人也没用!亚洲球队钻了国际足联漏洞,仍无缘世界杯

星耀国际足坛
2025-11-19 23:23:03
欧洲电动汽车教父:中国的混动汽车是一条通往地狱之路!

欧洲电动汽车教父:中国的混动汽车是一条通往地狱之路!

正经的烧杯1
2025-11-14 21:09:14
乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

乐视创始人欠122亿巨债跑美七年,400多名老员工让乐视起死回生。

百态人间
2025-11-05 05:35:03
“漏X装”,火了!

“漏X装”,火了!

微微热评
2025-11-19 14:51:31
释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

释永信被正式批捕!挖出哪些不为人知的秘密?私下里他和谁在一起

刚哥说法365
2025-11-16 14:35:38
中方换上新打法,连断日本3条财路,高市报复来了,自卫队将出兵

中方换上新打法,连断日本3条财路,高市报复来了,自卫队将出兵

时时有聊
2025-11-20 14:01:08
惠东县委常委、常务副县长刘勇辉被查!8天前被突然免职

惠东县委常委、常务副县长刘勇辉被查!8天前被突然免职

南方都市报
2025-11-20 14:32:10
2025-11-20 19:16:49
易昂杨
易昂杨
欢迎大家来关注我谢谢
2341文章数 97关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

男子开奥迪上班被婚车车队当成头车 7台奥迪跟到工厂

头条要闻

男子开奥迪上班被婚车车队当成头车 7台奥迪跟到工厂

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌的每一任都是大美女

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

换购价15.98万起 广汽丰田全新威兰达上市

态度原创

家居
本地
时尚
公开课
军事航空

家居要闻

黑白极简 慵懒通透空间

本地新闻

卖力整活儿的大湾鸡,靠疯癫成了新顶流

这四组绝美的冬季配色,很“暖”!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

日本称已向美国出口爱国者导弹

无障碍浏览 进入关怀版