网易首页 > 网易号 > 正文 申请入驻

Nature头条:AI大模型已达国际数学奥赛金牌水平

0
分享至

撰文丨王聪

编辑丨王多鱼

排版丨水成文

近日,国际顶尖学术期刊Nature在其官网头条报道了人工智能(AI)取得一项新成就——大语言模型首次在国际数学奥林匹克竞赛中达到金牌水平。

曾经被认为需要“人类顶级智慧”才能驾驭的国际数学奥林匹克竞赛(IMO),如今迎来了强大的AI 挑战者。Google DeepMind 和 OpenAI 的最新大模型,首次在这项顶级数学竞赛中展现了与人类金牌选手比肩的实力!

国际数学奥林匹克竞赛,是全球顶尖中学生智力角逐的最高殿堂,其题目之难,往往令普通人望而却步。然而,人工智能(AI)正在这个领域创造历史。

2025 年 7 月 21 日,Google 旗下公司 DeepMind 宣布了一个震撼科技界的消息: 其开发的大型语言模型(LLM),成功解答一组与国际数学奥林匹克竞赛难度相当的题目,并且达到了人类金牌得主的水平!

具体来说,DeepMind 的大语言模型在今年的评估中,其表现在人类选手评分标准中,已跨越了金牌得主的得分门槛(6 道题,满分 42 分,35 分为金牌,28 分为银牌)。这标志着 AI 在解决复杂数学问题能力上的一个重大飞跃。

为什么说这是一个重大飞跃?

质的跨越: 就在去年(2024年),DeepMind 的大语言模型在同类评估中,表现还仅处于银牌得主的上限区间。从“银牌顶尖”跃升至“金牌门槛”,这远非微小的进步,而是 AI 在高级数学推理和问题解决能力上的一次实质性突破。

顶级对标: 国际数学奥林匹克竞赛金牌代表着全球高中生在数学领域所能达到的巅峰水平。AI 能在这个层次上取得分数,意味着它在理解复杂概念、进行创造性推理和发现精妙解法方面,已经达到了令人惊叹的高度。

这不仅仅是 DeepMind 的成就,据报道,OpenAI 的模型也在这一领域展现了同等级别的卓越能力。两大 AI 巨头在解决数学难题上的突破,共同宣告了 AI 在高级认知能力方面的巨大进步。

需要特别指出的是,DeepMind 今年取得的成绩背后隐藏着一个重大范式转变,因为该公司此前在数学领域的成绩依赖于两种专门设计的 AI 工具——AlphaGeometry 和 AlphaProof,这需要人类专家首先将考题陈述翻译成类似于编程语言的内容,然后再将 AI 的解答翻译回英语。而今年则是在 Gemeni 系统开发的大语言模型——DeepThink,全部围绕自然语言,不再需要翻译过程。

此外,这项突破的深远意义远超竞赛本身:

1、AI 能力的证明: 它有力地证明了大语言模型(LLM)能够处理极其复杂、需要深度逻辑思维和抽象推理的任务,而不仅仅是文本生成或模式识别。

2、教育与研究的新工具: 此类 AI 可以作为强大的助手,帮助学生学习高等数学、启发解题思路,甚至协助数学研究人员探索新的猜想和定理。

3、通往 AGI 之路的里程碑: 解决奥林匹克数学竞赛金牌级别的数学问题,需要多方面的认知能力组合,这无疑是通往通用人工智能(AGI)之路的重要一步。

从在围棋领域击败人类世界冠军,到如今在代表人类“纯粹智力”巅峰的国际数学奥林匹克中达到金牌水平,AI 一次又一次地刷新着我们对机器能力的认知。DeepMind 和 OpenAI 的这次突破,不仅将 AI 推向了数学推理的新高度,也预示着它们未来在科学探索、技术研发等更广阔领域释放巨大潜力的可能。人类智慧与机器智能相互启迪、共同前行的时代,正加速到来。

https://www.nature.com/articles/d41586-025-02343-x

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
在气质面前,年轻真的不值一提。

在气质面前,年轻真的不值一提。

小椰的奶奶
2026-04-19 01:52:39
好消息!独生子女证2026可补办!6类家庭速办,补贴早领早安心

好消息!独生子女证2026可补办!6类家庭速办,补贴早领早安心

复转这些年
2026-04-18 12:27:49
伊朗宣布关闭霍尔木兹海峡

伊朗宣布关闭霍尔木兹海峡

财联社
2026-04-19 02:25:05
快检查自家阳台!有人家里已大量出现,官方提醒:千万别摸

快检查自家阳台!有人家里已大量出现,官方提醒:千万别摸

环球网资讯
2026-04-18 16:23:18
悲催!网传武汉某双非高校一寝室6人,仅1人找到月薪3500元工作…

悲催!网传武汉某双非高校一寝室6人,仅1人找到月薪3500元工作…

火山詩话
2026-04-16 13:58:24
全部遇难!印尼发生坠机事故

全部遇难!印尼发生坠机事故

鲁中晨报
2026-04-18 09:56:04
全场仅2次罚球,哈登太难了!季后赛刚开打,哈登好像就被针对了

全场仅2次罚球,哈登太难了!季后赛刚开打,哈登好像就被针对了

老梁体育漫谈
2026-04-19 04:59:43
男子因噪音过敏住5年隔音舱:自己设计,已接上百个订单,帮噪音受困者找回睡眠

男子因噪音过敏住5年隔音舱:自己设计,已接上百个订单,帮噪音受困者找回睡眠

半岛官网
2026-04-16 11:20:50
恒大集团许家印被抓捕全过程

恒大集团许家印被抓捕全过程

新浪财经
2026-04-18 20:05:24
收拾完伊朗,下一个轮到中国?以色列发战争威胁,中方送出5个字

收拾完伊朗,下一个轮到中国?以色列发战争威胁,中方送出5个字

千羽解读
2026-04-18 10:12:15
犯规罚退一位!WSBK荷兰站第一回合:张雪机车车手德比斯获第4名

犯规罚退一位!WSBK荷兰站第一回合:张雪机车车手德比斯获第4名

全景体育V
2026-04-18 20:43:20
中国斯诺克传捷报!赵心童拒绝被逆转,张安达5-3,德比大战来袭

中国斯诺克传捷报!赵心童拒绝被逆转,张安达5-3,德比大战来袭

刘姚尧的文字城堡
2026-04-18 21:23:11
在医疗领域搞新型隐性腐败,武汉大学中南医院原党委常委、院长王行环被“双开”,曾任武汉雷神山医院院长

在医疗领域搞新型隐性腐败,武汉大学中南医院原党委常委、院长王行环被“双开”,曾任武汉雷神山医院院长

大风新闻
2026-04-18 11:25:25
特朗普又定下最后期限

特朗普又定下最后期限

大象新闻
2026-04-18 15:55:19
伊朗军方发言人:因美国“违背承诺”伊方已恢复对霍尔木兹海峡的控制

伊朗军方发言人:因美国“违背承诺”伊方已恢复对霍尔木兹海峡的控制

财联社
2026-04-18 16:16:06
14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

14岁被送上导演的床,17岁拍全裸写真,被操控半生,如今怎样了?

不似少年游
2026-04-17 19:31:49
13分完胜!骑士季后赛开门红:全场狂欢庆祝,哈登首秀22+10

13分完胜!骑士季后赛开门红:全场狂欢庆祝,哈登首秀22+10

体坛小李
2026-04-19 04:40:58
警告三次不如动真格一次!中方勒令即刻停运,西方媒体都看懵了

警告三次不如动真格一次!中方勒令即刻停运,西方媒体都看懵了

书纪文谭
2026-04-18 16:10:54
蓝营内斗升级!超20位蓝委集体倒戈,公开反对郑丽文!

蓝营内斗升级!超20位蓝委集体倒戈,公开反对郑丽文!

瞻史
2026-04-18 17:47:28
辽宁5分惜败!广东被大逆转!山西输1分,吉林输18分,排名大变

辽宁5分惜败!广东被大逆转!山西输1分,吉林输18分,排名大变

老吴说体育
2026-04-18 22:08:21
2026-04-19 05:15:00
生物世界 incentive-icons
生物世界
最前沿、最有趣的生命科学研究
9227文章数 145055关注度
往期回顾 全部

科技要闻

传Meta下月拟裁8000 大举清退人力为AI腾位

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

头条要闻

伊朗革命卫队向油轮开火 伊朗最高领袖发声

体育要闻

时隔25年重返英超!没有人再嘲笑他了

娱乐要闻

刘德华回应潘宏彬去世,拒谈丧礼细节

财经要闻

"影子万科"2.0:管理层如何吸血万物云?

汽车要闻

奇瑞威麟R08 PRO正式上市 售价14.48万元起

态度原创

时尚
健康
数码
亲子
游戏

选对发型,真的能少走很多变美弯路

干细胞抗衰4大误区,90%的人都中招

数码要闻

华为版的科技春晚来了!Pura 90/Pura X Max下周发:阵容豪华

亲子要闻

退烧药怎么用?90%家长都搞错了

让老粥批直呼“计划有变”的岁兽代理人,到底是什么东西?

无障碍浏览 进入关怀版