网易首页 > 网易号 > 正文 申请入驻

DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场

0
分享至


来源:机器之心报道

机器之心编辑部

刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。

更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。

谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果!


谷歌这项成绩远超其在 2024 年的表现。当时,AlphaProof 和 AlphaGeometry 系统组合解决了六个问题中的四个,荣获银牌。


今年的突破来自 Gemini Deep Think,这是一个增强型推理系统,采用了研究人员所谓的并行思维。与遵循单一推理链的传统人工智能模型不同,Deep Think 会同时探索多种可能的解决方案,最终得出答案。

哈萨比斯在后续帖子中解释道:谷歌的模型以自然语言进行端到端运行,直接从官方问题描述中生成严格的数学证明。并强调,该系统在比赛标准的 4.5 小时时限内完成了任务。


谷歌这次官宣,让 OpenAI 处于尴尬的处境,毕竟 OpenAI 因绕过官方竞赛规则提前官宣,遭到很多人吐槽。可参考《》。

谷歌 DeepMind 这种谨慎的发布方式赢得了 AI 界的广泛赞誉,尤其与竞争对手 OpenAI 对类似成绩的处理方式形成了鲜明对比。

「我们没有在周五宣布这一消息,是因为我们尊重 IMO 理事会最初的要求,即所有人工智能实验室只有在官方结果经过独立专家验证,并且学生获得应有的赞誉后,才能分享其成果。」哈萨比斯写道。


对比之下,大家都在谴责 OpenAI 做事不地道、毫无风度、无礼。反观谷歌 DeepMind ,行事正直,符合人性。


这种批评源于 OpenAI 决定在不参与 IMO 官方评估流程的情况下公布自己的成绩。OpenAI 让一个由前 IMO 参赛选手组成的小组对其 AI 的表现进行评分,社区中的一些人认为这种做法缺乏可信度。

OpenAI 又来回应了

OpenAI 研究科学家 Noam Brown 向谷歌发来祝贺,说是祝贺,更多的是为了回应质疑。以下是回应内容。

谷歌采用的方法与我们略有不同,这表明还有很多研究方向值得探讨。

两个月前,IMO 组委会曾通过邮件邀请我们参加基于 Lean 语言的正式比赛。由于我们一直致力于不受 Lean 限制的自然语言通用推理研究,因此婉拒了该邀请。组委会从未就自然语言解题形式与我们进行过接洽。

在过去的几个月里,我们在通用推理方面取得了很大进展。这包括收集、整理和训练高质量的数学数据,这些数据也将用于未来的模型。在 IMO 评估中,我们没有使用 RAG 或任何其他工具。


我们提交的每份证明都由三位外部 IMO 奖牌获得者评分,并获得了一致的正确性认可。我们还将证明公开发布,以便任何人都可以验证其正确性。

证明地址:https://github.com/aw31/openai-imo-2025-proofs/


在分享我们的结果之前,我们与 IMO 的一位董事会成员进行了交谈,他要求我们等到颁奖典礼结束后再公开结果,我们的发布满足要求。

我们在颁奖典礼结束后,于太平洋时间~凌晨 1 点(澳大利亚东部标准时间下午 6 点)宣布。从来没有人要求我们晚于此宣布。

最重要的是,我们很高兴与世界分享我们的进展和成果。AI 推理能力正在快速发展,这些 IMO 结果确实表明了这一点。


通过这件事,我们不难发现,这场 AI 登上数学奥林匹克舞台的较量,不只是一次技术竞赛,更是一场关于规范、节奏与合作精神的展示。DeepMind 选择了等待官方认可,再谨慎发布成绩,赢得了金牌,也赢得了尊重。而 OpenAI 尽管也取得了不俗成果,却因时机与方式的问题,引发了争议。这背后提醒我们,在通往 AGI 的路上,除了技术力,如何与人类社会的规则与价值观对齐,正变得愈发重要。

https://x.com/polynoamial/status/1947398536577822798

https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828


未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到3月31日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
12胜0负!联盟第1!全联盟都说你要退役了,你却天神下凡再创神迹

12胜0负!联盟第1!全联盟都说你要退役了,你却天神下凡再创神迹

老侃侃球
2026-01-07 03:30:03
【官方】蓉城宣布签约海牛旧将席尔瓦 上赛季入11球

【官方】蓉城宣布签约海牛旧将席尔瓦 上赛季入11球

体坛周报
2026-01-07 11:49:11
特斯拉中国:购买Model 3和Model Y、Model Y L车型5年0息

特斯拉中国:购买Model 3和Model Y、Model Y L车型5年0息

极目新闻
2026-01-06 09:58:24
帮忙带娃被网暴后续,小姑子晒出多张证据,亲戚透露更多内情

帮忙带娃被网暴后续,小姑子晒出多张证据,亲戚透露更多内情

丁丁鲤史纪
2026-01-07 11:13:43
黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

揽星河的笔记
2025-12-08 13:30:38
有钱却总喜欢装穷的三个星座男

有钱却总喜欢装穷的三个星座男

星座叶大仙
2026-01-07 10:42:19
中国为何几乎不拍“元朝历史剧”?不是不想拍,而是确实不能拍

中国为何几乎不拍“元朝历史剧”?不是不想拍,而是确实不能拍

老踝是个手艺人
2026-01-07 09:24:27
2-1逆转,25岁英格兰猛将绝杀,英超第17掀翻西汉姆联,终结4连败

2-1逆转,25岁英格兰猛将绝杀,英超第17掀翻西汉姆联,终结4连败

侧身凌空斩
2026-01-07 05:56:04
2026年春节将现5大现象:摩托军消失,亲戚不在走动,原因很现实

2026年春节将现5大现象:摩托军消失,亲戚不在走动,原因很现实

小虎新车推荐员
2026-01-07 06:15:09
“刘文彩,喝人奶”,他到底喝没喝过?刘文彩的儿子揭露真相!

“刘文彩,喝人奶”,他到底喝没喝过?刘文彩的儿子揭露真相!

铭记历史呀
2025-12-31 02:05:57
事件升级!司晓迪晒开房记录,16个男顶流被锤!内娱彻底玩完

事件升级!司晓迪晒开房记录,16个男顶流被锤!内娱彻底玩完

小玡说故事
2026-01-06 10:02:21
黄国昌正式辞职!好在郑丽文早有准备,柯文哲留下关键一人

黄国昌正式辞职!好在郑丽文早有准备,柯文哲留下关键一人

肖兹探秘说
2026-01-06 13:21:16
张怡宁没想到,2026刚开始,官媒高调官宣邓亚萍喜讯,终等到这天

张怡宁没想到,2026刚开始,官媒高调官宣邓亚萍喜讯,终等到这天

阿纂看事
2026-01-07 13:44:51
“世纪审判”首次听证会:马杜罗“我无罪、我是个正直的人”,法官“92岁高龄”,“36年前有先例”

“世纪审判”首次听证会:马杜罗“我无罪、我是个正直的人”,法官“92岁高龄”,“36年前有先例”

华尔街见闻官方
2026-01-06 08:27:09
蒙古国大胆想法:拿400平方公里和中国换通道?想将稀土运往美国

蒙古国大胆想法:拿400平方公里和中国换通道?想将稀土运往美国

科普100克克
2025-12-27 13:33:52
姚安娜这事儿真让人想不通,每月掏二十万请全剧组喝咖啡,

姚安娜这事儿真让人想不通,每月掏二十万请全剧组喝咖啡,

小光侃娱乐
2026-01-06 20:45:03
醪糟被关注!医生:常吃醪糟的人,不用多久,肠道或迎来3个变化

醪糟被关注!医生:常吃醪糟的人,不用多久,肠道或迎来3个变化

阿兵科普
2025-11-30 20:53:55
遭中方谴责后,马斯克星链降轨70公里!更逼近空间站,到底想干啥

遭中方谴责后,马斯克星链降轨70公里!更逼近空间站,到底想干啥

铁锤简科
2026-01-05 15:30:14
苏富比5.9亿“稀世粉钻”惨遭流拍,西方巨头破防:河南负全责!

苏富比5.9亿“稀世粉钻”惨遭流拍,西方巨头破防:河南负全责!

诗意世界
2025-12-31 17:59:26
前所未有!俄军空袭刚开始,乌军就开始反击,直接与俄罗斯对轰!

前所未有!俄军空袭刚开始,乌军就开始反击,直接与俄罗斯对轰!

阿龙聊军事
2025-06-07 20:04:46
2026-01-07 15:40:49
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4450文章数 37368关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

北京独生女被男友殴打致残:他让我再买房写他儿子名字

头条要闻

北京独生女被男友殴打致残:他让我再买房写他儿子名字

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

教育
旅游
亲子
艺术
军事航空

教育要闻

中字头央企四川分公司2026校招246人,成都锦城学院成最大赢家

旅游要闻

怀柔区将打造“四季有景、全年可游”的体验矩阵

亲子要闻

帮忙带娃被网暴后续,小姑子晒出多张证据,亲戚透露更多内情

艺术要闻

David Grossmann:不一样的风景画

军事要闻

特朗普政府正在讨论获取格陵兰岛的方案 包括军事选项

无障碍浏览 进入关怀版