网易首页 > 网易号 > 正文 申请入驻

DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场

0
分享至



机器之心报道

机器之心编辑部

刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。

更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。

谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果!



谷歌这项成绩远超其在 2024 年的表现。当时,AlphaProof 和 AlphaGeometry 系统组合解决了六个问题中的四个,荣获银牌。



今年的突破来自 Gemini Deep Think,这是一个增强型推理系统,采用了研究人员所谓的并行思维。与遵循单一推理链的传统人工智能模型不同,Deep Think 会同时探索多种可能的解决方案,最终得出答案。

哈萨比斯在后续帖子中解释道:谷歌的模型以自然语言进行端到端运行,直接从官方问题描述中生成严格的数学证明。并强调,该系统在比赛标准的 4.5 小时时限内完成了任务。



谷歌这次官宣,让 OpenAI 处于尴尬的处境,毕竟 OpenAI 因绕过官方竞赛规则提前官宣,遭到很多人吐槽。可参考《OpenAI 拿 IMO 金牌是火了,但惹怒大批人:抢发炒作,抢学生风头》。

谷歌 DeepMind 这种谨慎的发布方式赢得了 AI 界的广泛赞誉,尤其与竞争对手 OpenAI 对类似成绩的处理方式形成了鲜明对比。

「我们没有在周五宣布这一消息,是因为我们尊重 IMO 理事会最初的要求,即所有人工智能实验室只有在官方结果经过独立专家验证,并且学生获得应有的赞誉后,才能分享其成果。」哈萨比斯写道。



对比之下,大家都在谴责 OpenAI 做事不地道、毫无风度、无礼。反观谷歌 DeepMind ,行事正直,符合人性。



这种批评源于 OpenAI 决定在不参与 IMO 官方评估流程的情况下公布自己的成绩。OpenAI 让一个由前 IMO 参赛选手组成的小组对其 AI 的表现进行评分,社区中的一些人认为这种做法缺乏可信度。

OpenAI 又来回应了

OpenAI 研究科学家 Noam Brown 向谷歌发来祝贺,说是祝贺,更多的是为了回应质疑。以下是回应内容。

谷歌采用的方法与我们略有不同,这表明还有很多研究方向值得探讨。

两个月前,IMO 组委会曾通过邮件邀请我们参加基于 Lean 语言的正式比赛。由于我们一直致力于不受 Lean 限制的自然语言通用推理研究,因此婉拒了该邀请。组委会从未就自然语言解题形式与我们进行过接洽。

在过去的几个月里,我们在通用推理方面取得了很大进展。这包括收集、整理和训练高质量的数学数据,这些数据也将用于未来的模型。在 IMO 评估中,我们没有使用 RAG 或任何其他工具。



我们提交的每份证明都由三位外部 IMO 奖牌获得者评分,并获得了一致的正确性认可。我们还将证明公开发布,以便任何人都可以验证其正确性。

证明地址:https://github.com/aw31/openai-imo-2025-proofs/



在分享我们的结果之前,我们与 IMO 的一位董事会成员进行了交谈,他要求我们等到颁奖典礼结束后再公开结果,我们的发布满足要求。

我们在颁奖典礼结束后,于太平洋时间~凌晨 1 点(澳大利亚东部标准时间下午 6 点)宣布。从来没有人要求我们晚于此宣布。

最重要的是,我们很高兴与世界分享我们的进展和成果。AI 推理能力正在快速发展,这些 IMO 结果确实表明了这一点。



通过这件事,我们不难发现,这场 AI 登上数学奥林匹克舞台的较量,不只是一次技术竞赛,更是一场关于规范、节奏与合作精神的展示。DeepMind 选择了等待官方认可,再谨慎发布成绩,赢得了金牌,也赢得了尊重。而 OpenAI 尽管也取得了不俗成果,却因时机与方式的问题,引发了争议。这背后提醒我们,在通往 AGI 的路上,除了技术力,如何与人类社会的规则与价值观对齐,正变得愈发重要。

https://x.com/polynoamial/status/1947398536577822798

https://venturebeat.com/ai/google-deepmind-makes-ai-history-with-gold-medal-win-at-worlds-toughest-math-competition/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
蒯曼4-1长崎美柚,连胜两位日乒队员,晋级女单四强,轰两局11:3

蒯曼4-1长崎美柚,连胜两位日乒队员,晋级女单四强,轰两局11:3

湘楚风云
2026-01-11 00:30:01
果然不出中国所料:日本喊话俄罗斯,72年基业绝不能毁在中国手上

果然不出中国所料:日本喊话俄罗斯,72年基业绝不能毁在中国手上

历史有些冷
2026-01-09 18:50:02
施海荣有魄力,换大量替补出场!郭中楠魏伊衫范泊宁都有出色表现

施海荣有魄力,换大量替补出场!郭中楠魏伊衫范泊宁都有出色表现

金毛爱女排
2026-01-11 00:00:09
陪玩陪睡已过时!拳头塞嘴、集体开嫖、戚薇遭殃,阴暗面彻底曝光

陪玩陪睡已过时!拳头塞嘴、集体开嫖、戚薇遭殃,阴暗面彻底曝光

涵豆说娱
2025-11-20 16:35:46
双丰收,雄鹿战胜湖人后,字母哥收到了一份来自詹姆斯的特别礼物

双丰收,雄鹿战胜湖人后,字母哥收到了一份来自詹姆斯的特别礼物

好火子
2026-01-11 00:44:14
人有没有钱,一看便知:没钱的子女,大多有3大特质、3大穷习惯

人有没有钱,一看便知:没钱的子女,大多有3大特质、3大穷习惯

第一桶金学派
2025-06-30 10:18:46
牡丹花下死,做鬼也风流!37岁“纵欲过度”的王思聪,再陷大丑闻

牡丹花下死,做鬼也风流!37岁“纵欲过度”的王思聪,再陷大丑闻

瓜汁橘长Dr
2025-12-22 15:12:57
哈工大发现:喜欢睡午觉的人,寿命比不睡午觉的人长几年不止?

哈工大发现:喜欢睡午觉的人,寿命比不睡午觉的人长几年不止?

健康之光
2026-01-05 14:22:46
WTT冠军赛四强对阵,三位国乒冠军出局,蒯曼立功,陈幸同压力大

WTT冠军赛四强对阵,三位国乒冠军出局,蒯曼立功,陈幸同压力大

云隐南山
2026-01-11 02:36:52
一举超越美日!中国砸下263亿建全球最大海上机场,到底有多牛?

一举超越美日!中国砸下263亿建全球最大海上机场,到底有多牛?

科学知识点秀
2026-01-10 08:00:04
专家提醒:不要买!不要吃!里面含有硼砂,危害健康,别害了自己

专家提醒:不要买!不要吃!里面含有硼砂,危害健康,别害了自己

蜉蝣说
2025-10-31 10:56:39
四川省城市足球联赛总决赛阶段抽签结果揭晓,首战计划在3月14日打响!

四川省城市足球联赛总决赛阶段抽签结果揭晓,首战计划在3月14日打响!

红星新闻
2026-01-11 00:23:08
1950年,师级首长在成都遭活剥?毛主席拍案而起:116万土匪,一个不留!

1950年,师级首长在成都遭活剥?毛主席拍案而起:116万土匪,一个不留!

寄史言志
2026-01-07 20:37:09
第一次去男友家,我吃了一桌剩菜,偷听母子对话后,我连夜逃离

第一次去男友家,我吃了一桌剩菜,偷听母子对话后,我连夜逃离

云端小院
2026-01-10 10:44:29
特朗普通告全球,不许3国买俄油,话音刚落,中方第一个宣布不服

特朗普通告全球,不许3国买俄油,话音刚落,中方第一个宣布不服

南宗历史
2026-01-10 13:06:24
福建婚礼上新娘颜值爆表走红,新郎长相惹争议:懂事早和董事长?

福建婚礼上新娘颜值爆表走红,新郎长相惹争议:懂事早和董事长?

梅子的小情绪
2025-11-29 14:26:05
伊朗多个城市宣布脱离政府控制,革命卫队军人被打死!

伊朗多个城市宣布脱离政府控制,革命卫队军人被打死!

知兵
2026-01-11 00:07:45
爆笑经典侄女糗事冷笑话,侄女三岁多初上幼儿园不知天高地厚,当老师教育她时她居然说!

爆笑经典侄女糗事冷笑话,侄女三岁多初上幼儿园不知天高地厚,当老师教育她时她居然说!

天天明星
2026-01-10 12:08:36
婆婆把80万全给小叔子,两年后哭着敲门,入赘老公的做法让我意外

婆婆把80万全给小叔子,两年后哭着敲门,入赘老公的做法让我意外

木子言故事
2026-01-04 13:01:59
一生仅存六首诗,却有两首被写进课本,成七绝五绝之最

一生仅存六首诗,却有两首被写进课本,成七绝五绝之最

长风文史
2025-11-26 15:26:24
2026-01-11 03:24:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12088文章数 142534关注度
往期回顾 全部

科技要闻

必看 | 2026开年最顶格的AI对话

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

头条要闻

特朗普签署行政令 宣布进入国家紧急状态

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

吴速玲曝儿子Joe是恋爱脑

财经要闻

这不算诈骗吗?水滴保诱导扣款惹众怒

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

艺术
健康
亲子
数码
公开课

艺术要闻

601米,150亿美元!沙特目前第一高楼是它!

这些新疗法,让化疗不再那么痛苦

亲子要闻

方媛晒三个女儿:大宝趴地上画画,二宝读英文书!三胎睡婴儿车里

数码要闻

熊猫主题圈粉老外,长虹AI家电亮相CES,东方元素成顶流

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版