网易首页 > 网易号 > 正文 申请入驻

刚刚,OpenAI/Gemini共斩ICPC 2025金牌!OpenAI满分碾压横扫全场

0
分享至

新智元报道

编辑:定慧 艾伦

【新智元导读】ICPC 2025全球总决赛诞生历史性一幕:谷歌Gemini与OpenAI推理模型同时斩获金牌!Gemini在5小时内攻下12题中的10题,并在30分钟破解难倒所有人类的死亡C题;而OpenAI更是满分12/12,碾压139支人类队伍,成为赛场唯一全解团队。

真是疯狂!

刚刚,谷歌和OpenAI同时拿下ICPC金牌,尤其OpenAI还是满分!

ICPC全称国际大学生程序设计竞赛,是世界上最负盛名的编程竞赛之一!

规则是在五个小时内,求解十几个极其复杂的编程和算法难题!

最终,Gemini成功解答了12道题目中的10道,荣获金牌。

OpenAI则全部解答正确,获得满分,拿下金牌!

人类呢?

139支人类参赛队伍中,只有3支队伍取得了和Gemini 10/12一样的成绩,没有人类队伍获得满分。

其中和Gemini战平的唯一中国队伍,是北交大,我们在ICPC全球总决赛放榜的第一时刻也做了深入报道,解析了这支中国最强战队是如何炼成的。

尤其是,谷歌也特地提到,问题C所有人类队伍都没有解答出来,而谷歌Gemini在半个小时内成功求解!

OpenAI则是解决了所有问题,拿下满分!

真的是令人震撼的时刻,历史性的一夜,AI在最顶级的编程比赛中彻底的超过了人类!

Gemini解出所有参赛人类队伍

没有解决的问题C

谷歌官方账号宣布了Gemini 2.5 Deep Think的高级版本在ICPC 2025上取得了金牌级别的成绩。

据谷歌称,它并没有像今年早些时候为类似国际数学奥林匹克(IMO)那样,为ICPC创建全新训练的模型。

参加ICPC的Gemini 2.5与我们在Gemini应用中使用的模型相同。

不过,它经过了一些增强,能够在五个小时里不断思考!

在ICPC比赛中,只有正确的答案才能得分,而得出答案所需的时间会影响最终得分。

比赛开始后,Gemini迅速攀升至前几名,仅用45分钟就正确解答了8道题目。

Gemini最终答对了10道题,在大学队伍中获得了第二名。

谷歌特别地提到,在比赛中,Gemini成功解决了问题C——其他人类团队均未解决这个问题。

问题C要求找到一种解决方案,将液体通过互连的管道网络分配到一组储液器中,目标是找到一种管道配置,使液体尽快充满所有储液器。

由于每个管道可能是开放的、关闭的,甚至是部分开放的,因此可能的配置数量无穷无尽,因此寻找最佳配置非常困难。

Gemini的解决方法是假设每个储液罐都有一个优先级值,这使得模型能够使用动态规划算法找到最高效的配置。

经过30分钟的反复思考,Gemini使用嵌套三元搜索确定了正确的答案。

我们对谷歌公布的答案让Cursor进行了评价,Cursor也认为谷歌的求解方法非常完美。

其他题目谷歌已经全部公布在GitHub上,感兴趣可以挑战一下~

https://github.com/google-deepmind/gemini_icpc2025

OpenAI AK ICPC背后的秘密

Gemini已经通过解出了让人类全军覆没的超高难度的C题证明了自己的强大实力。

但是,还有高手!OpenAI的推理模型直接通关了全场12道题目,AK(All Kill,指解出全部题目) ICPC!

背后的研究团队也是连发8条推文来庆祝这一历史性时刻。

其中值得注意的是,其中11道题目,都是直接用了大家都能用的GPT-5解决的,只有最难的一道题(可能指的是难倒全部人类的题目C,可能是指最后一个问题L,也可能是其他对大模型而言更困难的问题)是用一个未公布型号的神秘实验推理模型解决的。

这个神秘实验模型,会不会就是下一代的全新推理模型呢?

最后一条推文中,几位幕后关键研究人员也纷纷被@出来亮相了。

查询身份后得知,他们都是o1及之后的这些推理模型的关键研究人员。

其中有一位,更是ICPC的2015年世界冠军队伍成员,Borys Minaiev。

他为人熟知的算法界ID是:qwerty787788

在当年的这支夺冠队伍的三人中,还有另一位更广为人知的传奇人物,那就是tourist,算法界最强王者,世界第一人!

此外,OpenAI首席科学家Jakub Pachocki也是ICPC世界金牌得主,赛后也转发了推文,对该团队的优异表现表达了热烈祝贺。

众多ICPC世界顶尖选手加盟OpenAI,是OpenAI能最终训练出AK ICPC的大模型的强大支柱。

历史性一夜

上次OpenAI抢先谷歌公布IMO结果的时候,还闹出了小小的风波。

谷歌和OpenAI都想争一争谁是第一个拿下IMO这种级别赛事的AI。

而这一次,两者同时宣布,意义非凡!

ICPC全球执行董事,BILL POUCHER博士认为:

Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。

AI在ICPC上斩获金牌对软件开发有着直接且实际的意义。

这表明人工智能可以成为程序员真正的问题解决伙伴。

不论是谷歌的CEO劈柴,还是OpenAI的首席科学家都是亲自为自家的AI站台!

除了编程和数学,AI这种强大的抽象推理能力可以应用于许多科学和工程领域,如设计新药或芯片。

人工智能正在从单纯的信息处理转向真正帮助解决世界上一些最棘手的推理问题,从而造福全人类。

参考资料:

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/merettm/status/1968363783820353587

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/GoogleDeepMind/status/1968361776321323420

https://github.com/google-deepmind/gemini_icpc2025

https://arstechnica.com/google/2025/09/google-gemini-earns-gold-medal-in-icpc-world-finals-coding-competition/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
戴维斯:如果2019年莫兰特当选为状元秀 我可能还留在鹈鹕

戴维斯:如果2019年莫兰特当选为状元秀 我可能还留在鹈鹕

仰卧撑FTUer
2026-04-09 11:20:09
特斯拉FSD 14.3视觉画质大改,更惊艳

特斯拉FSD 14.3视觉画质大改,更惊艳

沙雕小琳琳
2026-04-08 10:17:45
巴塞罗那0-2马竞,赛后评分:不是马竞球员第1,巴塞罗那10号第1

巴塞罗那0-2马竞,赛后评分:不是马竞球员第1,巴塞罗那10号第1

侧身凌空斩
2026-04-09 04:56:44
中国将来最大敌人:不是特朗普,而是手握杀招、重构科技规则的他

中国将来最大敌人:不是特朗普,而是手握杀招、重构科技规则的他

通文知史
2026-04-08 09:20:07
“没能通过考验”,美国考虑从部分北约国家撤离驻军,特朗普:我们想要格陵兰岛,那块大而管理糟糕的冰,他们不想给,那我就说“拜拜”

“没能通过考验”,美国考虑从部分北约国家撤离驻军,特朗普:我们想要格陵兰岛,那块大而管理糟糕的冰,他们不想给,那我就说“拜拜”

每日经济新闻
2026-04-09 10:58:11
贝兹利和队友冲突 宁波赛后宣布解约:外援无特权!

贝兹利和队友冲突 宁波赛后宣布解约:外援无特权!

体坛周报
2026-04-08 21:46:20
美媒披露特朗普发动伊朗战争内幕:“全凭直觉”,除万斯外无人反对

美媒披露特朗普发动伊朗战争内幕:“全凭直觉”,除万斯外无人反对

澎湃新闻
2026-04-08 20:56:27
拒绝18分翻盘,骑士赢下季后赛预演,数据一览,最大功臣不是哈登

拒绝18分翻盘,骑士赢下季后赛预演,数据一览,最大功臣不是哈登

小徐讲八卦
2026-04-09 11:34:02
纪委是如何发现贪腐的?看完这篇,你就明白了

纪委是如何发现贪腐的?看完这篇,你就明白了

细说职场
2026-04-09 09:20:30
厉害了!郑丽文参访美团,惊叫连连,这波行程安排,太懂人心

厉害了!郑丽文参访美团,惊叫连连,这波行程安排,太懂人心

魔都姐姐杂谈
2026-04-08 22:44:10
随着韩国0-5,女足亚洲杯八强对阵出炉:中国PK弱旅,朝鲜PK强敌

随着韩国0-5,女足亚洲杯八强对阵出炉:中国PK弱旅,朝鲜PK强敌

侧身凌空斩
2026-04-08 22:59:50
专家警告:每天吃一颗红枣,就等于给心脏“踩刹车”?真相来了

专家警告:每天吃一颗红枣,就等于给心脏“踩刹车”?真相来了

岐黄传人孙大夫
2026-04-09 09:05:03
看了41岁吴敏霞在上海的生活,才懂她拒绝霍启山,到底有多明智

看了41岁吴敏霞在上海的生活,才懂她拒绝霍启山,到底有多明智

秋姐居
2026-04-08 17:13:26
谁是逆转青岛的主导者?麦穗丰:不是43分的麦考尔,两人至关重要

谁是逆转青岛的主导者?麦穗丰:不是43分的麦考尔,两人至关重要

南海浪花
2026-04-09 06:48:22
事实证明,73岁无儿无女的迟重瑞,早被陈丽华“安排”好了退路

事实证明,73岁无儿无女的迟重瑞,早被陈丽华“安排”好了退路

叨唠
2026-04-08 20:01:45
反美是工作,赴美是生活?——有多少伊朗高官的亲属生活在美国

反美是工作,赴美是生活?——有多少伊朗高官的亲属生活在美国

黑噪音
2026-04-07 11:09:01
岳阳男子遇害细节曝光!发小预谋60天,自制钢珠射击器,两枪毙命

岳阳男子遇害细节曝光!发小预谋60天,自制钢珠射击器,两枪毙命

青橘罐头
2026-04-09 07:41:34
赵心童豪夺三冠后,英媒出手锐评,只字不提球技二字,却字字珠玑

赵心童豪夺三冠后,英媒出手锐评,只字不提球技二字,却字字珠玑

小梊搞笑解说
2026-04-09 06:04:34
2-0!亚马尔被冻结,小蜘蛛世界波,马竞终结魔咒,巴萨命悬一线

2-0!亚马尔被冻结,小蜘蛛世界波,马竞终结魔咒,巴萨命悬一线

我的护球最独特
2026-04-09 05:01:50
西方媒体:就算中国全力以赴,也不可能按时建成这么庞大的工程

西方媒体:就算中国全力以赴,也不可能按时建成这么庞大的工程

墨羽怪谈
2026-04-09 07:25:25
2026-04-09 11:51:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14931文章数 66756关注度
往期回顾 全部

科技要闻

Meta凌晨首发闭源大模型 扎克伯格又行了?

头条要闻

牛弹琴:停火数小时后发生可怕屠杀 三点实在太诡异

头条要闻

牛弹琴:停火数小时后发生可怕屠杀 三点实在太诡异

体育要闻

40岁,但实力倒退12年

娱乐要闻

具俊晔最新露面,又黑又瘦情绪低迷

财经要闻

谈判基础已被破坏!霍尔木兹海峡关闭

汽车要闻

8155芯片+L2智驾 瑞虎5运动版上市 置换补贴价6.79万元起

态度原创

时尚
教育
手机
艺术
本地

ED网红病,正在掏空年轻女性

教育要闻

“这种人谁敢录?”39岁华东师范考生举报第一名,学校回应来了

手机要闻

OPPO A6s Pro官宣4月14日发布,号称“颜值天花板”

艺术要闻

庞茂琨 2026油画写生新作

本地新闻

建水Color Walk | 古城慢调,掉进春天的调色盘里

无障碍浏览 进入关怀版