网易首页 > 网易号 > 正文 申请入驻

刚刚,OpenAI/Gemini共斩ICPC 2025金牌!OpenAI满分碾压横扫全场

0
分享至


新智元报道

编辑:定慧 艾伦

【新智元导读】ICPC 2025全球总决赛诞生历史性一幕:谷歌Gemini与OpenAI推理模型同时斩获金牌!Gemini在5小时内攻下12题中的10题,并在30分钟破解难倒所有人类的死亡C题;而OpenAI更是满分12/12,碾压139支人类队伍,成为赛场唯一全解团队。

真是疯狂!

刚刚,谷歌和OpenAI同时拿下ICPC金牌,尤其OpenAI还是满分!

ICPC全称国际大学生程序设计竞赛,是世界上最负盛名的编程竞赛之一!


规则是在五个小时内,求解十几个极其复杂的编程和算法难题!

最终,Gemini成功解答了12道题目中的10道,荣获金牌。


OpenAI则全部解答正确,获得满分,拿下金牌!


人类呢?

139支人类参赛队伍中,只有3支队伍取得了和Gemini 10/12一样的成绩,没有人类队伍获得满分。

其中和Gemini战平的唯一中国队伍,是北交大,我们在ICPC全球总决赛放榜的第一时刻也做了深入报道,解析了这支中国最强战队是如何炼成的。

尤其是,谷歌也特地提到,问题C所有人类队伍都没有解答出来,而谷歌Gemini在半个小时内成功求解!

OpenAI则是解决了所有问题,拿下满分!

真的是令人震撼的时刻,历史性的一夜,AI在最顶级的编程比赛中彻底的超过了人类!


Gemini解出所有参赛人类队伍

没有解决的问题C

谷歌官方账号宣布了Gemini 2.5 Deep Think的高级版本在ICPC 2025上取得了金牌级别的成绩。


据谷歌称,它并没有像今年早些时候为类似国际数学奥林匹克(IMO)那样,为ICPC创建全新训练的模型。

参加ICPC的Gemini 2.5与我们在Gemini应用中使用的模型相同。

不过,它经过了一些增强,能够在五个小时里不断思考!

在ICPC比赛中,只有正确的答案才能得分,而得出答案所需的时间会影响最终得分。

比赛开始后,Gemini迅速攀升至前几名,仅用45分钟就正确解答了8道题目。

Gemini最终答对了10道题,在大学队伍中获得了第二名。

谷歌特别地提到,在比赛中,Gemini成功解决了问题C——其他人类团队均未解决这个问题。


问题C要求找到一种解决方案,将液体通过互连的管道网络分配到一组储液器中,目标是找到一种管道配置,使液体尽快充满所有储液器。

由于每个管道可能是开放的、关闭的,甚至是部分开放的,因此可能的配置数量无穷无尽,因此寻找最佳配置非常困难。

Gemini的解决方法是假设每个储液罐都有一个优先级值,这使得模型能够使用动态规划算法找到最高效的配置。

经过30分钟的反复思考,Gemini使用嵌套三元搜索确定了正确的答案。


我们对谷歌公布的答案让Cursor进行了评价,Cursor也认为谷歌的求解方法非常完美。

其他题目谷歌已经全部公布在GitHub上,感兴趣可以挑战一下~


https://github.com/google-deepmind/gemini_icpc2025

OpenAI AK ICPC背后的秘密

Gemini已经通过解出了让人类全军覆没的超高难度的C题证明了自己的强大实力。

但是,还有高手!OpenAI的推理模型直接通关了全场12道题目,AK(All Kill,指解出全部题目) ICPC!

背后的研究团队也是连发8条推文来庆祝这一历史性时刻。



其中值得注意的是,其中11道题目,都是直接用了大家都能用的GPT-5解决的,只有最难的一道题(可能指的是难倒全部人类的题目C,可能是指最后一个问题L,也可能是其他对大模型而言更困难的问题)是用一个未公布型号的神秘实验推理模型解决的。


这个神秘实验模型,会不会就是下一代的全新推理模型呢?

最后一条推文中,几位幕后关键研究人员也纷纷被@出来亮相了。


查询身份后得知,他们都是o1及之后的这些推理模型的关键研究人员。

其中有一位,更是ICPC的2015年世界冠军队伍成员,Borys Minaiev。


他为人熟知的算法界ID是:qwerty787788


在当年的这支夺冠队伍的三人中,还有另一位更广为人知的传奇人物,那就是tourist,算法界最强王者,世界第一人!


此外,OpenAI首席科学家Jakub Pachocki也是ICPC世界金牌得主,赛后也转发了推文,对该团队的优异表现表达了热烈祝贺。


众多ICPC世界顶尖选手加盟OpenAI,是OpenAI能最终训练出AK ICPC的大模型的强大支柱。

历史性一夜

上次OpenAI抢先谷歌公布IMO结果的时候,还闹出了小小的风波。

谷歌和OpenAI都想争一争谁是第一个拿下IMO这种级别赛事的AI。

而这一次,两者同时宣布,意义非凡!

ICPC全球执行董事,BILL POUCHER博士认为:

Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。

AI在ICPC上斩获金牌对软件开发有着直接且实际的意义。

这表明人工智能可以成为程序员真正的问题解决伙伴。

不论是谷歌的CEO劈柴,还是OpenAI的首席科学家都是亲自为自家的AI站台!



除了编程和数学,AI这种强大的抽象推理能力可以应用于许多科学和工程领域,如设计新药或芯片。

人工智能正在从单纯的信息处理转向真正帮助解决世界上一些最棘手的推理问题,从而造福全人类。

参考资料:

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/merettm/status/1968363783820353587

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/GoogleDeepMind/status/1968361776321323420

https://github.com/google-deepmind/gemini_icpc2025

https://arstechnica.com/google/2025/09/google-gemini-earns-gold-medal-in-icpc-world-finals-coding-competition/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河北廊坊通报“新人婚车遭拦截被索要50条烟”:系误传,实为索要9条香烟,对胡某某、殷某某等6人给予行政处罚、批评教育处理

河北廊坊通报“新人婚车遭拦截被索要50条烟”:系误传,实为索要9条香烟,对胡某某、殷某某等6人给予行政处罚、批评教育处理

扬子晚报
2025-11-11 10:19:33
稀土的现实与想象

稀土的现实与想象

阿罗汉不约
2025-11-09 14:29:08
怀孕超35周孕妇登机后要求特殊照顾被劝下飞机,航班延误一个多小时;西藏航空回应:因旅客原因出现延误

怀孕超35周孕妇登机后要求特殊照顾被劝下飞机,航班延误一个多小时;西藏航空回应:因旅客原因出现延误

鲁中晨报
2025-11-11 11:39:05
常州回应儿子暴打93岁母亲:当地正在调查此事

常州回应儿子暴打93岁母亲:当地正在调查此事

极目新闻
2025-11-11 12:42:20
祖院长是凤凰男,知情人曝妻子不愿意离婚,偷拍视频者至今成谜

祖院长是凤凰男,知情人曝妻子不愿意离婚,偷拍视频者至今成谜

一言二拍pro
2025-11-11 10:59:35
全国各地医保亏损,新乡限制医保报销额度,统筹日支付限额50元!

全国各地医保亏损,新乡限制医保报销额度,统筹日支付限额50元!

你食不食油饼
2025-11-11 07:00:06
长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

长沙不雅视频再升级!曾医生铺垫截图流出,网友哭诉自家不和谐了

火山诗话
2025-11-11 09:07:42
国乒新星陈俊菘战胜樊振东,全运会乒乓球赛激烈角逐

国乒新星陈俊菘战胜樊振东,全运会乒乓球赛激烈角逐

七七自驾游
2025-11-11 10:49:44
纳指涨超2%!英伟达涨近6%,市值大增1.9万亿元!存储概念股普涨,闪迪涨近12%!金价涨2.8%

纳指涨超2%!英伟达涨近6%,市值大增1.9万亿元!存储概念股普涨,闪迪涨近12%!金价涨2.8%

每日经济新闻
2025-11-11 07:00:06
男子追赶偷狗贼遭棒击并被毒针射死,15年后一主犯仍在逃,受害者儿子:想为父亲申报见义勇为

男子追赶偷狗贼遭棒击并被毒针射死,15年后一主犯仍在逃,受害者儿子:想为父亲申报见义勇为

极目新闻
2025-11-11 09:22:54
特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

特朗普:只要我在任,无人敢收台,话音刚落,中方划下4条红线

现代小青青慕慕
2025-11-10 11:09:16
朱芝松,被提起公诉

朱芝松,被提起公诉

第一财经资讯
2025-11-11 10:12:00
优酷的会员数跌破一亿,不是因为没剧,而是没人愿意为平庸买单了

优酷的会员数跌破一亿,不是因为没剧,而是没人愿意为平庸买单了

现代春秋
2025-11-10 15:40:04
“多付车费后男子轻生”后续:一审判司机退还900元 司机称钱已交给法院

“多付车费后男子轻生”后续:一审判司机退还900元 司机称钱已交给法院

红星新闻
2025-11-11 10:56:13
太荒唐了!湖南人民医院事件原因流出,视频拍摄者竟然是他

太荒唐了!湖南人民医院事件原因流出,视频拍摄者竟然是他

平老师666
2025-11-10 12:52:30
陪睡陪玩只是小场面!撒谎、嫉妒、诬陷,白百何的私心藏不住了

陪睡陪玩只是小场面!撒谎、嫉妒、诬陷,白百何的私心藏不住了

叶公子
2025-11-10 19:57:30
国家广电总局关于撤销机顶盒的重要消息

国家广电总局关于撤销机顶盒的重要消息

小柱解说游戏
2025-11-09 14:50:37
祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

祖雄兵越扒越有:男方有前科,曾琦医德很好,偷拍者身份炸裂

寒士之言本尊
2025-11-10 22:51:59
你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

你错过了哪些异性对你的暗示?网友:果然单身都是有理由的!

解读热点事件
2025-11-08 17:33:23
东契奇38+6+7湖人一节发力击退黄蜂,里夫斯24+5+7布里奇斯34+8+5

东契奇38+6+7湖人一节发力击退黄蜂,里夫斯24+5+7布里奇斯34+8+5

湖人崛起
2025-11-11 10:27:18
2025-11-11 13:28:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13841文章数 66241关注度
往期回顾 全部

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

头条要闻

取钱被追问用途律师:已拒绝建行道歉 向监管部门控告

头条要闻

取钱被追问用途律师:已拒绝建行道歉 向监管部门控告

体育要闻

重返诺坎普!梅西:希望有一天能回来

娱乐要闻

何超莲窦骁真的没离婚?

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

房产
亲子
手机
本地
公开课

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

亲子要闻

北京二环内的真实生活,祖孙三代在小院里的欢声笑语,真温馨!

手机要闻

全球首发2nm芯片!三星Galaxy S26+渲染图出炉

本地新闻

这届干饭人,已经把博物馆吃成了食堂

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版