网易首页 > 网易号 > 正文 申请入驻

刚刚,OpenAI/Gemini共斩ICPC 2025金牌!OpenAI满分碾压横扫全场

0
分享至


新智元报道

编辑:定慧 艾伦

【新智元导读】ICPC 2025全球总决赛诞生历史性一幕:谷歌Gemini与OpenAI推理模型同时斩获金牌!Gemini在5小时内攻下12题中的10题,并在30分钟破解难倒所有人类的死亡C题;而OpenAI更是满分12/12,碾压139支人类队伍,成为赛场唯一全解团队。

真是疯狂!

刚刚,谷歌和OpenAI同时拿下ICPC金牌,尤其OpenAI还是满分!

ICPC全称国际大学生程序设计竞赛,是世界上最负盛名的编程竞赛之一!


规则是在五个小时内,求解十几个极其复杂的编程和算法难题!

最终,Gemini成功解答了12道题目中的10道,荣获金牌。


OpenAI则全部解答正确,获得满分,拿下金牌!


人类呢?

139支人类参赛队伍中,只有3支队伍取得了和Gemini 10/12一样的成绩,没有人类队伍获得满分。

其中和Gemini战平的唯一中国队伍,是北交大,我们在ICPC全球总决赛放榜的第一时刻也做了深入报道,解析了这支中国最强战队是如何炼成的。

尤其是,谷歌也特地提到,问题C所有人类队伍都没有解答出来,而谷歌Gemini在半个小时内成功求解!

OpenAI则是解决了所有问题,拿下满分!

真的是令人震撼的时刻,历史性的一夜,AI在最顶级的编程比赛中彻底的超过了人类!


Gemini解出所有参赛人类队伍

没有解决的问题C

谷歌官方账号宣布了Gemini 2.5 Deep Think的高级版本在ICPC 2025上取得了金牌级别的成绩。


据谷歌称,它并没有像今年早些时候为类似国际数学奥林匹克(IMO)那样,为ICPC创建全新训练的模型。

参加ICPC的Gemini 2.5与我们在Gemini应用中使用的模型相同。

不过,它经过了一些增强,能够在五个小时里不断思考!

在ICPC比赛中,只有正确的答案才能得分,而得出答案所需的时间会影响最终得分。

比赛开始后,Gemini迅速攀升至前几名,仅用45分钟就正确解答了8道题目。

Gemini最终答对了10道题,在大学队伍中获得了第二名。

谷歌特别地提到,在比赛中,Gemini成功解决了问题C——其他人类团队均未解决这个问题。


问题C要求找到一种解决方案,将液体通过互连的管道网络分配到一组储液器中,目标是找到一种管道配置,使液体尽快充满所有储液器。

由于每个管道可能是开放的、关闭的,甚至是部分开放的,因此可能的配置数量无穷无尽,因此寻找最佳配置非常困难。

Gemini的解决方法是假设每个储液罐都有一个优先级值,这使得模型能够使用动态规划算法找到最高效的配置。

经过30分钟的反复思考,Gemini使用嵌套三元搜索确定了正确的答案。


我们对谷歌公布的答案让Cursor进行了评价,Cursor也认为谷歌的求解方法非常完美。

其他题目谷歌已经全部公布在GitHub上,感兴趣可以挑战一下~


https://github.com/google-deepmind/gemini_icpc2025

OpenAI AK ICPC背后的秘密

Gemini已经通过解出了让人类全军覆没的超高难度的C题证明了自己的强大实力。

但是,还有高手!OpenAI的推理模型直接通关了全场12道题目,AK(All Kill,指解出全部题目) ICPC!

背后的研究团队也是连发8条推文来庆祝这一历史性时刻。



其中值得注意的是,其中11道题目,都是直接用了大家都能用的GPT-5解决的,只有最难的一道题(可能指的是难倒全部人类的题目C,可能是指最后一个问题L,也可能是其他对大模型而言更困难的问题)是用一个未公布型号的神秘实验推理模型解决的。


这个神秘实验模型,会不会就是下一代的全新推理模型呢?

最后一条推文中,几位幕后关键研究人员也纷纷被@出来亮相了。


查询身份后得知,他们都是o1及之后的这些推理模型的关键研究人员。

其中有一位,更是ICPC的2015年世界冠军队伍成员,Borys Minaiev。


他为人熟知的算法界ID是:qwerty787788


在当年的这支夺冠队伍的三人中,还有另一位更广为人知的传奇人物,那就是tourist,算法界最强王者,世界第一人!


此外,OpenAI首席科学家Jakub Pachocki也是ICPC世界金牌得主,赛后也转发了推文,对该团队的优异表现表达了热烈祝贺。


众多ICPC世界顶尖选手加盟OpenAI,是OpenAI能最终训练出AK ICPC的大模型的强大支柱。

历史性一夜

上次OpenAI抢先谷歌公布IMO结果的时候,还闹出了小小的风波。

谷歌和OpenAI都想争一争谁是第一个拿下IMO这种级别赛事的AI。

而这一次,两者同时宣布,意义非凡!

ICPC全球执行董事,BILL POUCHER博士认为:

Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。

AI在ICPC上斩获金牌对软件开发有着直接且实际的意义。

这表明人工智能可以成为程序员真正的问题解决伙伴。

不论是谷歌的CEO劈柴,还是OpenAI的首席科学家都是亲自为自家的AI站台!



除了编程和数学,AI这种强大的抽象推理能力可以应用于许多科学和工程领域,如设计新药或芯片。

人工智能正在从单纯的信息处理转向真正帮助解决世界上一些最棘手的推理问题,从而造福全人类。

参考资料:

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/merettm/status/1968363783820353587

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/GoogleDeepMind/status/1968361776321323420

https://github.com/google-deepmind/gemini_icpc2025

https://arstechnica.com/google/2025/09/google-gemini-earns-gold-medal-in-icpc-world-finals-coding-competition/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

“治港败类”曾荫权:治理香港7年,为何却在卸任后,获刑20个月

普览
2025-09-15 22:35:52
于朦胧好友聊天记录曝光!多次强调:能不喝就别喝,有事记得叫我

于朦胧好友聊天记录曝光!多次强调:能不喝就别喝,有事记得叫我

柠檬有娱乐
2025-09-16 11:00:34
22人冲突+主帅飙血!国安轮换10人战平越南球队:对方门将2次失误

22人冲突+主帅飙血!国安轮换10人战平越南球队:对方门将2次失误

风过乡
2025-09-18 22:32:23
43岁凯特穿黑衣好瘦,左手无名指上戴了5枚戒指,每一枚都有来头

43岁凯特穿黑衣好瘦,左手无名指上戴了5枚戒指,每一枚都有来头

照见古今
2025-09-18 19:10:07
《灼灼韶华》直到周燕举报韶华杀了陈二顺,才知程辉是她最大福星

《灼灼韶华》直到周燕举报韶华杀了陈二顺,才知程辉是她最大福星

手工制作阿歼
2025-09-18 14:07:55
国安轰亚冠2处子球!破亚冠主场6年球荒,池忠国建功,门将黄油手

国安轰亚冠2处子球!破亚冠主场6年球荒,池忠国建功,门将黄油手

奥拜尔
2025-09-18 21:29:46
内塔尼亚胡不装了,放话要报复中国,中方的回应,给美以提了个醒

内塔尼亚胡不装了,放话要报复中国,中方的回应,给美以提了个醒

天气观察站
2025-09-18 16:09:02
40个“一读就错”的成语,看到第一个我竟不敢说话了

40个“一读就错”的成语,看到第一个我竟不敢说话了

古典文学和诗词
2025-09-08 16:20:49
妈妈亲手缝的耐克书包火了,妈妈没钱买偷偷缝了个“假货”,耐克官方亲自送大礼!

妈妈亲手缝的耐克书包火了,妈妈没钱买偷偷缝了个“假货”,耐克官方亲自送大礼!

吃货的分享
2025-09-17 05:54:01
特朗普万万没想到,中方这次动了真格,对美下达一道“封杀令”?

特朗普万万没想到,中方这次动了真格,对美下达一道“封杀令”?

董董历史烩
2025-09-18 19:41:49
4-0!3-1!欧冠狂欢夜:利物浦绝杀马竞 拜仁掀翻切尔西 巴黎狂胜

4-0!3-1!欧冠狂欢夜:利物浦绝杀马竞 拜仁掀翻切尔西 巴黎狂胜

侃球熊弟
2025-09-18 03:48:16
中国股市:最好的休息,不是空仓,而是一生专注“只做一只股票”

中国股市:最好的休息,不是空仓,而是一生专注“只做一只股票”

一方聊市
2025-09-16 13:43:11
甚至鞋都没穿好!另一个角度看看战神刘玉栋活动随意的三分十连中

甚至鞋都没穿好!另一个角度看看战神刘玉栋活动随意的三分十连中

直播吧
2025-09-18 13:08:20
调岗不足3个月,温州一干部消失!

调岗不足3个月,温州一干部消失!

温百君
2025-09-18 20:37:50
“本店无预制菜,现点现做”,知名餐厅撤下现做招牌

“本店无预制菜,现点现做”,知名餐厅撤下现做招牌

大象新闻
2025-09-17 22:33:01
北京通惠河发现一男尸!

北京通惠河发现一男尸!

美丽大北京
2025-09-18 15:18:17
乾隆灭掉准噶尔,屠尽男丁灭族,对当时的世界造成了极大的震撼?

乾隆灭掉准噶尔,屠尽男丁灭族,对当时的世界造成了极大的震撼?

铭记历史呀
2025-09-17 17:52:21
华裔富豪包养68名情妇,欲娶外甥女为妻,被自己姐夫剁成108块

华裔富豪包养68名情妇,欲娶外甥女为妻,被自己姐夫剁成108块

历史八卦社
2023-11-25 07:05:03
同学聚会每人收费3万,我转身就走,次日警察找上门:就你幸存了

同学聚会每人收费3万,我转身就走,次日警察找上门:就你幸存了

牛魔王与芭蕉扇
2025-09-01 16:53:51
DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据

DeepSeek首次回应蒸馏OpenAI质疑 :没有故意加入合成数据

快科技
2025-09-18 21:44:08
2025-09-18 23:15:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
13472文章数 66157关注度
往期回顾 全部

科技要闻

英伟达50亿美元投资英特尔,但代工免谈

头条要闻

重庆一家七口误食蘑菇中毒 60岁老人住进ICU

头条要闻

重庆一家七口误食蘑菇中毒 60岁老人住进ICU

体育要闻

身高170的他,让196的博尔特坐不住了

娱乐要闻

最美央视才女,甩掉孙红雷嫁给张嘉益

财经要闻

起底多校“发臭午餐”供应商绿捷

汽车要闻

女神代言/新增配色/智能升级 26款腾势N9售38.98万起

态度原创

时尚
旅游
健康
公开课
军事航空

菜可以预制,信任不可以预支

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

内分泌科专家破解身高八大谣言

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

哈马斯高层在多哈遇袭后首次现身

无障碍浏览 进入关怀版