网易首页 > 网易号 > 正文 申请入驻

刚刚,OpenAI/Gemini共斩ICPC 2025金牌!OpenAI满分碾压横扫全场

0
分享至


新智元报道

编辑:定慧 艾伦

【新智元导读】ICPC 2025全球总决赛诞生历史性一幕:谷歌Gemini与OpenAI推理模型同时斩获金牌!Gemini在5小时内攻下12题中的10题,并在30分钟破解难倒所有人类的死亡C题;而OpenAI更是满分12/12,碾压139支人类队伍,成为赛场唯一全解团队。

真是疯狂!

刚刚,谷歌和OpenAI同时拿下ICPC金牌,尤其OpenAI还是满分!

ICPC全称国际大学生程序设计竞赛,是世界上最负盛名的编程竞赛之一!


规则是在五个小时内,求解十几个极其复杂的编程和算法难题!

最终,Gemini成功解答了12道题目中的10道,荣获金牌。


OpenAI则全部解答正确,获得满分,拿下金牌!


人类呢?

139支人类参赛队伍中,只有3支队伍取得了和Gemini 10/12一样的成绩,没有人类队伍获得满分。

其中和Gemini战平的唯一中国队伍,是北交大,我们在ICPC全球总决赛放榜的第一时刻也做了深入报道,解析了这支中国最强战队是如何炼成的。

尤其是,谷歌也特地提到,问题C所有人类队伍都没有解答出来,而谷歌Gemini在半个小时内成功求解!

OpenAI则是解决了所有问题,拿下满分!

真的是令人震撼的时刻,历史性的一夜,AI在最顶级的编程比赛中彻底的超过了人类!


Gemini解出所有参赛人类队伍

没有解决的问题C

谷歌官方账号宣布了Gemini 2.5 Deep Think的高级版本在ICPC 2025上取得了金牌级别的成绩。


据谷歌称,它并没有像今年早些时候为类似国际数学奥林匹克(IMO)那样,为ICPC创建全新训练的模型。

参加ICPC的Gemini 2.5与我们在Gemini应用中使用的模型相同。

不过,它经过了一些增强,能够在五个小时里不断思考!

在ICPC比赛中,只有正确的答案才能得分,而得出答案所需的时间会影响最终得分。

比赛开始后,Gemini迅速攀升至前几名,仅用45分钟就正确解答了8道题目。

Gemini最终答对了10道题,在大学队伍中获得了第二名。

谷歌特别地提到,在比赛中,Gemini成功解决了问题C——其他人类团队均未解决这个问题。


问题C要求找到一种解决方案,将液体通过互连的管道网络分配到一组储液器中,目标是找到一种管道配置,使液体尽快充满所有储液器。

由于每个管道可能是开放的、关闭的,甚至是部分开放的,因此可能的配置数量无穷无尽,因此寻找最佳配置非常困难。

Gemini的解决方法是假设每个储液罐都有一个优先级值,这使得模型能够使用动态规划算法找到最高效的配置。

经过30分钟的反复思考,Gemini使用嵌套三元搜索确定了正确的答案。


我们对谷歌公布的答案让Cursor进行了评价,Cursor也认为谷歌的求解方法非常完美。

其他题目谷歌已经全部公布在GitHub上,感兴趣可以挑战一下~


https://github.com/google-deepmind/gemini_icpc2025

OpenAI AK ICPC背后的秘密

Gemini已经通过解出了让人类全军覆没的超高难度的C题证明了自己的强大实力。

但是,还有高手!OpenAI的推理模型直接通关了全场12道题目,AK(All Kill,指解出全部题目) ICPC!

背后的研究团队也是连发8条推文来庆祝这一历史性时刻。



其中值得注意的是,其中11道题目,都是直接用了大家都能用的GPT-5解决的,只有最难的一道题(可能指的是难倒全部人类的题目C,可能是指最后一个问题L,也可能是其他对大模型而言更困难的问题)是用一个未公布型号的神秘实验推理模型解决的。


这个神秘实验模型,会不会就是下一代的全新推理模型呢?

最后一条推文中,几位幕后关键研究人员也纷纷被@出来亮相了。


查询身份后得知,他们都是o1及之后的这些推理模型的关键研究人员。

其中有一位,更是ICPC的2015年世界冠军队伍成员,Borys Minaiev。


他为人熟知的算法界ID是:qwerty787788


在当年的这支夺冠队伍的三人中,还有另一位更广为人知的传奇人物,那就是tourist,算法界最强王者,世界第一人!


此外,OpenAI首席科学家Jakub Pachocki也是ICPC世界金牌得主,赛后也转发了推文,对该团队的优异表现表达了热烈祝贺。


众多ICPC世界顶尖选手加盟OpenAI,是OpenAI能最终训练出AK ICPC的大模型的强大支柱。

历史性一夜

上次OpenAI抢先谷歌公布IMO结果的时候,还闹出了小小的风波。

谷歌和OpenAI都想争一争谁是第一个拿下IMO这种级别赛事的AI。

而这一次,两者同时宣布,意义非凡!

ICPC全球执行董事,BILL POUCHER博士认为:

Gemini成功加入这一领域并取得黄金级成果,标志着定义下一代所需的人工智能工具和学术标准的关键时刻。

AI在ICPC上斩获金牌对软件开发有着直接且实际的意义。

这表明人工智能可以成为程序员真正的问题解决伙伴。

不论是谷歌的CEO劈柴,还是OpenAI的首席科学家都是亲自为自家的AI站台!



除了编程和数学,AI这种强大的抽象推理能力可以应用于许多科学和工程领域,如设计新药或芯片。

人工智能正在从单纯的信息处理转向真正帮助解决世界上一些最棘手的推理问题,从而造福全人类。

参考资料:

https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/

https://x.com/merettm/status/1968363783820353587

https://x.com/MostafaRohani/status/1968360976379703569

https://x.com/GoogleDeepMind/status/1968361776321323420

https://github.com/google-deepmind/gemini_icpc2025

https://arstechnica.com/google/2025/09/google-gemini-earns-gold-medal-in-icpc-world-finals-coding-competition/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中大型SUV年度冠军之争:第一名基本能确定,年销量已突破15万台

中大型SUV年度冠军之争:第一名基本能确定,年销量已突破15万台

柳先说
2026-01-02 20:31:17
你闻过最难闻的味道是什么?网友:分手多年,依然忘不了她的味道

你闻过最难闻的味道是什么?网友:分手多年,依然忘不了她的味道

另子维爱读史
2026-01-03 21:33:36
期待!上海申花搞定1米95黑又硬射手,身价超2千万,组超豪华锋线

期待!上海申花搞定1米95黑又硬射手,身价超2千万,组超豪华锋线

国足风云
2026-01-03 12:09:19
曼联对战利兹联,依旧9人缺战,罗伊-基恩:多古狂奔能累垮对手!

曼联对战利兹联,依旧9人缺战,罗伊-基恩:多古狂奔能累垮对手!

车机极客小方
2026-01-04 07:10:05
杭州小区业主遭围堵,停水停电求助物业:自治不应违法

杭州小区业主遭围堵,停水停电求助物业:自治不应违法

特特农村生活
2026-01-03 13:15:45
1.4日早评|再创新高!卫星大消息!A股下周继续涨?

1.4日早评|再创新高!卫星大消息!A股下周继续涨?

龙行天下虎
2026-01-04 03:29:05
销量神话被打破?上汽418万硬刚比亚迪,差距惊人!

销量神话被打破?上汽418万硬刚比亚迪,差距惊人!

小怪吃美食
2026-01-04 00:16:32
赵匡胤雪夜被追杀,在破庙被乡村姑娘所救,20年后宋太祖寻至该村

赵匡胤雪夜被追杀,在破庙被乡村姑娘所救,20年后宋太祖寻至该村

卡西莫多的故事
2025-12-19 11:20:22
双向8车道,全长18.8公里,无缝对接苏锡常!沪苏重要通道今启动扩容升级

双向8车道,全长18.8公里,无缝对接苏锡常!沪苏重要通道今启动扩容升级

新民晚报
2026-01-03 17:41:58
扛不住了!又一波小区物业费降了,上海…

扛不住了!又一波小区物业费降了,上海…

新浪财经
2026-01-03 20:07:22
朋友看中一套房子,嫌贵没买,过两天中介说,房子153万卖掉了。

朋友看中一套房子,嫌贵没买,过两天中介说,房子153万卖掉了。

百态人间
2026-01-03 16:53:27
腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

腐乳再次被关注!研究发现:糖尿病患者常吃腐乳,或出现4种变化

摇感军事
2026-01-03 21:16:50
根本打不了一号位,但勇士还在继续进行着这样无意义的尝试?

根本打不了一号位,但勇士还在继续进行着这样无意义的尝试?

稻谷与小麦
2026-01-04 02:35:26
11分钟60多亿军火全被老美摧毁,这场仗,彻底让我们惊醒

11分钟60多亿军火全被老美摧毁,这场仗,彻底让我们惊醒

大国纪录
2025-09-30 23:49:04
涉毒艺人参演群星晚会,遭网友质疑后退出!

涉毒艺人参演群星晚会,遭网友质疑后退出!

新民周刊
2026-01-01 20:23:41
教育部扔下重磅炸弹:2026年开始,全国一律不准购买校外商业试卷

教育部扔下重磅炸弹:2026年开始,全国一律不准购买校外商业试卷

乐天闲聊
2026-01-03 14:31:40
8年敛财14个亿,吃一顿饭花上百万,“金融才女”朱丽丽是何下场

8年敛财14个亿,吃一顿饭花上百万,“金融才女”朱丽丽是何下场

素衣读史
2025-11-13 18:11:15
刚当教育局长,去开家长会被老师骂,我没吭声,散会后校长脸都白了

刚当教育局长,去开家长会被老师骂,我没吭声,散会后校长脸都白了

黄家湖的忧伤
2025-12-29 16:32:56
那些惯于宏大叙事的人,会聆听重庆女孩和长沙街头饿晕的人吗?

那些惯于宏大叙事的人,会聆听重庆女孩和长沙街头饿晕的人吗?

林中木白
2025-10-09 16:35:47
79岁李保田现状:定居山东衰老明显,儿子李彧长得像父亲“翻版”

79岁李保田现状:定居山东衰老明显,儿子李彧长得像父亲“翻版”

小熊侃史
2025-12-20 10:56:45
2026-01-04 08:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14245文章数 66424关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

美国突袭委内瑞拉并强掳该国总统马杜罗 中俄英法表态

头条要闻

美国突袭委内瑞拉并强掳该国总统马杜罗 中俄英法表态

体育要闻

青岛西海岸官宣:郑智出任一线队主教练

娱乐要闻

司晓迪事件再升级 司晓迪称鹿晗最好

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

数码
教育
时尚
公开课
军事航空

数码要闻

映众5060 Ti超级冰龙显卡采用8-Pin供电,预留12V-2×6焊盘

教育要闻

考试50分?3个万能理由巧妙化解!

好美啊!58岁的她开挂了

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普公布马杜罗被捕后照片

无障碍浏览 进入关怀版