网易首页 > 网易号 > 正文 申请入驻

谷歌与OpenAI同获ICPC 2025金牌!GPT-5满分夺冠,Gemini攻破人类队伍都没解出的难题

0
分享至


整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

在过去几十年里,国际大学生程序设计竞赛(ICPC)一直被视为计算机程序设计领域的“奥林匹克”。然而今年,赛场上的风头却被两位“非人类”选手抢走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。

GPT-5 和 Gemini 2.5 Deep Think 作为参赛模型,受 ICPC 官方规则与组织监督,参与了与人类选手相同的解题环节。虽然它们并非与学生团队直接同场竞技,却交出了惊艳答卷:

● GPT-5 拿下满分,12 道题全解,相当于“金牌”水准。

● Gemini 2.5 Deep Think 在 677 分钟内解出 12 题中的 10 题,也达到金牌级别。根据谷歌的说法,这样的成绩放在人类排名里将是全球第二。

要知道,本届 ICPC 的人类金牌队伍来自圣彼得堡国立大学、东京大学、北京交通大学和清华大学。可即便是这些顶尖学府的强队,也没有任何一支做到全对(最好成绩是 11/12)。换句话说,这是 AI 第一次在这类算法竞赛中实现了“超车”。



ICPC:程序员的“林匹克

ICPC 是全球最顶尖的大学生编程赛事,自 1970 年代起,这项赛事就汇聚了全球高校最顶尖的算法天才。今年,ICPC 总决赛共有来自 103 个国家、139 所高校的战队参赛,大赛规则看似简单:

● 每支队伍由三名大学生组成;

● 5 小时内解答 12 道算法题;

● 排名取决于解题数和用时。

但背后的难度远超一般编程比赛。据悉,ICPC 的题目常涉及图论、数论、动态规划、组合优化、网络流等前沿算法。既考察编码速度,也考察数学功底与团队合作。历年来,能在 ICPC 拿到金牌的队伍,几乎都成为了全球科技公司的核心技术人才。

也正因为 ICPC 的权威与挑战性,本届 AI 的入局显得尤为标志性:这是把AI直接推上了最严苛的算法竞技场。


GPT-5 给出完美答卷Gemini 2.5解出人类没有答出的问题C

根据 OpenAI 官方披露,GPT-5 参赛时并没有针对 ICPC 做特别训练,也没有任何“外挂”工具。它像其他人类队伍一样:直接拿到同样的 PDF 赛题、通过官方判题系统提交答案、在 5 小时内完成所有解答。

结果令人瞠目:有 11 道题都是一遍过,唯一的难题在第 9 次提交时才解出,最终达成 12/12 满分——要知道,今年人类最强队伍的成绩是 11/12,而 GPT-5 直接拿下满分,这在 ICPC 的历史上极为罕见。

基于此,OpenAI 也在 X 平台分享了 GPT-5 的成绩:

“我们在 ICPC 的 AI 赛道正式参赛,同样是 5 小时解 12 道题,答案由 ICPC 评测系统实时判定。结果显示,12 道题中有 11 道题一次提交就通过,最难的一题则是在第 9 次提交时才解出。最终,GPT-5 完成了全部 12 道题,而最好的人类队伍只解出 11 道。”

与此同时,Google 也公布了 Gemini 2.5 Deep Think 的比赛细节:45 分钟内解出 8 题;3 小时内解出 10 题;更令人震惊的是,Gemini 在比赛前半小时内,就成功解决了问题 C——一道没有任何大学队伍解出的难题。


据悉,这道题目要求:在由多个水库和管道组成的复杂网络中,找到一种管道开关配置,使所有水库在最短时间内被注满。每条管道可以开、关或部分开启,组合几乎无限,导致搜索最优解极其困难。

面对这道题,Gemini 2.5 Deep Think 的解题思路堪称“巧妙”:

1、先为每个水库设定一个“优先级值”,表示它相对于其他水库应被分配的程度;

2、在给定优先级值后,通过动态规划找到最优管道配置;

3、进一步应用极小化极大定理,将问题转化为寻找“最受约束”的优先级组合;

4、最后在凸优化空间中,利用嵌套三分搜索快速收敛到最优解。

这一思路并非赛题官方题解的“标准做法”,而是模型自己推演出的路径。换句话说,Gemini 在赛场上展示了超越记忆的原创性算法思维。为此Google 也在博客中强调,这不仅是一次正确解答,更是一次“创造性突破”。


为什么这次意义非凡?

其实,大模型在各种考试、基准测试中的高分表现早已不是新闻:

● ChatGPT、Gemini 等 LLM 在 SAT、律师资格考试、托福等人类考试中屡屡高分;

● 今年7月,Gemini在国际数学奥林匹克(IMO) 拿到金牌;

● 在各种 NLP、逻辑推理 benchmark 上,LLM 也早已“刷榜”。

但这些成绩往往被质疑为“靠记忆训练数据”或“靠海量算力暴力搜索”。而 ICPC 这种现场算法竞赛不同:首先题目新颖,几乎不可能出现在训练语料中;其次需要综合运用数学建模、推理和代码实现;最为重要的是,必须在有限时间内找到解法,而不是离线慢慢思考。

此次GPT-5 与 Gemini 2.5 Deep Think在ICPC中的表现,证明了它们已经具备临场推理、抽象建模、创造性解题的能力,这比在标准化考试中得高分更能说明问题。为此在社交媒体上,许多 AI 工程师感叹:“过去我们担心 AI 只是会背题库;现在它在现场比赛里击败人类冠军。这感觉像是见证了‘人机智力平权’的时刻。”

这不是终点,而是一个开始。接下来,AI 是否会把这种能力扩展到更复杂的现实问题中还有待考验,但可以确定的是:如今,AI 不再只是“会写代码的助手”,而是真正具备了与人类智力正面对抗的实力。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
俄罗斯和哈马斯都玩脱了

俄罗斯和哈马斯都玩脱了

海子侃生活
2025-09-17 10:10:09
白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

白天陪玩晚上陪睡?明码标价8000一次!高端伴游沦为色情交易温床

阿纂看事
2025-08-29 15:46:57
1966年,距今千年的六祖慧能肉身被剖,五脏六腑被扔,游街示众

1966年,距今千年的六祖慧能肉身被剖,五脏六腑被扔,游街示众

牛牛叨史
2025-09-11 22:06:15
吓死!事发昆明一小区,夫妻二人旅游回家,一开门就看到客厅爬满蛇

吓死!事发昆明一小区,夫妻二人旅游回家,一开门就看到客厅爬满蛇

生活魔术专家
2025-09-18 10:20:37
同志加兄弟:京族三岛归中国,白龙尾岛归越南,谁获利更大?

同志加兄弟:京族三岛归中国,白龙尾岛归越南,谁获利更大?

牛马搞笑
2025-09-11 05:39:28
通过这12个细节,网友们对人口问题有个基本的预估了

通过这12个细节,网友们对人口问题有个基本的预估了

清晖有墨
2025-09-17 16:59:17
世界、美国历史将证明查理•柯克的伟大

世界、美国历史将证明查理•柯克的伟大

大国老记
2025-09-19 13:02:28
重大发现!安徽新探明7.6亿吨煤炭资源

重大发现!安徽新探明7.6亿吨煤炭资源

安徽发布
2025-09-19 14:30:54
马雷斯卡:我爸当了50年渔民,每天凌晨2点-10点工作,这才是艰难

马雷斯卡:我爸当了50年渔民,每天凌晨2点-10点工作,这才是艰难

直播吧
2025-09-19 19:55:06
茅台批发价大面积“跳水” ! 零售价已低至1700元/瓶

茅台批发价大面积“跳水” ! 零售价已低至1700元/瓶

投资快报
2025-09-19 16:23:28
中超争议判罚!河南2球失而复得,VAR介入,媒体人:边裁载入史册

中超争议判罚!河南2球失而复得,VAR介入,媒体人:边裁载入史册

奥拜尔
2025-09-19 20:22:19
超强秋台风将生成!中到大雨,影响江苏!

超强秋台风将生成!中到大雨,影响江苏!

江南晚报
2025-09-19 02:00:53
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
回顾:一等功臣祁发宝,荣升副司令首次出镜,六排勋表属实罕见

回顾:一等功臣祁发宝,荣升副司令首次出镜,六排勋表属实罕见

健身狂人
2025-09-18 14:03:13
直击长春航空展:“红鹰”飞行表演队空中“比心”

直击长春航空展:“红鹰”飞行表演队空中“比心”

新京报
2025-09-19 21:25:04
蒯曼妹妹满分作文竟是写“姐姐输给了孙颖莎”,老师的评语很感人

蒯曼妹妹满分作文竟是写“姐姐输给了孙颖莎”,老师的评语很感人

十点街球体育
2025-09-19 21:58:28
关于人口数据这事,网友们提供了一系列的细节

关于人口数据这事,网友们提供了一系列的细节

清晖有墨
2025-09-02 12:21:41
美联储降息后,真正凶险的考验来了!中国必须稳住!

美联储降息后,真正凶险的考验来了!中国必须稳住!

李荣茂
2025-09-19 19:03:50
章若楠脚丫白白嫩嫩

章若楠脚丫白白嫩嫩

小椰的奶奶
2025-09-19 10:55:56
图书馆事件迎来大结局!杨景媛放已忏悔,她可能会放弃二审

图书馆事件迎来大结局!杨景媛放已忏悔,她可能会放弃二审

平老师666
2025-09-19 12:21:17
2025-09-19 23:16:49
AI科技大本营 incentive-icons
AI科技大本营
连接AI技术的创造者和使用者
2583文章数 7628关注度
往期回顾 全部

科技要闻

直击iPhone 17开售:消费者偏爱银色橙色

头条要闻

女教师在闺蜜群聊"八卦"被认定诽谤遭行拘 当事人发声

头条要闻

女教师在闺蜜群聊"八卦"被认定诽谤遭行拘 当事人发声

体育要闻

从轮椅到铜牌 他熬了7年:下个目标唱国歌!

娱乐要闻

全智贤被全面抵制!相关代言评论区沦陷

财经要闻

684亿大牛股,把孕妇逼到胎停?

汽车要闻

对话周光:一个技术理想主义者的“蜕变”

态度原创

房产
亲子
家居
游戏
军事航空

房产要闻

全民撑广州,不止于赛场!与“有态度”者共筑城市骄傲

亲子要闻

怀孕还不到100斤!方媛的惊人孕期状态

家居要闻

公共艺术 限时体验打造

《战地6》可允许自由安装战役或多人 还有究极画质

军事要闻

卫星图像显示以军坦克集结加沙城周围

无障碍浏览 进入关怀版