网易首页 > 网易号 > 正文 申请入驻

OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺金

0
分享至

机器之心报道

编辑:杜伟

一觉醒来,OpenAI 的大模型又完成了一项壮举!

在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一

IOI 2025(即第 37 届国际信息学奥林匹克)在玻利维亚的苏克雷举行,7 月 27 日正式开幕,并已于 8 月 3 日落下了帷幕。在此次赛事中,中国队大获全胜,全员金牌夺冠。

而就在不久前,OpenAI 刚刚在 IMO(国际数学奥林匹克竞赛)2025 中拿到了金牌级别的成绩。



在比赛中,OpenAI 参加了 IOI 的在线 AI 赛道,在 330 位人类参赛者中,所用推理模型的得分只落后于 5 位人类选手,拿下了 AI 参赛者中的 No 1。

与人类选手一样,OpenAI 遵守了 5 小时答题时间和 50 次提交的限制。

同样地,OpenAI 没有使用互联网或 RAG(检索增强生成),仅能访问一个基础的终端工具。



OpenAI 使用了一组通用推理模型,并且没有针对 IOI 进行专门的训练。唯一的辅助策略是选择要提交的解答,并与 IOI API 建立连接。

相较于去年 IOI 的表现,OpenAI 今年的这一成绩实现了巨大飞跃。

去年,OpenAI 仅差一点就拿到了铜牌,并且当时依赖一个更加人工定制的测试策略。短短一年的时间,OpenAI 的成绩就从第 49 百分位跃升到第 98 百分位

过去几周,OpenAI 在 AtCoder 世界总决赛、IMO 和 IOI 上都取得非常好的成绩,展示了最新研究方法带来的巨大进步,这些让人非常兴奋。OpenAI 正努力构建更聪明、更强大的模型,未来将尽快将它们带入主流产品中。



下图为备战 IOI 2025 的团队成员以及长期推动 OpenAI 竞技编程的团队成员。



OpenAI 联合创始人、总裁 Greg Brockma 盛赞了此次 IOI 中自家模型「金牌级的表现」。



OpenAI 专注于多步推理、自博弈和多智能体 AI 的研究科学家 Noam Brown 表示,「重要的启示是:我们在 IMO 上取得金牌的模型就是最好的竞赛编程模型。」

他分享了更多的细节:在 IMO 结束后,他们对 IMO 金牌模型进行了全面评测,发现它不仅在竞赛数学方面表现最佳,在包括编程在内的许多其他领域也是最强的模型。

所以,团队决定直接使用完全相同的 IMO 金牌模型,不做任何改动,将它应用到 IOI 竞赛系统中

IOI 比赛中的辅助策略包括:先从几个不同的模型中采样解答,然后再用另一个模型结合启发式方法来筛选要提交的解答。最终获得了金牌,在所有参赛选手中排名第 6。

事实证明,在 OpenAI 采样的所有模型中,IMO 金牌模型的表现确实是最好的





对于此次 OpenAI 在 IOI 赛事中取得金牌,网友感叹到:没有专门训练就取得了这样的成绩,很了不起,这意味着通用推理能力正变得非常强大。



对于这个模型的「真身」,大家也是各种猜测。



也许正如下面这位网友所言,大家现在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 夺金推理模型的相同(或更强)技术的公开版本!看起来将会是又一次全方位的重大飞跃。



所以,OpenAI,别光顾着自夸,赶紧发布吧。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
委内瑞拉内政部长:面对暴行,委内瑞拉决不投降,将与所有人站在一起,推动国家向前发展,并争取马杜罗回归

委内瑞拉内政部长:面对暴行,委内瑞拉决不投降,将与所有人站在一起,推动国家向前发展,并争取马杜罗回归

三湘都市报
2026-01-08 11:24:05
尴尬!多哈冠军赛空空如也,索林很无奈,孙颖莎王楚钦才是人气王

尴尬!多哈冠军赛空空如也,索林很无奈,孙颖莎王楚钦才是人气王

体育就你秀
2026-01-08 06:45:03
成熟女性很适合连衣包臀裙,不老气也不会幼稚,拥有自然简单的美

成熟女性很适合连衣包臀裙,不老气也不会幼稚,拥有自然简单的美

灼灼小齐
2026-01-08 11:06:24
伊能静迪拜看房,真人又矮又胖,臀部好宽大,与精修图反差明显

伊能静迪拜看房,真人又矮又胖,臀部好宽大,与精修图反差明显

小椰的奶奶
2026-01-07 01:10:08
印度大叔:上海贫穷又落后跟孟买没法比,谁知来参观之后不想走了

印度大叔:上海贫穷又落后跟孟买没法比,谁知来参观之后不想走了

天气观察站
2026-01-07 10:21:29
程巍已任上海青浦区人大常委会党组书记

程巍已任上海青浦区人大常委会党组书记

澎湃新闻
2026-01-08 10:02:26
万里“大逃杀”!油轮火线“入籍”俄罗斯,已被美军追了18天,俄方派潜艇等海军护航!美海空军大举出动,为抓油轮还是“声东击西”?

万里“大逃杀”!油轮火线“入籍”俄罗斯,已被美军追了18天,俄方派潜艇等海军护航!美海空军大举出动,为抓油轮还是“声东击西”?

每日经济新闻
2026-01-07 13:48:18
卫冕冠军继续前进!萨巴伦卡横扫过关,晋级布里斯班站八强

卫冕冠军继续前进!萨巴伦卡横扫过关,晋级布里斯班站八强

全景体育V
2026-01-08 10:32:15
2-2!1-2!英超连爆大冷:曼联三连平,曼城又丢分!纽卡4-3绝杀

2-2!1-2!英超连爆大冷:曼联三连平,曼城又丢分!纽卡4-3绝杀

董老师看竞技
2026-01-08 10:27:22
逃离加州!加州连续6年成为人口流出最多的州,德州则是净流入最多的州

逃离加州!加州连续6年成为人口流出最多的州,德州则是净流入最多的州

大洛杉矶LA
2026-01-08 04:09:57
田朴珺与王石离婚,王思聪发声引发热议!

田朴珺与王石离婚,王思聪发声引发热议!

新冲浪青年
2026-01-05 19:23:02
79岁李保田现状:定居山东衰老明显,儿子李彧长得像父亲“翻版”

79岁李保田现状:定居山东衰老明显,儿子李彧长得像父亲“翻版”

小熊侃史
2025-12-20 10:56:45
1983年乔冠华去世,新华社只发了一句话,胡乔木拍案而起:这也太不像话了

1983年乔冠华去世,新华社只发了一句话,胡乔木拍案而起:这也太不像话了

源溯历史
2025-12-31 20:03:15
从一月份开始,国内或将迎来5大降价潮,建议大家做好准备!

从一月份开始,国内或将迎来5大降价潮,建议大家做好准备!

猫叔东山再起
2026-01-08 08:35:03
贵州药老板栽了!检察院提起公诉,医院老院长指认:他送东西了

贵州药老板栽了!检察院提起公诉,医院老院长指认:他送东西了

流年顛簸
2026-01-08 00:12:32
“特朗普这么冲着中国,当心反噬”

“特朗普这么冲着中国,当心反噬”

观察者网
2026-01-08 11:27:50
难舍亦难见,2025那些引退的大咖

难舍亦难见,2025那些引退的大咖

孤独的独角兽影视
2026-01-06 09:40:03
2026年央视春晚彩排曝光后,评论区炸锅,赵本山的担心恐要成真了

2026年央视春晚彩排曝光后,评论区炸锅,赵本山的担心恐要成真了

小小李娱
2026-01-07 17:41:55
羽绒服脏了怎么办?别送干洗店,教你正确清洁方法,能省下几百块

羽绒服脏了怎么办?别送干洗店,教你正确清洁方法,能省下几百块

家居设计师苏哥
2026-01-07 14:38:20
阿森纳女足新援因外表出众引来低俗评论,俱乐部关闭评论区

阿森纳女足新援因外表出众引来低俗评论,俱乐部关闭评论区

懂球帝
2026-01-07 12:56:05
2026-01-08 12:08:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12077文章数 142531关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

美国高官谈对委行动:主宰世界的是实力、武力与权力

头条要闻

美国高官谈对委行动:主宰世界的是实力、武力与权力

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

2026春节档将有六部电影强势上映

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

时尚
亲子
健康
旅游
军事航空

蓝色+灰色、红色+棕色,这4组配色怎么搭都好看!

亲子要闻

汉堡到底是不是垃圾食品呢?

这些新疗法,让化疗不再那么痛苦

旅游要闻

即刻出发!嘉定二日游全攻略

军事要闻

特朗普提出将美国军费提升至1.5万亿美元

无障碍浏览 进入关怀版