网易首页 > 网易号 > 正文 申请入驻

OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺金

0
分享至

机器之心报道

编辑:杜伟

一觉醒来,OpenAI 的大模型又完成了一项壮举!

在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一

IOI 2025(即第 37 届国际信息学奥林匹克)在玻利维亚的苏克雷举行,7 月 27 日正式开幕,并已于 8 月 3 日落下了帷幕。在此次赛事中,中国队大获全胜,全员金牌夺冠。

而就在不久前,OpenAI 刚刚在 IMO(国际数学奥林匹克竞赛)2025 中拿到了金牌级别的成绩。

在比赛中,OpenAI 参加了 IOI 的在线 AI 赛道,在 330 位人类参赛者中,所用推理模型的得分只落后于 5 位人类选手,拿下了 AI 参赛者中的 No 1。

与人类选手一样,OpenAI 遵守了 5 小时答题时间和 50 次提交的限制。

同样地,OpenAI 没有使用互联网或 RAG(检索增强生成),仅能访问一个基础的终端工具。

OpenAI 使用了一组通用推理模型,并且没有针对 IOI 进行专门的训练。唯一的辅助策略是选择要提交的解答,并与 IOI API 建立连接。

相较于去年 IOI 的表现,OpenAI 今年的这一成绩实现了巨大飞跃。

去年,OpenAI 仅差一点就拿到了铜牌,并且当时依赖一个更加人工定制的测试策略。短短一年的时间,OpenAI 的成绩就从第 49 百分位跃升到第 98 百分位

过去几周,OpenAI 在 AtCoder 世界总决赛、IMO 和 IOI 上都取得非常好的成绩,展示了最新研究方法带来的巨大进步,这些让人非常兴奋。OpenAI 正努力构建更聪明、更强大的模型,未来将尽快将它们带入主流产品中。

下图为备战 IOI 2025 的团队成员以及长期推动 OpenAI 竞技编程的团队成员。

OpenAI 联合创始人、总裁 Greg Brockma 盛赞了此次 IOI 中自家模型「金牌级的表现」。

OpenAI 专注于多步推理、自博弈和多智能体 AI 的研究科学家 Noam Brown 表示,「重要的启示是:我们在 IMO 上取得金牌的模型就是最好的竞赛编程模型。」

他分享了更多的细节:在 IMO 结束后,他们对 IMO 金牌模型进行了全面评测,发现它不仅在竞赛数学方面表现最佳,在包括编程在内的许多其他领域也是最强的模型。

所以,团队决定直接使用完全相同的 IMO 金牌模型,不做任何改动,将它应用到 IOI 竞赛系统中

IOI 比赛中的辅助策略包括:先从几个不同的模型中采样解答,然后再用另一个模型结合启发式方法来筛选要提交的解答。最终获得了金牌,在所有参赛选手中排名第 6。

事实证明,在 OpenAI 采样的所有模型中,IMO 金牌模型的表现确实是最好的

对于此次 OpenAI 在 IOI 赛事中取得金牌,网友感叹到:没有专门训练就取得了这样的成绩,很了不起,这意味着通用推理能力正变得非常强大。

对于这个模型的「真身」,大家也是各种猜测。

也许正如下面这位网友所言,大家现在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 夺金推理模型的相同(或更强)技术的公开版本!看起来将会是又一次全方位的重大飞跃。

所以,OpenAI,别光顾着自夸,赶紧发布吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国宇航员代表人类首次肉眼看见月球背面:六小时里他们在找什么

美国宇航员代表人类首次肉眼看见月球背面:六小时里他们在找什么

楠楠自语
2026-04-06 02:37:49
为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

为什么有个漂亮老婆还是想要分 网友讲出自身经历真是一言难尽

侃神评故事
2026-03-10 18:50:04
澳大利亚等5国外长发表联合声明:袭击联合国维和人员不可接受

澳大利亚等5国外长发表联合声明:袭击联合国维和人员不可接受

环球网资讯
2026-04-06 11:51:14
真惨!一家五口出国旅游后回不了美国,工作也没了

真惨!一家五口出国旅游后回不了美国,工作也没了

华人生活网
2026-04-05 04:12:43
突发!特朗普又变卦了!

突发!特朗普又变卦了!

财经要参
2026-04-06 17:45:47
国务院824号令:2026殡葬新规,逝者24小时内需办5事

国务院824号令:2026殡葬新规,逝者24小时内需办5事

探索新高度
2026-04-06 18:09:25
万科回应2000名员工集体维权事件

万科回应2000名员工集体维权事件

地产微资讯
2026-04-06 09:58:45
8个产油国决定自5月起将原油日产量上调20.6万桶

8个产油国决定自5月起将原油日产量上调20.6万桶

国际在线
2026-04-06 06:53:02
维尼修斯:踢拜仁这种比赛最能激发我们;进球就献给女友庆生

维尼修斯:踢拜仁这种比赛最能激发我们;进球就献给女友庆生

懂球帝
2026-04-07 00:33:08
随着西汉姆联4-6出局,英格兰足总杯4强全部出炉:2大豪门在列

随着西汉姆联4-6出局,英格兰足总杯4强全部出炉:2大豪门在列

侧身凌空斩
2026-04-06 05:12:22
崩得最彻底的专业,连985毕业生都哭诉:越努力越不幸!

崩得最彻底的专业,连985毕业生都哭诉:越努力越不幸!

黯泉
2026-04-05 20:49:28
小米汽车卖不动了

小米汽车卖不动了

新浪财经
2026-04-05 18:47:28
总部人去楼空!上千家供应商被欠4亿货款,又一明星独角兽暴雷了

总部人去楼空!上千家供应商被欠4亿货款,又一明星独角兽暴雷了

品牌观察官
2026-04-06 17:45:34
唐艺昕产后消失4年首登台,张若昀隔空为老婆打call!真夫妻好磕

唐艺昕产后消失4年首登台,张若昀隔空为老婆打call!真夫妻好磕

文刀贰
2026-04-06 18:02:12
林志玲旧照被曝光,那时候她的身材是真的好,而且没有任何修图

林志玲旧照被曝光,那时候她的身材是真的好,而且没有任何修图

乡野小珥
2026-04-04 22:03:09
沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

阿绐聊社会
2026-04-07 01:15:38
重庆真正最大的乡镇曝光,一个镇比两个主城区还大,网友:太大了

重庆真正最大的乡镇曝光,一个镇比两个主城区还大,网友:太大了

带着瓶盖儿去旅行
2026-04-06 22:48:31
一夜暴富!江苏诞生一位千万富翁,火速围观~

一夜暴富!江苏诞生一位千万富翁,火速围观~

我爱赣榆
2026-04-06 23:12:00
买一赠一也清不掉库存,中国人的牛奶喝到“天花板”了吗?

买一赠一也清不掉库存,中国人的牛奶喝到“天花板”了吗?

临云史策
2026-04-06 12:05:24
三年合约敲定!23岁中国球员正式加盟本菲卡,留洋军团再添猛将

三年合约敲定!23岁中国球员正式加盟本菲卡,留洋军团再添猛将

俯身冲顶
2026-04-06 21:19:07
2026-04-07 03:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12681文章数 142615关注度
往期回顾 全部

科技要闻

折叠屏iPhone要来了,富士康已在试产!

头条要闻

特朗普:一夜就能拿下伊朗 可能就是周二晚上

头条要闻

特朗普:一夜就能拿下伊朗 可能就是周二晚上

体育要闻

官方:中国女足球员邵子钦加盟本菲卡

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

本地
旅游
房产
数码
公开课

本地新闻

跟着歌声游安徽,听古村回响

旅游要闻

春日泛舟北小河 水岸花溪美如画

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

数码要闻

玄派玄机16 2026笔记本上架:锐龙AI Max+ 395,128GB + 2TB

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版