网易首页 > 网易号 > 正文 申请入驻

OpenAI拿下IOI金牌,仅次于前五名人类选手!参赛推理模型才夺金

0
分享至

机器之心报道

编辑:杜伟

一觉醒来,OpenAI 的大模型又完成了一项壮举!

在全球顶级编程赛事之一 ——2025 年国际信息学奥林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 参赛者中排名第一

IOI 2025(即第 37 届国际信息学奥林匹克)在玻利维亚的苏克雷举行,7 月 27 日正式开幕,并已于 8 月 3 日落下了帷幕。在此次赛事中,中国队大获全胜,全员金牌夺冠。

而就在不久前,OpenAI 刚刚在 IMO(国际数学奥林匹克竞赛)2025 中拿到了金牌级别的成绩。



在比赛中,OpenAI 参加了 IOI 的在线 AI 赛道,在 330 位人类参赛者中,所用推理模型的得分只落后于 5 位人类选手,拿下了 AI 参赛者中的 No 1。

与人类选手一样,OpenAI 遵守了 5 小时答题时间和 50 次提交的限制。

同样地,OpenAI 没有使用互联网或 RAG(检索增强生成),仅能访问一个基础的终端工具。



OpenAI 使用了一组通用推理模型,并且没有针对 IOI 进行专门的训练。唯一的辅助策略是选择要提交的解答,并与 IOI API 建立连接。

相较于去年 IOI 的表现,OpenAI 今年的这一成绩实现了巨大飞跃。

去年,OpenAI 仅差一点就拿到了铜牌,并且当时依赖一个更加人工定制的测试策略。短短一年的时间,OpenAI 的成绩就从第 49 百分位跃升到第 98 百分位

过去几周,OpenAI 在 AtCoder 世界总决赛、IMO 和 IOI 上都取得非常好的成绩,展示了最新研究方法带来的巨大进步,这些让人非常兴奋。OpenAI 正努力构建更聪明、更强大的模型,未来将尽快将它们带入主流产品中。



下图为备战 IOI 2025 的团队成员以及长期推动 OpenAI 竞技编程的团队成员。



OpenAI 联合创始人、总裁 Greg Brockma 盛赞了此次 IOI 中自家模型「金牌级的表现」。



OpenAI 专注于多步推理、自博弈和多智能体 AI 的研究科学家 Noam Brown 表示,「重要的启示是:我们在 IMO 上取得金牌的模型就是最好的竞赛编程模型。」

他分享了更多的细节:在 IMO 结束后,他们对 IMO 金牌模型进行了全面评测,发现它不仅在竞赛数学方面表现最佳,在包括编程在内的许多其他领域也是最强的模型。

所以,团队决定直接使用完全相同的 IMO 金牌模型,不做任何改动,将它应用到 IOI 竞赛系统中

IOI 比赛中的辅助策略包括:先从几个不同的模型中采样解答,然后再用另一个模型结合启发式方法来筛选要提交的解答。最终获得了金牌,在所有参赛选手中排名第 6。

事实证明,在 OpenAI 采样的所有模型中,IMO 金牌模型的表现确实是最好的





对于此次 OpenAI 在 IOI 赛事中取得金牌,网友感叹到:没有专门训练就取得了这样的成绩,很了不起,这意味着通用推理能力正变得非常强大。



对于这个模型的「真身」,大家也是各种猜测。



也许正如下面这位网友所言,大家现在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 夺金推理模型的相同(或更强)技术的公开版本!看起来将会是又一次全方位的重大飞跃。



所以,OpenAI,别光顾着自夸,赶紧发布吧。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赵构活了八十岁,为何五十五岁就禅位,将皇位交给赵匡胤一脉子孙

赵构活了八十岁,为何五十五岁就禅位,将皇位交给赵匡胤一脉子孙

铭记历史呀
2026-01-13 22:20:47
情况有变,美国最新投票结果公布,特朗普公开承认,自己或将下台

情况有变,美国最新投票结果公布,特朗普公开承认,自己或将下台

博览历史
2026-01-13 08:49:29
中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

中国最牛骗子,劳改犯摇身一变成空降高官,锐意改革政绩突出

史政先锋
2026-01-05 19:53:45
不丹4位王母!4姐妹共侍一夫争风吃醋一生,大姐被老国王宠爱一辈子,却没能当太后

不丹4位王母!4姐妹共侍一夫争风吃醋一生,大姐被老国王宠爱一辈子,却没能当太后

小鱼爱鱼乐
2026-01-13 19:16:11
大家都遗传了父母什么糟糕的基因?网友分享,够我笑一年了!

大家都遗传了父母什么糟糕的基因?网友分享,够我笑一年了!

墙头草
2026-01-14 07:47:16
湖人大胜老鹰!文森特+五首齐发挥,八村垒复出,克内克特副作用

湖人大胜老鹰!文森特+五首齐发挥,八村垒复出,克内克特副作用

篮球资讯达人
2026-01-14 13:53:27
女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

女孩当小姐,一晚要提供4到5次上门服务,2015年被亲人点到不赴约

汉史趣闻
2025-11-08 09:27:32
原来她早已去世!26岁全身溃烂不治而亡,被全家8口“吸血”多年

原来她早已去世!26岁全身溃烂不治而亡,被全家8口“吸血”多年

翰林涛涛
2026-01-14 13:56:34
特朗普10天4次强硬表态!欧盟高官与德国防长紧急会谈,格陵兰岛“受保护”!专家揭秘:4种可能的夺岛手段……

特朗普10天4次强硬表态!欧盟高官与德国防长紧急会谈,格陵兰岛“受保护”!专家揭秘:4种可能的夺岛手段……

每日经济新闻
2026-01-14 07:37:10
贺娇龙:质疑和批评,能让我更清醒,如果都是赞扬声一片,我飘了怎么办?我找不到北了怎么办?

贺娇龙:质疑和批评,能让我更清醒,如果都是赞扬声一片,我飘了怎么办?我找不到北了怎么办?

新京报政事儿
2021-08-05 17:56:25
真香!王自如上手荣耀Magic8 Pro Air,评价“真不错”

真香!王自如上手荣耀Magic8 Pro Air,评价“真不错”

泡泡网
2026-01-14 13:54:08
杉杉集团上海总部降价再拍 二次起拍价18.1亿元

杉杉集团上海总部降价再拍 二次起拍价18.1亿元

观点机构
2026-01-14 03:00:15
李湘打扮精致去看跨年演唱会,被网友拍下真实样子,这次真的瘦了

李湘打扮精致去看跨年演唱会,被网友拍下真实样子,这次真的瘦了

阿废冷眼观察所
2026-01-14 00:52:25
3年才结一次果!四川果农耗费8年首次收获,如今果子市值约80万元

3年才结一次果!四川果农耗费8年首次收获,如今果子市值约80万元

万象硬核本尊
2026-01-12 16:39:58
曝莫兰特热火互有兴趣!迈阿密内部讨论:能否助其重返全明星状态

曝莫兰特热火互有兴趣!迈阿密内部讨论:能否助其重返全明星状态

罗说NBA
2026-01-14 07:24:22
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
瀚森双塔登场即被黑巴压制,库里4分勇士领先26分

瀚森双塔登场即被黑巴压制,库里4分勇士领先26分

郭揦包工头
2026-01-14 13:53:25
还剩2个名额,回归国乒执教?许昕官宣,岗位曝光,原因找到

还剩2个名额,回归国乒执教?许昕官宣,岗位曝光,原因找到

乐聊球
2026-01-14 12:53:31
高调炫富的刘嘉玲,没对章泽天说实话,奢华公寓并非长住的家

高调炫富的刘嘉玲,没对章泽天说实话,奢华公寓并非长住的家

光影新天地
2026-01-13 17:03:26
网红口子姐熬夜猝死,年仅29岁,去年得了梅毒,最后露面胖了太多

网红口子姐熬夜猝死,年仅29岁,去年得了梅毒,最后露面胖了太多

180视角
2026-01-13 10:10:53
2026-01-14 14:39:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12113文章数 142536关注度
往期回顾 全部

科技要闻

美国批准英伟达H200卖给中国,但有条件

头条要闻

牛弹琴:全世界都在静静等待 一场战争可能很快到来

头条要闻

牛弹琴:全世界都在静静等待 一场战争可能很快到来

体育要闻

牛津学霸买下儿时主队,让它成为英超黑马

娱乐要闻

何晴去世30天,许亚军终于发声

财经要闻

姚振华举报:观致汽车资产被低价拍卖

汽车要闻

曝Model Y或降到20万以内!

态度原创

手机
旅游
房产
健康
游戏

手机要闻

突发!iPhone 18 Pro要砍灵动岛?苹果这步棋赌上了未来三年的口碑

旅游要闻

达尔文市集:热闹背后的秩序之美

房产要闻

热销17亿后!天正·三亚湾壹号,被爆违建!

血常规3项异常,是身体警报!

《生灵重塑》Switch 2版试玩发布 小小梦魇团队新作

无障碍浏览 进入关怀版