网易首页 > 网易号 > 正文 申请入驻

OpenAI杀疯了!内部神秘模型首次斩获信息学奥赛IOI 2025金牌,碾压98%人类选手

0
分享至

刚刚,OpenAI研究员Sheryl Hsu官宣:其内部研发的AI推理系统,在全球顶级编程竞赛——2025年国际信息学奥林匹克竞赛(IOI)中,取得了金牌

这是AI首次在该领域达到金牌水平,并且在所有AI参赛者中排名第一

在与全球330名顶尖人类选手的同场竞技中,这套AI系统的成绩超越了其中98%的选手,仅有5位人类天才的得分比它更高

纯靠推理:无网络、无RAG,与人类公平对决

Sheryl Hsu在推文中特别强调,OpenAI的AI系统是在完全模拟人类选手的环境下进行比赛的:

完全断网: 无法访问互联网,杜绝了一切开卷考试的可能性

无RAG(检索增强生成): 无法调用外部知识库,所有解题逻辑必须由模型内生生成

同等限制: 和人类选手一样,只有5小时的比赛时间和50次代码提交机会

基础工具: 只能使用一个基础的终端工具

这样保证了AI不靠海量信息检索作弊,而是像一个真正的人类选手一样,在封闭、高压的环境下,纯粹依靠自身的逻辑推理和问题解决能力来编写代码、解决复杂算法问题

通用模型,而非特长生

OpenAI透露,他们使用的是一个通用推理模型的集成系统(ensemble),并没有针对IOI竞赛进行任何专门的训练或微调

团队唯一的人工干预仅仅在于:

  1. 1. 从模型生成的多个解法中,选择最优的那个进行提交

  2. 2. 将模型与IOI的提交API进行连接

除此以外,所有的解题过程全部由AI自主完成

一年从差点青铜到稳拿金牌

Sheryl Hsu提到,去年的IOI竞赛,OpenAI也曾尝试过,但结果并不理想,最终与一枚铜牌擦肩而过,仅排在49%分位。并且,去年的方案还动用了大量手工定制的测试时策略

而仅仅一年之后,OpenAI就实现了从49%分位到98%分位的大逆转,从差点青铜一跃成为金牌王者

GPT-5塌房,下一代模型什么时候发布?

最近几周,OpenAI这个神秘的内部推理系统模型可谓是捷报频传,在多个世界顶级智力竞赛中展现了强大实力:

AtCoder世界总决赛: 取得第二名

IMO2025(国际数学奥林匹克):宣称取得金牌
IOI2025(国际信息学奥林匹克): 斩获金牌

那么这个内部推理系统是什么?下半年OpenAI还有真正的大招?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
乾隆皇帝包裹遗体的被子,拍出了1.3亿天价,为何会如此值钱?

乾隆皇帝包裹遗体的被子,拍出了1.3亿天价,为何会如此值钱?

兴趣知识
2026-05-08 00:40:30
一位教授曾深入调查:中国农村当前最严重问题,不只农民收入太低

一位教授曾深入调查:中国农村当前最严重问题,不只农民收入太低

混沌录
2026-05-13 14:56:43
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
特朗普二儿媳跟着访华挑大梁了!刚到机场就美翻,一点不输伊万卡

特朗普二儿媳跟着访华挑大梁了!刚到机场就美翻,一点不输伊万卡

热心市民小黄
2026-05-14 10:03:15
香港诡异事件“鬼母煮饭”,女尸腐烂十日,幼女却说母亲每天煮饭

香港诡异事件“鬼母煮饭”,女尸腐烂十日,幼女却说母亲每天煮饭

堇色夜行
2025-01-06 22:54:42
武汉大学终于硬气了,余思月真人曝光,她无缘继续留在OPPO公司

武汉大学终于硬气了,余思月真人曝光,她无缘继续留在OPPO公司

平老师666
2026-05-11 23:21:51
在体制内工作的好处

在体制内工作的好处

微微热评
2026-05-10 12:11:34
韩国总统李在明会见何立峰

韩国总统李在明会见何立峰

每日经济新闻
2026-05-13 17:19:38
中美两个大国说好了,霍尔木兹海峡不准收费,革命卫队能听懂吗?

中美两个大国说好了,霍尔木兹海峡不准收费,革命卫队能听懂吗?

临云史策
2026-05-14 11:24:13
上海地铁不挤了,人都走了?最新数据揭示人口结构大调整!

上海地铁不挤了,人都走了?最新数据揭示人口结构大调整!

观察眼看世界
2026-05-13 19:35:03
91岁杨尚昆晚年感慨:党内山头众多,唯有毛主席能彻底凝聚全党

91岁杨尚昆晚年感慨:党内山头众多,唯有毛主席能彻底凝聚全党

老谢谈史
2026-05-13 19:50:56
王励勤出手了!国乒3大新星获重用,世界第1组合落选,双打大变脸

王励勤出手了!国乒3大新星获重用,世界第1组合落选,双打大变脸

阿晞体育
2026-05-13 21:24:15
资本市场太疯狂:卖瓷砖的蒙娜丽莎蹭上英伟达 4天市值狂涨20亿 半导体却零营收

资本市场太疯狂:卖瓷砖的蒙娜丽莎蹭上英伟达 4天市值狂涨20亿 半导体却零营收

快科技
2026-05-14 09:36:28
汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?

汉语是牺牲了什么,才成为世界最紧凑、最高效的语言?

瓜哥的动物日记
2026-05-13 00:58:37
数据疯涨全是假象!上海二手房连破纪录,真正赚钱的只有一类人

数据疯涨全是假象!上海二手房连破纪录,真正赚钱的只有一类人

阿离家居
2026-05-14 13:53:02
参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

观察宇宙
2026-05-13 20:18:32
关紧门窗!8—9级雷暴大风,抵达湖北

关紧门窗!8—9级雷暴大风,抵达湖北

蔡甸在线
2026-05-14 12:09:34
一个三当家!生涯9年,0次全明星,为什么都说他值2.1亿顶薪

一个三当家!生涯9年,0次全明星,为什么都说他值2.1亿顶薪

球毛鬼胎
2026-05-14 12:58:21
包工头与做饭大姐相好5年,工程完工想走,谁曾想大姐竟不好惹

包工头与做饭大姐相好5年,工程完工想走,谁曾想大姐竟不好惹

磊子讲史
2025-07-02 13:45:23
欧盟承认稀土无筹码,中方谈判自信前所未有

欧盟承认稀土无筹码,中方谈判自信前所未有

魏家东
2026-05-13 13:01:10
2026-05-14 15:59:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1040文章数 396关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

头条要闻

男子称火车站走错口遭安检员追打 被认定互殴各拘5天

体育要闻

登海报!哈登30+8+6创多项纪录 第8次赢天王山

娱乐要闻

肖战提名金海燕奖,这一步走得太稳

财经要闻

习近平同美国总统特朗普会谈

汽车要闻

云辇-P Ultra降维打击!三轮也能越野?方程豹豹8/豹5闪充版30.58万起

态度原创

数码
旅游
游戏
本地
公开课

数码要闻

Keychron J5 Ultra 8K三模机械键盘预售,390元

旅游要闻

别再只去寒山寺了!太湖边这座四百多年的古寺,趁没火赶紧去

别回头,快跑!心理恐怖游戏《深巷》试玩版上线

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版