网易首页 > 网易号 > 正文 申请入驻

「AI重大飞跃」OpenAI官宣:内部实验模型在IMO 2025中取得金牌,GPT-5即将发布

0
分享至

刚刚,OpenAI研究员Alexander Wei通过社交媒体宣布了一项人工智能领域的历史性突破:其团队开发的最新实验性内部推理模型,在全球最负盛名的数学竞赛——国际数学奥林匹克(IMO2025)中,取得了相当于人类金牌选手的惊人成绩

与此同时,他还在帖子中透露:备受全球关注的GPT-5即将发布

夺金过程

为了验证这个内部实验模型的真实能力,OpenAI完全按照人类选手的竞赛规则对AI进行了评估。模型在模拟的2025年IMO竞赛中,于两个4.5小时的时段内,不借助任何外部工具或互联网,仅凭阅读官方问题,便以自然语言完成了复杂的证明过程

最终,该模型成功解决了6个问题中的5个,总分高达35/42,这一分数足以在人类竞赛中斩获金牌

Alexander Wei指出,这一成就意义非凡,因为它不仅要求AI具备前所未有的、长达100分钟的持续创造性思维,还攻克了传统强化学习难以处理的、逻辑严密但难以量化奖励的复杂证明任务。这代表着AI在通用推理能力上的巨大飞跃,给大家一个直观难度对比:人类和AI所面对的难度分别为GSM8K(约0.1分钟)、MATH基准测试(约1分钟)、美国数学邀请赛AIME(约10分钟),而IMO则达到约100分钟

更令人兴奋的是,这一进步并非依赖于针对单一任务的特定技术,而是通过通用强化学习方法与更大规模的计算资源相结合实现的。这意味着此类方法具有广泛的潜在应用空间,不局限于数学推理

如果你想看的话,这里有该模型对2025年IMO题目的解答!该模型解决了P1到P5的问题;但P6的问题它没有给出答案

https://github.com/aw31/openai-imo-2025-proofs/

GPT-5即将发布

在宣布这项数学领域的突破之余,Alexander Wei在帖子中明确提到:“顺便说一句,我们很快就要发布GPT-5了,我们很期待大家来尝试它。

不过,他紧接着做出了重要澄清:此次在IMO竞赛中取得惊人成就的“数学金牌模型”是一个独立的实验性研究项目。OpenAI在未来几个月内,并不计划发布具有如此顶尖数学能力的模型。

这意味着,即将到来的GPT-5虽然令人期待,但其能力表现将与这个专攻高难度数学推理的“天才模型”有所区别

AI发展速度远超想象

Alexander Wei还分享道,AI的发展速度已远超专家预期。他回忆说,在2021年,他曾预测到2025年AI在MATH基准测试上能达到30%的准确率就已非常乐观。然而现实是,AI不仅远超该目标,甚至提前摘下了IMO金牌。

这一系列成就不仅是OpenAI团队的胜利,也预示着通用人工智能正以前所未有的速度向我们走来

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同为华裔奥运冠军,我为何偏爱刘美贤?

同为华裔奥运冠军,我为何偏爱刘美贤?

涛哥锐评
2026-02-22 11:11:49
国家有难时,请交出你的黄金和美元

国家有难时,请交出你的黄金和美元

霹雳炮
2026-02-22 13:25:28
三亚至深圳最高票价达14460元

三亚至深圳最高票价达14460元

第一财经资讯
2026-02-22 12:34:38
一年开不到1万公里真别乱保养!照着这个来,车不坏还省钱

一年开不到1万公里真别乱保养!照着这个来,车不坏还省钱

沙雕小琳琳
2026-02-21 20:51:55
两女生扶老人遭索赔22万,原告方撤诉!完整监控视频公布,交警为何定次责?律师释疑

两女生扶老人遭索赔22万,原告方撤诉!完整监控视频公布,交警为何定次责?律师释疑

怀化新闻网
2026-02-22 15:46:14
香港身份烂尾潮已来!12万内地中产,正在被精准收割

香港身份烂尾潮已来!12万内地中产,正在被精准收割

社会日日鲜
2026-02-22 04:38:12
高速春节堵车一老板原地卖甘蔗,目击者发声:10元一根,不称重,选好就走

高速春节堵车一老板原地卖甘蔗,目击者发声:10元一根,不称重,选好就走

环球网资讯
2026-02-22 12:21:07
16GB+1TB!新机官宣:3月1日,即将发布上市!

16GB+1TB!新机官宣:3月1日,即将发布上市!

科技堡垒
2026-02-22 12:01:35
《镖人》海外口碑爆了,评分接近满分,全球票房将破纪录

《镖人》海外口碑爆了,评分接近满分,全球票房将破纪录

影视高原说
2026-02-22 09:52:32
五台山突发大火:持续8小时,瘆人画面流出,官方回应伤亡情况

五台山突发大火:持续8小时,瘆人画面流出,官方回应伤亡情况

博士观察
2026-02-22 13:00:18
五角大楼到底为什么没有食堂?

五角大楼到底为什么没有食堂?

黑噪音
2026-02-21 21:53:11
五台山景区突发大火:骇人画面流出,伤亡情况披露,大量隐情披露

五台山景区突发大火:骇人画面流出,伤亡情况披露,大量隐情披露

博士观察
2026-02-22 12:57:17
最后夺金点!谷爱凌决赛时间确定 极端情况下或取消 中国无缘金牌

最后夺金点!谷爱凌决赛时间确定 极端情况下或取消 中国无缘金牌

念洲
2026-02-22 08:42:17
都在质疑是不是演的?看完小乩童下轿这30秒,评论区彻底安静了

都在质疑是不是演的?看完小乩童下轿这30秒,评论区彻底安静了

奇思妙想生活家
2026-02-22 12:38:41
那个索赔22万的老人,为啥突然撤诉?

那个索赔22万的老人,为啥突然撤诉?

浅深说
2026-02-22 11:11:35
后续!摔倒被扶反索赔22万大妈认怂撤诉 女孩母亲再发声 事恐没完

后续!摔倒被扶反索赔22万大妈认怂撤诉 女孩母亲再发声 事恐没完

离离言几许
2026-02-22 11:08:04
总领馆:贝加尔湖事故幸存者身体状况良好!当地提前回暖,温度破百年纪录;目击者:幸存男子坐在后排,在车辆入水瞬间冲出

总领馆:贝加尔湖事故幸存者身体状况良好!当地提前回暖,温度破百年纪录;目击者:幸存男子坐在后排,在车辆入水瞬间冲出

每日经济新闻
2026-02-21 20:45:08
1882年施工,2026年封顶!144年,圣家堂终于封顶!今天我们讲讲它的故事….

1882年施工,2026年封顶!144年,圣家堂终于封顶!今天我们讲讲它的故事….

英国那些事儿
2026-02-21 22:36:56
组委会确认!中国队夺第5金传来两个好消息,谷爱凌“因祸得福”

组委会确认!中国队夺第5金传来两个好消息,谷爱凌“因祸得福”

何老师呀
2026-02-22 07:35:00
美国总统特使:特朗普感到“好奇”,“伊朗为何还没有屈服”

美国总统特使:特朗普感到“好奇”,“伊朗为何还没有屈服”

环球网资讯
2026-02-22 17:32:07
2026-02-22 18:20:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1033文章数 396关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

头条要闻

7名中国游客遗体从贝加尔湖被打捞出 俄罗斯外长致哀

体育要闻

75673人见证!迈阿密0-3:梅西孙兴慜过招

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

教育
本地
时尚
手机
公开课

教育要闻

孩子“爱打游戏”?也可能是关键天赋信号

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

50岁女性过冬穿搭:有大衣和羽绒服就够了,简约从容才是优雅

手机要闻

三星Galaxy AI将升级为多代理生态系统 深度整合Perplexity AI

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版