网易首页 > 网易号 > 正文 申请入驻

AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”

0
分享至

智通财经APP获悉,Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一场全球数学竞赛中荣获金牌,而微软(MSFT.US)支持的OpenAI 也宣称,其实验性推理模型取得了金牌级别的成绩。

谷歌称,Gemini Deep Think的先进版本完美解答了国际数学奥林匹克竞赛(International Mathematical Olympiad,简称IMO)六道题目中的五道,总得分35分,达到了金牌级别的表现。

DeepMind的唐·卢昂(Thang Luong)和爱德华·洛克哈特(Edward Lockhart)在一篇博客文章中写道:“今年,我们先进的Gemini模型以自然语言进行端到端运算,直接根据官方题目描述给出严谨的数学证明,而且这一切都在4.5小时的竞赛时限内完成。”

去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌成绩,解答出六道题目中的四道,得分28分。

国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)表示:“我们可以确认,谷歌DeepMind 达到了众人期待已久的里程碑,在满分42分中获得了35分,这是金牌成绩。他们的解题方法在很多方面都令人惊叹。国际数学奥林匹克竞赛的评委们认为,这些解答清晰、准确,而且大部分都易于理解。”

谷歌指出,在向Google AI Ultra的订阅用户推出该模型之前,会先将这个Deep Think模型的一个版本提供给包括数学家在内的一批受信任的测试人员。

与此同时,OpenAI也宣称其实验模型达到了金牌水平。

OpenAI研究员亚历山大·魏(Alexander Wei)在社交媒体平台X上发布的一系列帖子中称:“我很高兴地宣布,我们最新的@OpenAI实验性推理大语言模型(LLM)攻克了人工智能领域一个长期存在的重大挑战:在全球最负盛名的数学竞赛——国际数学奥林匹克竞赛中取得了金牌级别的成绩。”

亚历山大·魏表示,该公司按照与人类参赛者相同的规则,用2025年国际数学奥林匹克竞赛的题目对其模型进行评估:两场考试,每场4.5小时,不能使用工具或网络,阅读官方题目陈述,并以自然语言书写证明过程。

魏称:“在我们的评估中,这个模型解答出了2025年国际数学奥林匹克竞赛六道题目中的五道。对于每一道题目,都由三位曾获得国际数学奥林匹克竞赛奖牌的人员独立对模型提交的证明进行打分,在达成一致意见后确定最终分数。该模型总共获得了42分中的35分,足以获得金牌!”

魏指出,这个达到国际数学奥林匹克竞赛金牌水平的大语言模型是一个实验性研究模型,该公司在未来几个月内没有计划发布具备这种数学能力水平的产品。

据了解,这些结果标志着人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越了金牌得分门槛。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
什么是“永久军衔”?为什么有的军人退役后还拥有“军衔”

什么是“永久军衔”?为什么有的军人退役后还拥有“军衔”

Ck的蜜糖
2025-09-14 13:31:32
江西48.8万彩礼后续:男子转头退婚提豪车,女子破防:要告你强奸

江西48.8万彩礼后续:男子转头退婚提豪车,女子破防:要告你强奸

鋭娱之乐
2025-09-09 22:24:54
真闹大了!中国新闻周刊怒喷武大杨景媛论文:一看就不可能通过!

真闹大了!中国新闻周刊怒喷武大杨景媛论文:一看就不可能通过!

青青子衿
2025-09-12 06:48:59
确定了!美国丢了大单

确定了!美国丢了大单

环球时报国际
2025-09-14 17:35:25
台球厅沦为风月场?988 元 “一杆进洞” 曝光!不齿勾当令人发指

台球厅沦为风月场?988 元 “一杆进洞” 曝光!不齿勾当令人发指

诗意世界
2025-08-02 11:21:29
东京田径世锦赛:中国队零奖牌,铁饼突破与竞走失利引关注。

东京田径世锦赛:中国队零奖牌,铁饼突破与竞走失利引关注。

孤独的薰草
2025-09-14 12:57:33
战满7局!孙颖莎4-3险胜队友王曼昱,加冕澳门冠军赛女单冠军

战满7局!孙颖莎4-3险胜队友王曼昱,加冕澳门冠军赛女单冠军

全景体育V
2025-09-14 19:28:48
安徽30岁女博士,怀孕后瘫痪,坚持生下儿子,丈夫却扭头就走

安徽30岁女博士,怀孕后瘫痪,坚持生下儿子,丈夫却扭头就走

马浵在解说
2025-09-14 05:42:37
贵州足球尖子生熊远香去世,仅18岁,知情人曝原因,妈妈捧骨灰盒

贵州足球尖子生熊远香去世,仅18岁,知情人曝原因,妈妈捧骨灰盒

黄大姐
2025-09-13 15:35:33
高人预测:中国超50%人口,未来将流入这几座城市,房价或反弹?

高人预测:中国超50%人口,未来将流入这几座城市,房价或反弹?

山丘楼评
2025-09-14 11:32:08
事实证明,被传卖掉上亿豪宅移民美国的王刚,已经走上另一条大道

事实证明,被传卖掉上亿豪宅移民美国的王刚,已经走上另一条大道

胡一舸北游
2025-08-05 00:01:02
上海老破小跌麻了,花木、北蔡等小区从7.1万跌到3.3万!

上海老破小跌麻了,花木、北蔡等小区从7.1万跌到3.3万!

黯泉
2025-09-14 18:29:51
孔帕尼谈切尔西:无论对手花了10亿还是1000万买人,这都无关紧要

孔帕尼谈切尔西:无论对手花了10亿还是1000万买人,这都无关紧要

直播吧
2025-09-14 11:34:06
第四轮会谈来了,特朗普通知中国,谈判加入新议题,中方订单归零

第四轮会谈来了,特朗普通知中国,谈判加入新议题,中方订单归零

呼呼历史论
2025-09-13 12:33:51
疑于朦胧带血劳力士手表曝光,和极光光手表吻合,网友提更多质疑

疑于朦胧带血劳力士手表曝光,和极光光手表吻合,网友提更多质疑

娱圈小愚
2025-09-13 11:13:38
65岁大爷退休金被人冒领半年,老头没找麻烦直接贷款,对方急眼了

65岁大爷退休金被人冒领半年,老头没找麻烦直接贷款,对方急眼了

涛哥讲堂
2025-09-08 10:36:08
大阅兵后,中国的第一个对手出现,中方这次真发火了,将全面反制

大阅兵后,中国的第一个对手出现,中方这次真发火了,将全面反制

小lu侃侃而谈
2025-09-10 19:13:12
“日本最强中国功夫”女播音员公开了自己最新的旗袍照片,引热议

“日本最强中国功夫”女播音员公开了自己最新的旗袍照片,引热议

随波荡漾的漂流瓶
2025-09-13 16:50:20
陈赫的前妻许婧不穿内衣大胆出镜,被嘲:胸部与肚子快一样平,二婚与外籍老公生活惬意

陈赫的前妻许婧不穿内衣大胆出镜,被嘲:胸部与肚子快一样平,二婚与外籍老公生活惬意

草莓解说体育
2025-09-12 02:30:32
100%清零985!湖南偏远小县城中学凭什么逆天叫板长沙四大名校

100%清零985!湖南偏远小县城中学凭什么逆天叫板长沙四大名校

解说阿洎
2025-09-14 13:19:50
2025-09-15 00:31:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1042085文章数 101166关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

王毅表态:中国是负责任大国 中方不参与、不策划战争

头条要闻

王毅表态:中国是负责任大国 中方不参与、不策划战争

体育要闻

利物浦1-0绝杀十人伯恩利 萨拉赫95分钟点射

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

健康
教育
数码
房产
游戏

内分泌科专家破解身高八大谣言

教育要闻

重磅:关于新修订职教高考考试大纲和专业技能考试标准的通知!

数码要闻

英伟达澄清:RTX 50 系列公版显卡暂时售罄,没有停产

房产要闻

「世界冠军×人居升阶」白鹅潭CLD封面,实力馥见人生新高度!

梦幻西游群雄精锐勇武决赛:神都偏爱卫冕,船坚炮利复仇德云皓子

无障碍浏览 进入关怀版