网易首页 > 网易号 > 正文 申请入驻

AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”

0
分享至

智通财经APP获悉,Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一场全球数学竞赛中荣获金牌,而微软(MSFT.US)支持的OpenAI 也宣称,其实验性推理模型取得了金牌级别的成绩。

谷歌称,Gemini Deep Think的先进版本完美解答了国际数学奥林匹克竞赛(International Mathematical Olympiad,简称IMO)六道题目中的五道,总得分35分,达到了金牌级别的表现。

DeepMind的唐·卢昂(Thang Luong)和爱德华·洛克哈特(Edward Lockhart)在一篇博客文章中写道:“今年,我们先进的Gemini模型以自然语言进行端到端运算,直接根据官方题目描述给出严谨的数学证明,而且这一切都在4.5小时的竞赛时限内完成。”

去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌成绩,解答出六道题目中的四道,得分28分。

国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)表示:“我们可以确认,谷歌DeepMind 达到了众人期待已久的里程碑,在满分42分中获得了35分,这是金牌成绩。他们的解题方法在很多方面都令人惊叹。国际数学奥林匹克竞赛的评委们认为,这些解答清晰、准确,而且大部分都易于理解。”

谷歌指出,在向Google AI Ultra的订阅用户推出该模型之前,会先将这个Deep Think模型的一个版本提供给包括数学家在内的一批受信任的测试人员。

与此同时,OpenAI也宣称其实验模型达到了金牌水平。

OpenAI研究员亚历山大·魏(Alexander Wei)在社交媒体平台X上发布的一系列帖子中称:“我很高兴地宣布,我们最新的@OpenAI实验性推理大语言模型(LLM)攻克了人工智能领域一个长期存在的重大挑战:在全球最负盛名的数学竞赛——国际数学奥林匹克竞赛中取得了金牌级别的成绩。”

亚历山大·魏表示,该公司按照与人类参赛者相同的规则,用2025年国际数学奥林匹克竞赛的题目对其模型进行评估:两场考试,每场4.5小时,不能使用工具或网络,阅读官方题目陈述,并以自然语言书写证明过程。

魏称:“在我们的评估中,这个模型解答出了2025年国际数学奥林匹克竞赛六道题目中的五道。对于每一道题目,都由三位曾获得国际数学奥林匹克竞赛奖牌的人员独立对模型提交的证明进行打分,在达成一致意见后确定最终分数。该模型总共获得了42分中的35分,足以获得金牌!”

魏指出,这个达到国际数学奥林匹克竞赛金牌水平的大语言模型是一个实验性研究模型,该公司在未来几个月内没有计划发布具备这种数学能力水平的产品。

据了解,这些结果标志着人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越了金牌得分门槛。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
清冷感溢出屏幕!这种不费力的高级美太戳人

清冷感溢出屏幕!这种不费力的高级美太戳人

云端小院
2026-06-04 10:05:26
西媒:皇马认为恩佐所在位置不缺人,优先考虑更偏组织的中场

西媒:皇马认为恩佐所在位置不缺人,优先考虑更偏组织的中场

懂球帝
2026-06-03 21:05:19
新中运试飞图曝光!核心突破藏在不起眼的八叶螺旋桨!

新中运试飞图曝光!核心突破藏在不起眼的八叶螺旋桨!

写下一文一墨
2026-06-03 19:13:21
为什么小区里翻垃圾桶的人越来越多?

为什么小区里翻垃圾桶的人越来越多?

心中的麦田
2026-06-03 19:01:56
全程苦瓜脸,说话张不开嘴,众星力推也带不动这个拖油瓶女主

全程苦瓜脸,说话张不开嘴,众星力推也带不动这个拖油瓶女主

一娱三分地
2026-06-02 16:09:59
“半杯内衣”?太太太牛了,搭吊带、大方领,巨巨巨隐身!!

“半杯内衣”?太太太牛了,搭吊带、大方领,巨巨巨隐身!!

世界音乐公号
2026-06-04 23:53:46
一旦美国关闭GPS导航,全球导弹将会变“瞎子”,只有2国能够幸免

一旦美国关闭GPS导航,全球导弹将会变“瞎子”,只有2国能够幸免

深析古今
2026-06-03 16:16:24
重磅!格雷泽家族拟出售曼联股权,红魔迎来变局

重磅!格雷泽家族拟出售曼联股权,红魔迎来变局

球事百科吖
2026-06-04 14:18:55
国民党多人要参加海峡论坛后,台陆委会妄称:蓝营这人不准参加

国民党多人要参加海峡论坛后,台陆委会妄称:蓝营这人不准参加

爱看剧的阿峰
2026-06-04 18:48:53
先军政治下的朝鲜市井 2015年平壤的赤卫军身影

先军政治下的朝鲜市井 2015年平壤的赤卫军身影

那些看得见的老照片
2026-06-03 17:00:08
四太送奚梦瑶的珠宝来头不小!价值1200万,是2010年买来收藏的

四太送奚梦瑶的珠宝来头不小!价值1200万,是2010年买来收藏的

娱乐圈圈圆
2026-06-04 15:53:25
央视《主角》收官:4人零差评,3人出圈翻红,2人被骂惨

央视《主角》收官:4人零差评,3人出圈翻红,2人被骂惨

琴琴有氧运动
2026-06-04 00:29:01
湖人选秀夜交易预案曝光:送走克内克特,换来联盟顶级3D

湖人选秀夜交易预案曝光:送走克内克特,换来联盟顶级3D

夜白侃球
2026-06-04 13:04:32
乔治娜天生容貌身材本就出众,过度医美反倒耗损了原有气质

乔治娜天生容貌身材本就出众,过度医美反倒耗损了原有气质

述家娱记
2026-05-30 06:56:13
2-0横扫世界第12!中国女网15岁新星进4强:郑钦文王欣瑜后继有人

2-0横扫世界第12!中国女网15岁新星进4强:郑钦文王欣瑜后继有人

李喜林篮球绝杀
2026-06-04 18:52:10
不黑不吹,小米汽车2026年55万的销量任务,只怕完不成了

不黑不吹,小米汽车2026年55万的销量任务,只怕完不成了

互联网.乱侃秀
2026-06-04 10:00:08
震惊!女生内裤被退货,商家回复拒绝退款,网友:没穿的为何发黄

震惊!女生内裤被退货,商家回复拒绝退款,网友:没穿的为何发黄

火山詩话
2026-06-03 12:07:04
60岁才醒悟:为什么当年那些呼风唤雨的老领导,退休后连个饭局都组不起来?

60岁才醒悟:为什么当年那些呼风唤雨的老领导,退休后连个饭局都组不起来?

心理观察局
2026-05-22 07:51:06
“人间异类”陈瑾:20年不吃米饭,跟哥哥相约一生不婚不育

“人间异类”陈瑾:20年不吃米饭,跟哥哥相约一生不婚不育

观察者小海风
2026-06-02 13:43:18
粉丝花35000邀日本F级女优入境“圆梦”,当场被抓吓哭,惨遭驱逐

粉丝花35000邀日本F级女优入境“圆梦”,当场被抓吓哭,惨遭驱逐

冷紫葉
2026-06-04 15:45:40
2026-06-05 00:39:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1132897文章数 101298关注度
往期回顾 全部

科技要闻

历史最大IPO!马斯克下周冲击万亿富豪

头条要闻

挪威发现满载中国瓷器的沉船:曾被撞击 瓷器保存完好

头条要闻

挪威发现满载中国瓷器的沉船:曾被撞击 瓷器保存完好

体育要闻

欧冠决赛躺赢?他也曾是大巴黎的英雄

娱乐要闻

难怪奚梦瑶能嫁入豪门

财经要闻

AI公司的顶部在哪?

汽车要闻

北京现代5月销量强势反弹:国内17065辆 出口环比翻倍

态度原创

数码
游戏
房产
艺术
公开课

数码要闻

九州风神上架冰立方AK700VC单塔风冷散热器,449元

《艾尔登法环》新DLC来了!全新装备、全新身份

房产要闻

震撼!海口顶豪“素颜出境”,直接顶穿品质天花板!

艺术要闻

“海洋漩涡”:用太平洋上的垃圾,造市政建筑!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版