网易首页 > 网易号 > 正文 申请入驻

AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”

0
分享至

智通财经APP获悉,Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一场全球数学竞赛中荣获金牌,而微软(MSFT.US)支持的OpenAI 也宣称,其实验性推理模型取得了金牌级别的成绩。

谷歌称,Gemini Deep Think的先进版本完美解答了国际数学奥林匹克竞赛(International Mathematical Olympiad,简称IMO)六道题目中的五道,总得分35分,达到了金牌级别的表现。

DeepMind的唐·卢昂(Thang Luong)和爱德华·洛克哈特(Edward Lockhart)在一篇博客文章中写道:“今年,我们先进的Gemini模型以自然语言进行端到端运算,直接根据官方题目描述给出严谨的数学证明,而且这一切都在4.5小时的竞赛时限内完成。”

去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌成绩,解答出六道题目中的四道,得分28分。

国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)表示:“我们可以确认,谷歌DeepMind 达到了众人期待已久的里程碑,在满分42分中获得了35分,这是金牌成绩。他们的解题方法在很多方面都令人惊叹。国际数学奥林匹克竞赛的评委们认为,这些解答清晰、准确,而且大部分都易于理解。”

谷歌指出,在向Google AI Ultra的订阅用户推出该模型之前,会先将这个Deep Think模型的一个版本提供给包括数学家在内的一批受信任的测试人员。

与此同时,OpenAI也宣称其实验模型达到了金牌水平。

OpenAI研究员亚历山大·魏(Alexander Wei)在社交媒体平台X上发布的一系列帖子中称:“我很高兴地宣布,我们最新的@OpenAI实验性推理大语言模型(LLM)攻克了人工智能领域一个长期存在的重大挑战:在全球最负盛名的数学竞赛——国际数学奥林匹克竞赛中取得了金牌级别的成绩。”

亚历山大·魏表示,该公司按照与人类参赛者相同的规则,用2025年国际数学奥林匹克竞赛的题目对其模型进行评估:两场考试,每场4.5小时,不能使用工具或网络,阅读官方题目陈述,并以自然语言书写证明过程。

魏称:“在我们的评估中,这个模型解答出了2025年国际数学奥林匹克竞赛六道题目中的五道。对于每一道题目,都由三位曾获得国际数学奥林匹克竞赛奖牌的人员独立对模型提交的证明进行打分,在达成一致意见后确定最终分数。该模型总共获得了42分中的35分,足以获得金牌!”

魏指出,这个达到国际数学奥林匹克竞赛金牌水平的大语言模型是一个实验性研究模型,该公司在未来几个月内没有计划发布具备这种数学能力水平的产品。

据了解,这些结果标志着人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越了金牌得分门槛。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南男子在县城买下127平房子,4年后回来结婚,打开房门他愣住了

河南男子在县城买下127平房子,4年后回来结婚,打开房门他愣住了

民间精选故事汇
2025-02-01 11:20:02
20GB+1TB!华为新机曝光:搭载麒麟9030芯片+鸿蒙6.1!

20GB+1TB!华为新机曝光:搭载麒麟9030芯片+鸿蒙6.1!

科技堡垒
2026-01-31 11:42:14
四川一校花太漂亮了,身高170五官精致,美得让人移不开眼

四川一校花太漂亮了,身高170五官精致,美得让人移不开眼

阿废冷眼观察所
2026-01-29 08:24:05
爸妈!真的不要再往马桶里倒水了!

爸妈!真的不要再往马桶里倒水了!

果壳
2026-01-31 12:15:41
一级歌唱家沦落到接小商演,给某集团年会助兴,老总是她的小粉丝

一级歌唱家沦落到接小商演,给某集团年会助兴,老总是她的小粉丝

完善法
2026-01-31 14:06:21
伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

环球网资讯
2026-01-31 05:44:17
浙江一店铺老板结婚,附近整排店铺“集体歇业”参加:起初不认识,后来变成好姐妹

浙江一店铺老板结婚,附近整排店铺“集体歇业”参加:起初不认识,后来变成好姐妹

潇湘晨报
2026-01-31 15:37:35
李嘉诚亏190亿!巴拿马撕30年合同港口易主,胡锡进怒斥不能接受

李嘉诚亏190亿!巴拿马撕30年合同港口易主,胡锡进怒斥不能接受

眼光很亮
2026-02-01 17:56:18
退货误寄奔驰钥匙后续:商家回应没看到 知情人曝内幕,果然不简单

退货误寄奔驰钥匙后续:商家回应没看到 知情人曝内幕,果然不简单

宝哥精彩赛事
2026-02-01 15:17:56
为防止战争来临,中国加速建造052D,而非更先进的055大驱,为何

为防止战争来临,中国加速建造052D,而非更先进的055大驱,为何

安安说
2026-01-06 11:14:31
雷克萨斯急了!ES“偷偷摸摸”降10万,网友:你早干嘛去了?

雷克萨斯急了!ES“偷偷摸摸”降10万,网友:你早干嘛去了?

少数派报告Report
2026-02-01 07:21:08
歌手于文文演出时突然晕倒紧急送医,目前没有生命危险,仍在住院观察中

歌手于文文演出时突然晕倒紧急送医,目前没有生命危险,仍在住院观察中

都市快报橙柿互动
2026-02-02 00:12:05
爱泼斯坦案文件细节曝光:马斯克拒绝上岛邀约 班农与爱泼斯坦互发数百条短信

爱泼斯坦案文件细节曝光:马斯克拒绝上岛邀约 班农与爱泼斯坦互发数百条短信

上游新闻
2026-02-01 14:17:05
曝西米奇加盟泰山内幕:三方默契演出、双赢剧本,只有球迷当真了

曝西米奇加盟泰山内幕:三方默契演出、双赢剧本,只有球迷当真了

体坛小鹏
2026-02-01 09:36:32
乌军能否守住红军城?不能!

乌军能否守住红军城?不能!

史政先锋
2025-11-17 16:09:20
2026苏超13支球队主教练已经产生,感觉已经没有2025年的原味

2026苏超13支球队主教练已经产生,感觉已经没有2025年的原味

小鬼头体育
2026-02-01 12:53:58
皇马内讧实锤!伯纳乌真核炮轰贝林厄姆,建议主帅直接雪藏

皇马内讧实锤!伯纳乌真核炮轰贝林厄姆,建议主帅直接雪藏

澜归序
2026-02-01 05:52:07
颠沛流离!施罗德将效力生涯第11支球队,近五年已换9次东家

颠沛流离!施罗德将效力生涯第11支球队,近五年已换9次东家

林子说事
2026-02-01 12:47:27
斯塔默上海行,身边为何是这位“中文十级”的英国女星?

斯塔默上海行,身边为何是这位“中文十级”的英国女星?

都市快报橙柿互动
2026-01-31 17:54:37
“中国校园健康行动”二度被叫停:领导小组办公室等均已撤销

“中国校园健康行动”二度被叫停:领导小组办公室等均已撤销

澎湃新闻
2026-01-31 18:15:13
2026-02-02 05:12:49
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1089800文章数 101247关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

头条要闻

爱泼斯坦追逐女孩、安德鲁跪爬女子身上画面全公布

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

数码
本地
教育
健康
公开课

数码要闻

显存稀缺暴涨:三款RTX 50 GPU将占一季度总供应量75%!

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

教育要闻

鼓楼、玄武、建邺、秦淮多区教育局发布提醒!

耳石症分类型,症状大不同

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版