网易首页 > 网易号 > 正文 申请入驻

AI首夺数学奥赛金牌!谷歌Gemini闪耀IMO赛场 OpenAI同步“摘金”

0
分享至

智通财经APP获悉,Alphabet(GOOGL.US)旗下谷歌表示,其人工智能模型在一场全球数学竞赛中荣获金牌,而微软(MSFT.US)支持的OpenAI 也宣称,其实验性推理模型取得了金牌级别的成绩。

谷歌称,Gemini Deep Think的先进版本完美解答了国际数学奥林匹克竞赛(International Mathematical Olympiad,简称IMO)六道题目中的五道,总得分35分,达到了金牌级别的表现。

DeepMind的唐·卢昂(Thang Luong)和爱德华·洛克哈特(Edward Lockhart)在一篇博客文章中写道:“今年,我们先进的Gemini模型以自然语言进行端到端运算,直接根据官方题目描述给出严谨的数学证明,而且这一切都在4.5小时的竞赛时限内完成。”

去年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合系统取得了银牌成绩,解答出六道题目中的四道,得分28分。

国际数学奥林匹克竞赛主席格雷戈尔·多利纳尔教授(Prof. Dr. Gregor Dolinar)表示:“我们可以确认,谷歌DeepMind 达到了众人期待已久的里程碑,在满分42分中获得了35分,这是金牌成绩。他们的解题方法在很多方面都令人惊叹。国际数学奥林匹克竞赛的评委们认为,这些解答清晰、准确,而且大部分都易于理解。”

谷歌指出,在向Google AI Ultra的订阅用户推出该模型之前,会先将这个Deep Think模型的一个版本提供给包括数学家在内的一批受信任的测试人员。

与此同时,OpenAI也宣称其实验模型达到了金牌水平。

OpenAI研究员亚历山大·魏(Alexander Wei)在社交媒体平台X上发布的一系列帖子中称:“我很高兴地宣布,我们最新的@OpenAI实验性推理大语言模型(LLM)攻克了人工智能领域一个长期存在的重大挑战:在全球最负盛名的数学竞赛——国际数学奥林匹克竞赛中取得了金牌级别的成绩。”

亚历山大·魏表示,该公司按照与人类参赛者相同的规则,用2025年国际数学奥林匹克竞赛的题目对其模型进行评估:两场考试,每场4.5小时,不能使用工具或网络,阅读官方题目陈述,并以自然语言书写证明过程。

魏称:“在我们的评估中,这个模型解答出了2025年国际数学奥林匹克竞赛六道题目中的五道。对于每一道题目,都由三位曾获得国际数学奥林匹克竞赛奖牌的人员独立对模型提交的证明进行打分,在达成一致意见后确定最终分数。该模型总共获得了42分中的35分,足以获得金牌!”

魏指出,这个达到国际数学奥林匹克竞赛金牌水平的大语言模型是一个实验性研究模型,该公司在未来几个月内没有计划发布具备这种数学能力水平的产品。

据了解,这些结果标志着人工智能系统首次在面向高中生的国际数学奥林匹克竞赛中跨越了金牌得分门槛。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

陪读妈妈半夜录视频引发争议,清凉装扮引发热议。

特约前排观众
2026-01-29 00:15:03
触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

触球比门将还少!阿森纳巨星全场仅 4 次传球,阿尔特塔该醒醒了

澜归序
2026-02-01 07:18:56
伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

伊朗最高领袖顾问:已掌握敌方作战计划 将适时发动打击

环球网资讯
2026-01-31 05:44:17
“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

“毛孩子”也要过春节!宠物春节上门喂养爆单 专属年夜饭一份上百元

看看新闻Knews
2026-02-01 11:56:43
德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

德日急眼了:我们垄断全球半个世纪,如今却被山西4万铁匠干翻

蜉蝣说
2026-01-30 11:00:49
四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

四国演练击沉中国军舰,中方轻飘飘回了句英文,伤害不大侮辱性强

墨兰史书
2026-01-30 17:25:04
三大运营商宣布调整电信服务增值税税率,由6%调至9%

三大运营商宣布调整电信服务增值税税率,由6%调至9%

IT之家
2026-02-01 17:56:09
吴君如很早就说过了,陈妍希私下就是这样穿

吴君如很早就说过了,陈妍希私下就是这样穿

八星人
2026-01-21 15:14:26
一块H200芯片,为何炸翻了整个汽车圈?

一块H200芯片,为何炸翻了整个汽车圈?

智驾在线
2026-01-30 20:48:37
北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

北京阿姨通透,把十几年来买的金条全卖了,称:涨了不卖留着干啥

我心纵横天地间
2026-02-01 13:18:57
某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

某鱼惊现“天价笔”:800元一支的中性笔,藏着多少肮脏暗语?

戗词夺理
2026-01-24 16:05:41
内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

内维尔:弗兰克简化了比赛;这支曼城没冠军脊梁,顶不住猛攻

懂球帝
2026-02-02 07:54:10
央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

央视春晚第三次联排!近十年最强阵容,网友:今年春晚总算有救了

杨仔述
2026-01-31 18:16:31
筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

筹码集中!最新股东户数环比减少10%以上的公司一览(2026.02.1)

A股数据表
2026-02-01 17:35:03
就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

就在刚刚!中方强硬发声:90天内不支付358亿赔偿金

爱吃醋的猫咪
2026-02-01 19:34:35
难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

难堪大用!曼联半亿水货沦为天坑 夏窗面临被清洗

球事百科吖
2026-02-02 05:36:58
很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

很多人以为殉葬就是把活人关进地宫,门一关,他们只能哭喊着等死

忠于法纪
2026-01-18 17:42:24
抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

抗战时,一个军阀手握20万重兵,却始终没动一兵一卒,这人是谁?

卿昀
2025-01-25 21:22:58
媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

媒体人传来消息!王钰栋加盟欧洲豪门悬念揭晓 徐彬外租下家曝光

侃球熊弟
2026-02-01 00:06:51
国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

国台办果然没看错,郑丽文真面目被彻底揭露!小算盘到此为止了

比利
2026-01-23 12:41:53
2026-02-02 08:15:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1089819文章数 101247关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

头条要闻

30岁男子如厕时猝死 妻子回忆事发前5天丈夫疼痛细节

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

黄仁勋台北"夜宴":汇聚近40位台企高管

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

时尚
旅游
家居
手机
本地

“多巴胺风”又又又火了!这样穿时髦又减龄

旅游要闻

搭直升机15分钟 尽览罗湖盐田风情

家居要闻

蓝调空舍 自由与个性

手机要闻

首发2nm芯片 三星S26系列还会是安卓机皇吗?

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

无障碍浏览 进入关怀版