网易首页 > 网易号 > 正文 申请入驻

截胡OpenAI:谷歌率先公测“数学奥赛金牌级”AI推理模型

0
分享至

IT之家 12 月 5 日消息,科技媒体 NeoWin 今天(12 月 5 日)发布博文,报道称谷歌面向 Gemini Ultra 订阅(月费 249.99 美元)用户,推出了 Gemini 3 Deep Think(深度思考)模式。

相比较标准版 Gemini 3 Pro 模型,Deep Think 模式调用了更多计算资源,并采用了全新技术架构。该功能目前已完全集成至 Gemini App 中,Google AI Ultra 订阅用户即日起可通过在提示栏中选择“Deep Think”与 Gemini 3 Pro 模型搭配使用。


谷歌官方数据显示,Deep Think 模式在处理复杂数学、科学及逻辑问题时的推理能力实现了显著飞跃。IT之家援引博文介绍,在被誉为“业内最难 AI 基准测试之一”的 Humanity’s Last Exam 中,该模式取得了 41% 的高分,确立了新的行业标杆。

同时,在 GPQA Diamond 科学知识测试中,其得分高达 93.8%;在包含代码执行的 ARC-AGI-2 严苛测试中,也拿下了 45.1% 的成绩,均展现出业内顶尖(State-of-the-art)的性能水平。


Deep Think 模式之所以能取得如此突破,核心在于运用了先进的并行推理技术(Advanced Parallel Reasoning),让模型能够同时探索多种假设路径以寻找最优解。

值得注意的是,该模型的变体此前已在国际数学奥林匹克竞赛(IMO)和国际大学生程序设计竞赛(ICPC)世界总决赛中达到了“金牌标准”。特别是在 IMO 场景下,模型需在无法访问互联网或工具的情况下,于两个 4.5 小时的考试时段内完成解题并撰写自然语言证明。

谷歌此次公测被视为对竞争对手的有力回击。OpenAI 曾在今年 7 月声称其实验性推理大模型达到了数学奥赛金牌水平,但截至目前该模型仍未向公众开放。

随着谷歌率先将达到 IMO 金牌标准的模型推向大众市场,行业普遍预测,这一举动或将迫使 OpenAI 加快同类产品的发布节奏,大模型领域的“推理能力之战”将进一步升级。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李亚鹏:欠债4.5亿却不碰一分善款,你这个笨蛋终于赢了全世界

李亚鹏:欠债4.5亿却不碰一分善款,你这个笨蛋终于赢了全世界

深度报
2026-01-22 23:21:39
“和平委员会”草草开场,特朗普讲话吞吞吐吐 | 京酿馆

“和平委员会”草草开场,特朗普讲话吞吞吐吐 | 京酿馆

新京报评论
2026-01-23 11:47:51
雷克萨斯的2025:坚守中的突破

雷克萨斯的2025:坚守中的突破

网上车市
2026-01-23 11:33:34
郭晶晶、刘涛代言品牌致歉,已被立案调查

郭晶晶、刘涛代言品牌致歉,已被立案调查

都市快报橙柿互动
2026-01-23 00:13:19
美国启动所谓“和平委员会”,匈牙利、巴基斯坦、阿根廷、印尼、蒙古等18国已签署!特朗普达沃斯讲话,却遭群嘲

美国启动所谓“和平委员会”,匈牙利、巴基斯坦、阿根廷、印尼、蒙古等18国已签署!特朗普达沃斯讲话,却遭群嘲

每日经济新闻
2026-01-23 00:41:25
女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

女子违停竖中指被撞后续!正脸曝光全网社死,司机发声,警方介入

离离言几许
2026-01-22 11:52:29
广东周日气温回升,有小雨!下周一夜间将迎新一股弱冷空气

广东周日气温回升,有小雨!下周一夜间将迎新一股弱冷空气

南方都市报
2026-01-23 13:58:09
上海警方:全市严查!已抓120余人,收缴违法烟花爆竹6500余箱

上海警方:全市严查!已抓120余人,收缴违法烟花爆竹6500余箱

环球网资讯
2026-01-23 08:55:20
哥哥回应男子强奸大嫂又刺死见义勇为者:事发后兄弟感情冷淡

哥哥回应男子强奸大嫂又刺死见义勇为者:事发后兄弟感情冷淡

南方都市报
2026-01-23 16:18:12
刘凯任白银市委书记,河南濮阳人,已在甘肃履职超14年

刘凯任白银市委书记,河南濮阳人,已在甘肃履职超14年

极目新闻
2026-01-23 14:53:57
美媒:美国看待中国的心态变了

美媒:美国看待中国的心态变了

环球时报国际
2026-01-23 00:09:22
外网网友太有才!这 P 图简直是维多利亚 “本色出演”

外网网友太有才!这 P 图简直是维多利亚 “本色出演”

述家娱记
2026-01-23 10:04:59
一夜之间!金饰1克突破1500元

一夜之间!金饰1克突破1500元

南方都市报
2026-01-23 11:02:43
活久见!网传阜阳一28岁美女相亲点7个硬菜,男子直接打包走人…

活久见!网传阜阳一28岁美女相亲点7个硬菜,男子直接打包走人…

火山诗话
2026-01-22 07:27:33
四大名著,终于有人敢说,这本,该踢出四大名著了

四大名著,终于有人敢说,这本,该踢出四大名著了

长风文史
2026-01-22 15:17:46
泸州白骨案侦破内幕,全靠两个关键人物:一个说漏嘴,一个记性好

泸州白骨案侦破内幕,全靠两个关键人物:一个说漏嘴,一个记性好

社会日日鲜
2026-01-23 08:44:02
工作室回应“潦草小马”走红:正全力投入制作,30人一天能做50个左右

工作室回应“潦草小马”走红:正全力投入制作,30人一天能做50个左右

环球网资讯
2026-01-22 08:55:15
中国人寿HR讥讽本科求职者不配有双休,公司该学历员工达7.17万人

中国人寿HR讥讽本科求职者不配有双休,公司该学历员工达7.17万人

商业透镜
2026-01-22 15:55:59
丹麦称已开始与美国合作,正参与格陵兰岛框架协议谈判

丹麦称已开始与美国合作,正参与格陵兰岛框架协议谈判

界面新闻
2026-01-23 07:06:18
4分5板,正负值-14!能被祖巴茨惨虐的中锋,居然还是个状元

4分5板,正负值-14!能被祖巴茨惨虐的中锋,居然还是个状元

弄月公子
2026-01-23 16:52:25
2026-01-23 17:08:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
326073文章数 606908关注度
往期回顾 全部

科技要闻

TikTok守住了算法"灵魂" 更握紧了"钱袋子"

头条要闻

涉发文侮辱记者 上市公司及实控人一审被判道歉并赔偿

头条要闻

涉发文侮辱记者 上市公司及实控人一审被判道歉并赔偿

体育要闻

跑个步而已,他们在燃什么?

娱乐要闻

刘大锤曝料 将王星越的“体面”撕粉碎

财经要闻

茂名首富,这次糟了

汽车要闻

主打家庭大六座 奕境首款SUV将北京车展亮相

态度原创

亲子
本地
教育
房产
军事航空

亲子要闻

孩子发音异常其他医生都说没问题 原因竟是

本地新闻

云游中国|格尔木的四季朋友圈,张张值得你点赞

教育要闻

初中必须数形结合大招

房产要闻

正式官宣!三亚又一所名校要来了!

军事要闻

美军首艘“高超导弹战舰”出海测试

无障碍浏览 进入关怀版