网易首页 > 网易号 > 正文 申请入驻

刚刚Gemini上新模型,全球只有7人比它会编程,谷歌姚顺宇参与

0
分享至

来源:市场资讯

(来源:机器之心)

编辑|泽南

从此以后,AI 不再是工具,要尊称为「硅基博学家」了。

北京时间周五凌晨,谷歌发布了 Gemini 3 Deep Think 的重大升级,作为专门用于复杂任务的推理模式,Deep Think 代表 AI 前沿的最强智能水平,旨在解决科学、工程领域的诸多挑战。


去年 9 月加入 Google DeepMind 的清华物理系传奇姚顺宇(Shunyu Yao)也是这次 Deep Think 新模型的参与者。


去年,谷歌展示了专门开发的 Deep Think 版本能够成功应对一些最棘手的推理挑战,并在数学和编程世界锦标赛上取得了金牌成绩。最近,Deep Think 又使专门开发的智能体能够进行研究级别的数学探索。

更新后的深度思考模式继续拓展智能的边界,在最严格的学术基准测试中取得了新的高度,其中包括:

  • 在「人类的最后考试」(一项旨在测试现代前沿模型极限的基准测试)中,该模型取得了新的 SOTA(48.4%,不使用任何工具)。

  • 在 ARC-AGI-2 测试中取得了前所未有的 84.6% 的成绩,并经 ARC Prize 基金会验证。

  • 在 Codeforces 上取得了惊人的 3455 Elo 分数,Codeforces 是一个包含各种竞技编程挑战的基准测试平台。

  • 在 2025 年国际数学奥林匹克竞赛中取得金牌水平。


新版 Gemini 3 Deep Think 在 ARC-AGI-1 上的成绩是 96.0%,每任务花费 7.17 美元;在 ARC-AGI-2 上已经达到了 84.6% 的分数,每任务成本为 13.62 美元。


大约 14 个月前,OpenAI 模型 o3-preview 的「高计算」版本在 ARC-AGI-1 测试中达到了约 88% 的分数,每个任务的成本约为 2000 至 3000 美元。而 Gemini 3 Deep Think 的每任务成本仅为 7.17 美元,成本降低了约 280 至 420 倍。

这意味着我们现在需要再次为 AI 准备更复杂的测试题了。

除了数学和编程竞赛之外,Gemini 3 Deep Think 现在在化学和物理等广泛的科学领域也表现出色。更新后的 Deep Think 模式在 2025 年国际物理奥林匹克竞赛和化学奥林匹克竞赛的笔试部分取得了金牌级别的成绩。它还展现了在高等理论物理方面的能力,在 CMT-Benchmark 测试中取得了 50.5% 的分数。


还有这个在 Codeforces 上获得的 3455 分,Gemini 3 Deep Think 已经相当于世界排名第八的顶尖竞技程序员的水平。之前的最佳成绩是来自一年多以前 OpenAI o3 的 2727 分,排名第 175。

地球上只有 7 个人能在编程比赛中击败 Gemini 3 Deep Think。


对于 AI 和整个科技领域而言,这是一个以往难以想象的成果。

谷歌与科学家和研究人员紧密合作,对 Gemini 3 Deep Think 进行了升级。Deep Think 将深厚的科学知识与日常工程实践相结合,超越了抽象理论,推动了实际应用。

借助更新后的 Deep Think,你可以将草图转化为可 3D 打印的实体模型。Deep Think 会分析图纸,对复杂形状进行建模,并生成用于 3D 打印的实体文件。


谷歌展示了一些早期测试用户使用最新版 Deep Think 的成果:

罗格斯大学的数学家 Lisa Carbone 致力于研究高能物理学界所需的数学结构,以弥合爱因斯坦引力理论和量子力学之间的鸿沟。由于该领域缺乏大量的训练数据,她利用 Deep Think 技术审阅了一篇高度专业的数学论文。Deep Think 成功地识别出了一个细微的逻辑缺陷,而这个缺陷此前在人工同行评审中均未被发现。

在杜克大学,Haozhe "Harry" Wang 带领的实验室利用 Deep Think 技术优化了复杂晶体生长的制备方法,以期发现新的半导体材料。Deep Think 成功设计了一种能够生长厚度大于 100 微米薄膜的工艺,达到了以往方法难以企及的精确目标。

或许随着更多人的使用,我们不久之后能够基于 Gemini 3 Deep Think 实现更多科研突破。

全新 Deep Think 现已在 Gemini 应用中上线,目前 Google AI Ultra 订阅用户可以使用。此外,谷歌首次通过 Gemini API 向部分研究人员、工程师和企业开放 Deep Think 的使用权限。

参考内容:

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

https://x.com/shaneguML/status/2021999801911718029

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
雄鹿110-93大胜雷霆,迪昂19+11+6+4帽弑旧主,霍姆格伦16+13

雄鹿110-93大胜雷霆,迪昂19+11+6+4帽弑旧主,霍姆格伦16+13

懂球帝
2026-02-13 11:09:06
哈佛跟踪32年发现扎心真相:你能活多久,很大程度取决于你老婆!

哈佛跟踪32年发现扎心真相:你能活多久,很大程度取决于你老婆!

徐德文科学频道
2026-02-06 21:31:27
贵有贵的道理!曼城7200万签塞梅尼奥血赚,8场5球2助稳坐主力!

贵有贵的道理!曼城7200万签塞梅尼奥血赚,8场5球2助稳坐主力!

田先生篮球
2026-02-12 16:27:13
不是王钰栋!日媒如今最看好这位中国球员挑起国足大梁,引发热议

不是王钰栋!日媒如今最看好这位中国球员挑起国足大梁,引发热议

振刚说足球
2026-02-13 12:02:32
钱再多也没用,林子祥叶倩文如今现状,给“老少恋”夫妻提了个醒

钱再多也没用,林子祥叶倩文如今现状,给“老少恋”夫妻提了个醒

查尔菲的笔记
2026-01-24 20:06:02
去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

天下霸奇
2026-01-29 09:07:49
特朗普“新联合国”首次开会,只来了1个客人?中方6个字直接定调

特朗普“新联合国”首次开会,只来了1个客人?中方6个字直接定调

卷史
2026-02-12 10:56:01
笑不活了!伊朗电视台列“暗杀清单”,嘴炮比导弹猛,行动全靠演

笑不活了!伊朗电视台列“暗杀清单”,嘴炮比导弹猛,行动全靠演

老马拉车莫少装
2026-02-13 13:14:16
1年350万底薪!却打成球队老大!NBA最可怜的超巨,你该得到尊重

1年350万底薪!却打成球队老大!NBA最可怜的超巨,你该得到尊重

篮球扫地僧
2026-01-23 08:33:07
TVB花旦晒近况疑似真空上阵!遭网民催婚,已两年无新作品

TVB花旦晒近况疑似真空上阵!遭网民催婚,已两年无新作品

TVB的四小花
2026-02-13 14:56:45
明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

明朝锦衣卫的灭亡:大小头目全部遇难,一天之内便被消灭殆尽!

铭记历史呀
2026-01-31 23:08:25
林诗栋勇夺2026年首冠!感恩刘志强指导,球迷直言王皓尴尬难当

林诗栋勇夺2026年首冠!感恩刘志强指导,球迷直言王皓尴尬难当

卿子书
2026-01-31 16:37:33
事实证明,“消失”多年的清华才女武亦姝,证实了董卿当年没说错

事实证明,“消失”多年的清华才女武亦姝,证实了董卿当年没说错

千言娱乐记
2025-09-25 20:27:56
奥运3强集结炸翻乒坛!樊振东续约悬了,国乒格局要变天?

奥运3强集结炸翻乒坛!樊振东续约悬了,国乒格局要变天?

卿子书
2026-02-13 08:56:52
北京周末大风+降温!注意防风防寒——

北京周末大风+降温!注意防风防寒——

家住石景山
2026-02-13 12:10:29
揭秘朝鲜金正恩早些年的日常生活:手机、香烟、饮料和饮食习惯!

揭秘朝鲜金正恩早些年的日常生活:手机、香烟、饮料和饮食习惯!

混沌录
2025-11-08 16:36:03
国民党副主席萧旭岑现在全部撕下所有的伪装。

国民党副主席萧旭岑现在全部撕下所有的伪装。

百态人间
2026-02-13 15:12:45
一种新潮的异性关系:在成熟男女间悄然蔓延、无需多言,自有灵犀

一种新潮的异性关系:在成熟男女间悄然蔓延、无需多言,自有灵犀

大熊欢乐坊
2026-02-08 03:01:08
2026春运大巴彻底翻红!不是高铁不行,是打工人的刚需太真实

2026春运大巴彻底翻红!不是高铁不行,是打工人的刚需太真实

复转这些年
2026-02-03 23:52:33
官方:U23国脚、深圳新鹏城前锋拜合拉木加盟成都蓉城

官方:U23国脚、深圳新鹏城前锋拜合拉木加盟成都蓉城

懂球帝
2026-02-13 14:20:06
2026-02-13 16:03:00
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
2211084文章数 5465关注度
往期回顾 全部

科技要闻

DeepSeek更新后被吐槽变冷变傻?

头条要闻

双航母压境美国"王牌"装备尽出 伊朗被指可能很难抵御

头条要闻

双航母压境美国"王牌"装备尽出 伊朗被指可能很难抵御

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

米兰冬奥摘银 谷爱凌再遭美国网友网暴

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

手机
旅游
家居
数码
军事航空

手机要闻

小米澎湃OS 3上线2026马年春节限定水印

旅游要闻

千城胜景|云南临沧临翔:油菜花海染金妆

家居要闻

中古雅韵 乐韵伴日常

数码要闻

GAMEMAX新品机箱来袭,性价比爆棚!

军事要闻

多次成功应对外舰、外机挑衅 太原舰展示052D硬核实力

无障碍浏览 进入关怀版