网易首页 > 网易号 > 正文 申请入驻

刚刚Gemini上新模型,全球只有7人比它会编程,谷歌姚顺宇参与

0
分享至

来源:市场资讯

(来源:机器之心)

编辑|泽南

从此以后,AI 不再是工具,要尊称为「硅基博学家」了。

北京时间周五凌晨,谷歌发布了 Gemini 3 Deep Think 的重大升级,作为专门用于复杂任务的推理模式,Deep Think 代表 AI 前沿的最强智能水平,旨在解决科学、工程领域的诸多挑战。


去年 9 月加入 Google DeepMind 的清华物理系传奇姚顺宇(Shunyu Yao)也是这次 Deep Think 新模型的参与者。


去年,谷歌展示了专门开发的 Deep Think 版本能够成功应对一些最棘手的推理挑战,并在数学和编程世界锦标赛上取得了金牌成绩。最近,Deep Think 又使专门开发的智能体能够进行研究级别的数学探索。

更新后的深度思考模式继续拓展智能的边界,在最严格的学术基准测试中取得了新的高度,其中包括:

  • 在「人类的最后考试」(一项旨在测试现代前沿模型极限的基准测试)中,该模型取得了新的 SOTA(48.4%,不使用任何工具)。

  • 在 ARC-AGI-2 测试中取得了前所未有的 84.6% 的成绩,并经 ARC Prize 基金会验证。

  • 在 Codeforces 上取得了惊人的 3455 Elo 分数,Codeforces 是一个包含各种竞技编程挑战的基准测试平台。

  • 在 2025 年国际数学奥林匹克竞赛中取得金牌水平。


新版 Gemini 3 Deep Think 在 ARC-AGI-1 上的成绩是 96.0%,每任务花费 7.17 美元;在 ARC-AGI-2 上已经达到了 84.6% 的分数,每任务成本为 13.62 美元。


大约 14 个月前,OpenAI 模型 o3-preview 的「高计算」版本在 ARC-AGI-1 测试中达到了约 88% 的分数,每个任务的成本约为 2000 至 3000 美元。而 Gemini 3 Deep Think 的每任务成本仅为 7.17 美元,成本降低了约 280 至 420 倍。

这意味着我们现在需要再次为 AI 准备更复杂的测试题了。

除了数学和编程竞赛之外,Gemini 3 Deep Think 现在在化学和物理等广泛的科学领域也表现出色。更新后的 Deep Think 模式在 2025 年国际物理奥林匹克竞赛和化学奥林匹克竞赛的笔试部分取得了金牌级别的成绩。它还展现了在高等理论物理方面的能力,在 CMT-Benchmark 测试中取得了 50.5% 的分数。


还有这个在 Codeforces 上获得的 3455 分,Gemini 3 Deep Think 已经相当于世界排名第八的顶尖竞技程序员的水平。之前的最佳成绩是来自一年多以前 OpenAI o3 的 2727 分,排名第 175。

地球上只有 7 个人能在编程比赛中击败 Gemini 3 Deep Think。


对于 AI 和整个科技领域而言,这是一个以往难以想象的成果。

谷歌与科学家和研究人员紧密合作,对 Gemini 3 Deep Think 进行了升级。Deep Think 将深厚的科学知识与日常工程实践相结合,超越了抽象理论,推动了实际应用。

借助更新后的 Deep Think,你可以将草图转化为可 3D 打印的实体模型。Deep Think 会分析图纸,对复杂形状进行建模,并生成用于 3D 打印的实体文件。


谷歌展示了一些早期测试用户使用最新版 Deep Think 的成果:

罗格斯大学的数学家 Lisa Carbone 致力于研究高能物理学界所需的数学结构,以弥合爱因斯坦引力理论和量子力学之间的鸿沟。由于该领域缺乏大量的训练数据,她利用 Deep Think 技术审阅了一篇高度专业的数学论文。Deep Think 成功地识别出了一个细微的逻辑缺陷,而这个缺陷此前在人工同行评审中均未被发现。

在杜克大学,Haozhe "Harry" Wang 带领的实验室利用 Deep Think 技术优化了复杂晶体生长的制备方法,以期发现新的半导体材料。Deep Think 成功设计了一种能够生长厚度大于 100 微米薄膜的工艺,达到了以往方法难以企及的精确目标。

或许随着更多人的使用,我们不久之后能够基于 Gemini 3 Deep Think 实现更多科研突破。

全新 Deep Think 现已在 Gemini 应用中上线,目前 Google AI Ultra 订阅用户可以使用。此外,谷歌首次通过 Gemini API 向部分研究人员、工程师和企业开放 Deep Think 的使用权限。

参考内容:

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/

https://x.com/shaneguML/status/2021999801911718029

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
扎心了!女儿频繁用生殖器官类词汇辱骂父母,一家长哭诉引发热议

扎心了!女儿频繁用生殖器官类词汇辱骂父母,一家长哭诉引发热议

火山詩话
2026-04-30 07:03:35
都在盯中东!没人发现中国这一邻国已变天,给中方送上大礼?

都在盯中东!没人发现中国这一邻国已变天,给中方送上大礼?

小兰聊历史
2026-05-01 16:07:43
记者问,上双塔是保留的一个绝招还是临时想到的?杜锋嘿嘿一笑…

记者问,上双塔是保留的一个绝招还是临时想到的?杜锋嘿嘿一笑…

南海浪花
2026-05-02 10:56:07
老师和孩子的天都塌了!不去春游事件发酵,无耻的家长没有下限!

老师和孩子的天都塌了!不去春游事件发酵,无耻的家长没有下限!

知晓科普
2026-04-30 12:25:16
想不到,远走美国的京圈才女徐静蕾,已悄悄走入另一条“上坡路”

想不到,远走美国的京圈才女徐静蕾,已悄悄走入另一条“上坡路”

日落于西
2026-05-02 12:00:12
辞职4个月,35岁的张水华终于喊出了这句话!361度放走一棵摇钱树

辞职4个月,35岁的张水华终于喊出了这句话!361度放走一棵摇钱树

风过乡
2026-05-02 07:42:45
为什么身边用苹果手机的人越来越多了?4个原因很真实

为什么身边用苹果手机的人越来越多了?4个原因很真实

小蜜情感说
2026-05-02 00:32:12
善恶有报!钟汉良《蜜语纪》38集大结局,是今年看过最解气结局

善恶有报!钟汉良《蜜语纪》38集大结局,是今年看过最解气结局

娱君坠星河
2026-05-01 08:26:28
年报收官避雷!13家将退市,29家下周戴帽

年报收官避雷!13家将退市,29家下周戴帽

财经智多星
2026-05-01 20:01:05
无敌存在!成都蓉城一骑绝尘:中超敢在申花主场让2追3,还有谁?

无敌存在!成都蓉城一骑绝尘:中超敢在申花主场让2追3,还有谁?

足球大腕
2026-05-01 22:44:51
雷军:新一代SU7锁单已超7万台

雷军:新一代SU7锁单已超7万台

界面新闻
2026-05-02 10:18:19
张敬轩内地复出无望,港圈选择彻底沉默,再无一人为他发声!

张敬轩内地复出无望,港圈选择彻底沉默,再无一人为他发声!

小娱乐悠悠
2026-05-02 10:40:34
“郴州1岁男童被人入室抢走”案:和孩子朝夕相处的奶奶,一度被家人冤枉是拐走孩子的共犯

“郴州1岁男童被人入室抢走”案:和孩子朝夕相处的奶奶,一度被家人冤枉是拐走孩子的共犯

极目新闻
2026-05-01 10:47:56
小米千万年薪挖来的"AI天才少女"罗福莉公开放话:我现在只招大二大三本科生!硅谷名企、腾讯、吉...

小米千万年薪挖来的"AI天才少女"罗福莉公开放话:我现在只招大二大三本科生!硅谷名企、腾讯、吉...

新浪财经
2026-05-02 09:09:35
富国物廉人贵,穷国物贵人廉:一句道破世界经济的底层真相

富国物廉人贵,穷国物贵人廉:一句道破世界经济的底层真相

壹家言
2026-04-24 21:31:38
48岁男子替已故哥哥抚养4个孩子,无人敢嫁,至今仍单身已满头白发

48岁男子替已故哥哥抚养4个孩子,无人敢嫁,至今仍单身已满头白发

张晓磊
2026-04-27 11:21:00
花1000块逛遍平壤,才懂朝鲜普通人的日子:不挨饿,却也不轻松

花1000块逛遍平壤,才懂朝鲜普通人的日子:不挨饿,却也不轻松

老特有话说
2026-04-30 11:04:23
伊朗总统:持续推进海上封锁的行为不可容忍

伊朗总统:持续推进海上封锁的行为不可容忍

每日经济新闻
2026-05-01 09:16:47
07年,华国锋最后一次去毛主席纪念堂,喊了一句话,在场之人落泪

07年,华国锋最后一次去毛主席纪念堂,喊了一句话,在场之人落泪

蒋南强读历史
2026-04-28 08:10:06
43年八路军侦察员借宿时惨遭出卖,面对166名敌军,他靠一招脱险

43年八路军侦察员借宿时惨遭出卖,面对166名敌军,他靠一招脱险

卡西莫多的故事
2026-03-14 21:35:36
2026-05-02 12:44:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
3095713文章数 7068关注度
往期回顾 全部

科技要闻

AI热潮耗尽库存,Mac Mini起售调高200美元

头条要闻

网友五一堵车在高速上点外卖 女老板穿着围裙亲自送到

头条要闻

网友五一堵车在高速上点外卖 女老板穿着围裙亲自送到

体育要闻

坎宁安大逆转:像看到了2006-08的勒布朗

娱乐要闻

白百何罕晒大儿子 18岁元宝越来越帅

财经要闻

雷军很努力 小米还是跌破了30港元大关

汽车要闻

新纪录!零跑汽车4月交付达71387台

态度原创

房产
教育
家居
手机
亲子

房产要闻

所有户型全卖爆!海口TOP级豪宅,景观样板间五一全线开放!

教育要闻

老师写字“看不得”? 6个“偏方”试一试

家居要闻

灵动实用 生活艺术场

手机要闻

追觅俞浩晒模块化手机:不仅镜头能拆 机身都能拆

亲子要闻

萌星秀秀:小萌星甜甜朗诵唐诗三首

无障碍浏览 进入关怀版