网易首页 > 网易号 > 正文 申请入驻

“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程

0
分享至

智通财经APP获悉,美国科技巨头谷歌(GOOGL.US)对其风靡全球的Gemini 3 AI大模型的Deep Think(深度思考)模式在科学、编程、研究与工程学等方面进行了重大升级,这一最新升级聚焦于解决现代科学研究与工程领域的诸多复杂挑战,可谓引爆新一轮席卷全球的“Gemini AI狂热浪潮”。谷歌官方在一份声明中表示,新的Deep Think模式现已在Gemini 3系列AI应用产品中面向 Google AI Ultra 订阅用户开放。该公司补充称,这是其首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能。

据谷歌介绍,通过更新后的Gemini 3 AI大模型Deep Think(深度思考)模式,订阅用户们可以将草图变为可3D打印的现实物体。Deep Think拥有强大的能力分析图纸、对极度复杂形状建模,并生成可用于3D打印制作实体物品的文件。

该公司在周四的一篇博客文章中表示:“除了其最先进的性能之外,Deep Think还旨在推动实际应用,使研究人员们能够深度解读复杂数据,并使工程师们能够通过代码与编程对复杂物理系统进行建模。“最重要的是,我们正在努力将Deep Think带到研究人员与实践者最需要它的地方——从Gemini API等表明接口开始。”谷歌在博客中表示。

谷歌可谓将Gemini 3 Deep Think(深度思考)从“偏抽象的高强度推理”进一步推向“能在真实科研与工程流程中落地”的专业推理引擎:强调在边界不清、数据不完备、目标函数复杂的场景下,帮助研究者与工程师更快逼近可验证的结论与可执行的方案。

这次升级最直观的信号来自一系列硬核评测结果:在 Humanity’s Last Exam(无工具) 上达到 48.4%,在 ARC-AGI-2 上取得经 ARC Prize 基金会验证的 84.6%,并在 Codeforces 竞技编程基准中拿到 3455 Elo。这组成绩同时指向“学术级推理、抽象归纳、工程化算法实现”三条能力曲线的同步抬升。


更关键的是,Deep Think 的强项已不再局限于数学/编程:谷歌披露其在2025国际物理奥赛、化学奥赛笔试部分达到“金牌水平”,并在更偏学术的 CMT-Benchmark(凝聚态理论) 上取得 50.5%。从能力版图上看,这意味着它开始具备跨学科科研问题所需的“物理直觉 + 化学结构化推断 + 数学形式化表达 + 代码化求解”的组合拳,而非只在单一题型里刷分。

Gemini 3 Deep Think模式此前于 2025年11月作为 Gemini 3 AI应用产品套件的一部分对用户们正式发布。

“人类最后考试”成绩刷新天花板

据了解,更新后的Deep Think 在若干学术基准测试中展现出更好的表现。该模型在 Humanity’s Last Exam(HLE,人类的最后考试)上创下全新标准(48.4%,无工具),该基准旨在测试当代前沿模型的能力极限。谷歌Deep Think模式在”人类的最后考试“中的炸裂表现远高于此前公开发布的所有AI大型模型得分,被官方描述为在这一极具挑战性的基准上设定了新的行业水平(new standard)。这意味着在该特定推理测试中,它超越了以前的模型版本与竞争对手表现,被视为在该领域的领先成果。

谷歌官方指出,该模型在ARC-AGI-2(推理任务基准测试)上取得了前所未有的84.6%,并经ARC Prize Foundation(ARC 奖基金会)验证。它还在 Codeforces(竞技编程平台,由竞技编程挑战构成的基准)上获得了3455的Elo。该公司表示,去年该模型在数学与编程世界锦标赛中达到了金牌水平。

据该公司称,除了高难度数学考验与竞技编程之外,Gemini 3 AI大模型Deep Think模式现在在化学与物理等更广泛的科学领域也表现出色。

该公司指出,更新后的模型在2025年国际物理奥林匹克竞赛与化学奥林匹克竞赛的笔试部分也取得了金牌水平的最强劲大模型测试结果。它还在高级理论物理方面显示出惊人的熟练度,在 CMT-Benchmark上取得了50.5% 的分数。

谷歌的 Gemini 与多款 AI 产品竞争,包括 OpenAI(OPENAI)的 ChatGPT 以及 Anthropic(ANTHRO)的 Claude。

更新后的Deep Think,堪称全球新一轮“Gemini热潮”的点火器

更新后的Gemini 3 Deep Think,不仅仅是一次单纯的“模型更强”宣传,而是把“高强度推理”明确产品化、并把落点从答题/写代码扩展到超大规模的科研与工程工作流。谷歌在官方发布中把它定义为面向科学、研究与工程挑战的“专用推理模式”,同时强调其在 Humanity’s Last Exam 上“设定了新标准(48.4%,无工具)”、ARC-AGI-2上拿到84.6%等惊人成绩,这种“硬指标 + 明确应用场景”的组合,天然更容易形成话题聚拢效应与开发者/机构的注意力回流。

从底层技术逻辑看,Deep Think 的关键不在“记忆更多知识”,而在于推理过程的结构化与可扩展的推理算力:它通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中不断收敛;谷歌DeepMind几乎在同一时间披露了以 Deep Think 驱动的研究型代理(如内部代号 Aletheia),用自然语言验证器去抓逻辑漏洞、触发重写或推倒重来,这类“强验证/强回路”的机制,正是把AI大模型从“会说”推向“能做研究/能做工程”的核心路径。

谷歌这次AI大模型升级不仅在Gemini App系列应用产品面向 Google AI Ultra订阅用户开放,还首次通过Gemini API向研究人员、工程师与企业提供早期访问(部分报道提到与 Vertex AI 早期计划联动),这意味着它更容易被嵌入企业研发链条(数据分析、仿真建模、代码驱动物理系统建模、自动化实验/设计迭代等);再叠加“草图到3D可打印文件”这类强演示型能力,无疑具备引爆传播的产品特征。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张雪峰亲手把自己送上了死路

张雪峰亲手把自己送上了死路

名人苟或
2026-03-25 06:02:57
中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

中原消费金融为催收“买”借款人手机号码 三大运营商均中标 或涉买卖个人信息惹争议

信网
2026-03-26 19:12:37
A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

A股,尾盘传来一个“重磅信号”,周五,或将迎来大变盘!

夜深爱杂谈
2026-03-26 20:09:32
特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

特变电工:公司输变电产线基本处于满负荷生产状态,公司变压器、电线电缆、电抗器等输变电产品在手订单饱满

每日经济新闻
2026-03-26 19:25:48
A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

A股第二高价股源杰科技启动“A+H” 一年内股价涨超1000%

蓝鲸新闻
2026-03-26 16:18:08
痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

痛心!张雪峰女儿哭成泪人!再多的财富也无法填补父爱的空缺

魔都姐姐杂谈
2026-03-26 20:54:38
石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

蜉蝣说
2026-03-26 16:52:10
我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

我在立陶宛住了半年,回来后整个人对波罗的海三国的认知完全变了

阅尽天下大事
2026-03-26 13:16:28
学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

学医后才知道,高血压最危险信号,不是头晕,而是频繁出现4症状

医学科普汇
2026-03-26 19:55:03
稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

稳居西部第二!马刺三大年轻核心,已成联盟无解难题!

田先生篮球
2026-03-26 14:23:29
日本公布中国游客免税店2月份消费数据,真的是打脸了!

日本公布中国游客免税店2月份消费数据,真的是打脸了!

消失的电波
2026-03-26 15:20:44
正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

正脸曝光!强闯我使馆的村田晃大3月15日刚晋升,所持刀具刃长约18厘米

中国网
2026-03-26 14:01:45
张雪峰的病,速效救心丸能救吗?

张雪峰的病,速效救心丸能救吗?

中国新闻周刊
2026-03-25 16:23:30
女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

女子空置房2个月用水1961吨,费用近1.2万元,“水管封死水表仍走字”,水务公司拒回应

观威海
2026-03-26 10:39:05
20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

20亿美元还不够!中企对巴拿马索赔涨价,巴政府内部已经乱套了

悄悄史话
2026-03-26 14:09:05
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
山姆曲奇礼盒紧急下架!监管部门:已立案

山姆曲奇礼盒紧急下架!监管部门:已立案

中国品牌
2026-03-26 19:00:21
突然崩了!很多人以为手机坏了!官方紧急回应

突然崩了!很多人以为手机坏了!官方紧急回应

蓬勃新闻
2026-03-25 20:00:43
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

伊朗政府信息委员会主席:15点停战协议是特朗普的“又一个谎言”

新京报
2026-03-25 21:29:45
2026-03-26 22:39:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1106809文章数 101264关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
艺术
旅游
房产
公开课

转头就晕的耳石症,能开车上班吗?

艺术要闻

哪一座桥不是风景?

旅游要闻

探访资中文旅新地标 邂逅千年古城的诗与远方

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版