网易首页 > 网易号 > 正文 申请入驻

“Gemini热潮”再度席卷全球! 谷歌(GOOGL.US)Deep Think“硬核升级”直指大型科研工程

0
分享至

智通财经APP获悉,美国科技巨头谷歌(GOOGL.US)对其风靡全球的Gemini 3 AI大模型的Deep Think(深度思考)模式在科学、编程、研究与工程学等方面进行了重大升级,这一最新升级聚焦于解决现代科学研究与工程领域的诸多复杂挑战,可谓引爆新一轮席卷全球的“Gemini AI狂热浪潮”。谷歌官方在一份声明中表示,新的Deep Think模式现已在Gemini 3系列AI应用产品中面向 Google AI Ultra 订阅用户开放。该公司补充称,这是其首次通过Gemini API向部分研究人员、工程师及大型企业提供Deep Think功能。

据谷歌介绍,通过更新后的Gemini 3 AI大模型Deep Think(深度思考)模式,订阅用户们可以将草图变为可3D打印的现实物体。Deep Think拥有强大的能力分析图纸、对极度复杂形状建模,并生成可用于3D打印制作实体物品的文件。

该公司在周四的一篇博客文章中表示:“除了其最先进的性能之外,Deep Think还旨在推动实际应用,使研究人员们能够深度解读复杂数据,并使工程师们能够通过代码与编程对复杂物理系统进行建模。“最重要的是,我们正在努力将Deep Think带到研究人员与实践者最需要它的地方——从Gemini API等表明接口开始。”谷歌在博客中表示。

谷歌可谓将Gemini 3 Deep Think(深度思考)从“偏抽象的高强度推理”进一步推向“能在真实科研与工程流程中落地”的专业推理引擎:强调在边界不清、数据不完备、目标函数复杂的场景下,帮助研究者与工程师更快逼近可验证的结论与可执行的方案。

这次升级最直观的信号来自一系列硬核评测结果:在 Humanity’s Last Exam(无工具) 上达到 48.4%,在 ARC-AGI-2 上取得经 ARC Prize 基金会验证的 84.6%,并在 Codeforces 竞技编程基准中拿到 3455 Elo。这组成绩同时指向“学术级推理、抽象归纳、工程化算法实现”三条能力曲线的同步抬升。


更关键的是,Deep Think 的强项已不再局限于数学/编程:谷歌披露其在2025国际物理奥赛、化学奥赛笔试部分达到“金牌水平”,并在更偏学术的 CMT-Benchmark(凝聚态理论) 上取得 50.5%。从能力版图上看,这意味着它开始具备跨学科科研问题所需的“物理直觉 + 化学结构化推断 + 数学形式化表达 + 代码化求解”的组合拳,而非只在单一题型里刷分。

Gemini 3 Deep Think模式此前于 2025年11月作为 Gemini 3 AI应用产品套件的一部分对用户们正式发布。

“人类最后考试”成绩刷新天花板

据了解,更新后的Deep Think 在若干学术基准测试中展现出更好的表现。该模型在 Humanity’s Last Exam(HLE,人类的最后考试)上创下全新标准(48.4%,无工具),该基准旨在测试当代前沿模型的能力极限。谷歌Deep Think模式在”人类的最后考试“中的炸裂表现远高于此前公开发布的所有AI大型模型得分,被官方描述为在这一极具挑战性的基准上设定了新的行业水平(new standard)。这意味着在该特定推理测试中,它超越了以前的模型版本与竞争对手表现,被视为在该领域的领先成果。

谷歌官方指出,该模型在ARC-AGI-2(推理任务基准测试)上取得了前所未有的84.6%,并经ARC Prize Foundation(ARC 奖基金会)验证。它还在 Codeforces(竞技编程平台,由竞技编程挑战构成的基准)上获得了3455的Elo。该公司表示,去年该模型在数学与编程世界锦标赛中达到了金牌水平。

据该公司称,除了高难度数学考验与竞技编程之外,Gemini 3 AI大模型Deep Think模式现在在化学与物理等更广泛的科学领域也表现出色。

该公司指出,更新后的模型在2025年国际物理奥林匹克竞赛与化学奥林匹克竞赛的笔试部分也取得了金牌水平的最强劲大模型测试结果。它还在高级理论物理方面显示出惊人的熟练度,在 CMT-Benchmark上取得了50.5% 的分数。

谷歌的 Gemini 与多款 AI 产品竞争,包括 OpenAI(OPENAI)的 ChatGPT 以及 Anthropic(ANTHRO)的 Claude。

更新后的Deep Think,堪称全球新一轮“Gemini热潮”的点火器

更新后的Gemini 3 Deep Think,不仅仅是一次单纯的“模型更强”宣传,而是把“高强度推理”明确产品化、并把落点从答题/写代码扩展到超大规模的科研与工程工作流。谷歌在官方发布中把它定义为面向科学、研究与工程挑战的“专用推理模式”,同时强调其在 Humanity’s Last Exam 上“设定了新标准(48.4%,无工具)”、ARC-AGI-2上拿到84.6%等惊人成绩,这种“硬指标 + 明确应用场景”的组合,天然更容易形成话题聚拢效应与开发者/机构的注意力回流。

从底层技术逻辑看,Deep Think 的关键不在“记忆更多知识”,而在于推理过程的结构化与可扩展的推理算力:它通过迭代式推理在多个假设空间并行探索,并在“生成—验证—修正”的闭环中不断收敛;谷歌DeepMind几乎在同一时间披露了以 Deep Think 驱动的研究型代理(如内部代号 Aletheia),用自然语言验证器去抓逻辑漏洞、触发重写或推倒重来,这类“强验证/强回路”的机制,正是把AI大模型从“会说”推向“能做研究/能做工程”的核心路径。

谷歌这次AI大模型升级不仅在Gemini App系列应用产品面向 Google AI Ultra订阅用户开放,还首次通过Gemini API向研究人员、工程师与企业提供早期访问(部分报道提到与 Vertex AI 早期计划联动),这意味着它更容易被嵌入企业研发链条(数据分析、仿真建模、代码驱动物理系统建模、自动化实验/设计迭代等);再叠加“草图到3D可打印文件”这类强演示型能力,无疑具备引爆传播的产品特征。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中南大学湘雅医院2025年外籍患者就诊人次较前年翻6倍

中南大学湘雅医院2025年外籍患者就诊人次较前年翻6倍

澎湃新闻
2026-02-12 20:48:26
首次访华前,德国总理默茨发言中将中欧对比引发关注

首次访华前,德国总理默茨发言中将中欧对比引发关注

澎湃新闻
2026-02-12 17:34:26
闫学晶儿子被曝冒名顶替?中戏两位系主任投案自首,再也瞒不住了

闫学晶儿子被曝冒名顶替?中戏两位系主任投案自首,再也瞒不住了

社会酱
2026-02-13 16:23:30
金灿荣给自己找台阶下,但是这个台阶,他是下不来的

金灿荣给自己找台阶下,但是这个台阶,他是下不来的

读鬼笔记
2026-02-13 13:03:44
13岁体操冠军傅佳丽被虐待致跳楼,央媒跟进:2名涉事教练被立案

13岁体操冠军傅佳丽被虐待致跳楼,央媒跟进:2名涉事教练被立案

奇思妙想草叶君
2026-02-12 20:11:52
巨力索具“航天神话”破灭,发布澄清前股东已质押股权数亿元

巨力索具“航天神话”破灭,发布澄清前股东已质押股权数亿元

界面新闻
2026-02-13 14:52:48
50国齐聚拉姆施泰因,380亿美元助力乌克兰抗战到底

50国齐聚拉姆施泰因,380亿美元助力乌克兰抗战到底

史政先锋
2026-02-13 15:53:03
央媒点赞孤独婚车!新娘身份曝光,家境优渥,婆家村里婚房很气派

央媒点赞孤独婚车!新娘身份曝光,家境优渥,婆家村里婚房很气派

离离言几许
2026-02-13 16:42:16
“靴子落地”!刚刚,证监会发布

“靴子落地”!刚刚,证监会发布

中国基金报
2026-02-13 18:30:40
网友胖东来买车厘子放一个月后全坏了,一番沟通后同意退款

网友胖东来买车厘子放一个月后全坏了,一番沟通后同意退款

映射生活的身影
2026-02-13 14:36:46
过年打麻将一场输赢超300就算赌博

过年打麻将一场输赢超300就算赌博

观威海
2026-02-13 14:50:05
李立群回河南祭祖,麦田跪拜落泪,一句以后可能不回了看哭全网

李立群回河南祭祖,麦田跪拜落泪,一句以后可能不回了看哭全网

一盅情怀
2026-02-13 14:23:16
“见过最廉价的兜底”,家长让儿子在购物车里吃烤鸡,被全网嘲笑

“见过最廉价的兜底”,家长让儿子在购物车里吃烤鸡,被全网嘲笑

妍妍教育日记
2026-02-13 16:34:42
女孩因神似敦煌壁画美人意外走红,家长回应:没有炒作,孩子还是要以学业为主

女孩因神似敦煌壁画美人意外走红,家长回应:没有炒作,孩子还是要以学业为主

大象新闻
2026-02-13 17:47:04
华为通报:原终端BG多媒体技术部部长被批准逮捕

华为通报:原终端BG多媒体技术部部长被批准逮捕

界面新闻
2026-02-13 13:49:20
今年大批校长要落马!

今年大批校长要落马!

行者殷涛
2026-02-13 16:21:19
女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

女子故意扮丑去相亲,男子一眼看中,女子吃惊:他是不是太饿了

丫头舫
2026-02-10 22:18:05
前光明网女记者立遗书举报官员被百万封口,拒绝后遭强制传唤!

前光明网女记者立遗书举报官员被百万封口,拒绝后遭强制传唤!

兵叔评说
2026-02-13 13:49:48
中央急令!6月底前全国村村必设新部门,老人妇女孩子直接受益

中央急令!6月底前全国村村必设新部门,老人妇女孩子直接受益

复转这些年
2026-02-12 21:57:32
日媒:高市早苗因手部病情恶化就医检查,在医院停留约3小时45分钟

日媒:高市早苗因手部病情恶化就医检查,在医院停留约3小时45分钟

环球网资讯
2026-02-13 20:06:13
2026-02-13 21:27:00
智通财经 incentive-icons
智通财经
全球资本市场财经资讯提供者
1094198文章数 101250关注度
往期回顾 全部

科技要闻

独家探访蔡磊:答不完的卷子 死磕最后一程

头条要闻

浙江"一人公司"兴起 前大厂程序员靠AI直接月入200万

头条要闻

浙江"一人公司"兴起 前大厂程序员靠AI直接月入200万

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

大衣哥女儿风光出嫁,农村婚礼超朴素

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

艺术
房产
数码
手机
游戏

艺术要闻

于右任又一真迹出土!这才是当代“真草圣”

房产要闻

三亚新机场,又传出新消息!

数码要闻

消息称小米Tag将推出国行版本,欧洲单个售17.99欧元

手机要闻

玩出花了!OV米耀们「砍掉」生肖LOGO,狂卷配件

《柯娜》新作官宣!AI爆改“性感版”造型引争议

无障碍浏览 进入关怀版