网易首页 > 网易号 > 正文 申请入驻

物理奥赛金牌随便拿,谷歌发了一个“科研合伙人”模型,月费1800元

0
分享至


文丨苏扬

编辑丨徐青阳

2月13日,谷歌发布Gemini 3 Deep Think推理增强版本,这一“推理模式”专为科学研究和工程应用设计,旨在拓展智能系统在复杂任务中的能力边界。

新版本在Gemini 3架构基础上升级了推理机制,引入“推理时计算”(Inference-time Compute),能够在处理复杂逻辑和系统级问题时进行多步骤推演,同时提高结构一致性验证和工程任务求解的准确性。

考虑到Deep Think在处理问题时需调用庞大的后台算力资源,谷歌设定了差异化的付费规则:

  • 对于追求极致产出的个人专业用户,Deep Think已正式纳入最高档的Google AI Ultra 计划。订阅者需支付249.99美元/月(约合人民币1800 元),即可享受不限次数的深度推理权限、30TB超大存储空间以及算力响应的最高优先级。

  • 面向开发者和企业的API接入,按使用量计费:输入百万tokens收费2美元,输出百万tokens收费12美元。

01 智力基准:从算法奥赛到前沿物理的全面登顶

Gemini 3 Deep Think的技术原型曾在2025年7月的国际数学奥林匹克竞赛(IMO 2025)中一战成名。

当时,该模型在4.5小时的规定时间内,利用纯自然语言推理完成了6道极难题目中的5道,斩获35分(达到金牌选手水平)。与以往需要将题目翻译成计算机代码的AI不同,Deep Think证明了AI可以像人类数学家一样,直接通过逻辑推演攻克顶级数学难题。


如今正式发布的Gemini 3 Deep Think推理增强版本,在继承这一顶尖推理基因的基础上,进一步实现了跨学科的泛化:

在Codeforces竞技编程平台上,模型取得3455 Elo的评分,稳居“Legendary Grandmaster”等级。这一评分区间意味着其在复杂算法设计与高难度问题求解上,已处于全球顶尖选手之列。

在被视为通用人工智能(AGI)试金石的ARC-AGI-2测试中,Deep Think在无联网条件下取得了84.6%的创纪录成绩,证明该模型已摆脱对语料库的单纯依赖,实现了真正的少样本抽象归纳与逻辑发现。

针对更高难度的跨学科挑战,Deep Think在人类最终考试(Humanity's Last Exam, HLE) (48.4%)与CMT Benchmark(50.5%) 中同样表现出色。

无论面对深奥的跨学科悖论还是高阶物理推演,模型都展现出极强的结构一致性与逻辑韧性。

支撑这些数据的,是Gemini 3 Deep Think推理范式的质变。

不同于传统模型“脱口而出”的生成机制,Deep Think引入了“推理时计算”模式。在输出前,它会在内部构建并模拟多种解法路径,执行实时的一致性自检。一旦监测到前提冲突或逻辑断层,系统会立即执行逻辑回溯并重组推演链条。

这种“慢思考”机制,标志着AI正式从“对话工具”进化为“科研合伙人”,为严谨的科学研究与复杂的工程任务提供了确定性更高的智力支持。

02 官方演示:推理模式覆盖科研与工程全流程

谷歌通过多项演示展示了Deep Think在科研与工程领域的实际应用。


数学家Carbone使用Deep Think审阅一篇高度专业的数学论文

在科研场景中,罗格斯大学数学家Lisa Carbone使用Deep Think审阅一篇高度专业的数学论文。

Carbone的研究涉及高能物理领域,旨在探索将爱因斯坦引力理论与量子力学桥接的数学结构。在这个训练数据非常稀缺的领域,Deep Think发现了一处细微的逻辑缺陷,而这一问题此前甚至未被同行评审识别。模型能够将跨文档信息整合到统一的推理网络中,对公式和结论进行一致性判断,并生成标注和分析报告供研究者参考。

这标志着AI从“对话工具”逐步转向“科研合伙人”,并通过Aletheia(谷歌内部用于数学探索的专业智能体架构)等系统,实现从辅助检索向自主逻辑发现的跨越。


杜克大学研究人员利用Deep Think优化复杂晶体生长的制造方法

在杜克大学,Wang Lab利用Deep Think优化复杂晶体生长的制造方法,以助力潜在半导体材料的研发。Deep Think设计出一套可生长厚度超过100微米薄膜的实验方案,达到了以往方法难以实现的精准目标,为材料研发提供了高效可行的实验路径。


在工程应用领域,科学家使用Deep Think加速物理组件设计

在工程应用中,Anupam Pthak——谷歌Platforms and Devices部门研发负责人、前 Liftware CEO——使用Deep Think加速物理组件设计。用户上传复杂机械结构的手绘草图后,模型能够自动识别空间拓扑关系、几何约束及关键尺寸,并生成可执行建模脚本,支持OpenSCAD与Python格式。

整个过程包括几何关系解析、尺寸推算、连接关系建模以及最终输出文件生成。官方演示中,生成的脚本直接驱动3D打印设备,输出符合设计要求的实物模型。

此外,Deep Think在多文件系统级代码分析中也展现了能力。模型可以识别变量引用关系、函数调用依赖及潜在边界条件问题,并提供可操作的修改建议。演示强调,模型能够处理复杂工程项目的整体架构,为系统设计和代码验证提供可靠参考。

官方演示的亮点在于跨场景统一应用:无论是科研论文分析、材料实验设计、工程建模,还是复杂代码系统验证,Deep Think都可以通过同一条推理链条完成逻辑推演和结果输出,为科研和工程任务提供一套高效、统一的智能工具。

03 API与行业集成:科研与工业的深度接入

随着Deep Think发布,Gemini API早期访问计划(Early Access Program,EAP)同步启动。企业与科研机构可以将模型接入内部数据库,用于电路逻辑一致性检查、数学推导辅助验证、实验数据结构分析以及软件系统边界条件排查。

谷歌表示,将优先支持能源建模、新材料研发和生物医药领域的科研与工业团队。

谷歌官方尚未公布完整开放时间表及后续功能扩展计划,但通过早期访问计划,相关团队将能够率先体验Deep Think在复杂科研和工程项目中的推理能力。

(特约编译无忌对本文亦有贡献)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我国古代7大未解之谜,至今没人能回答出来,其中一个被奉为神话

我国古代7大未解之谜,至今没人能回答出来,其中一个被奉为神话

铭记历史呀
2026-02-01 07:12:23
贬低林孝埈、嘲讽刘少昂!孙龙用一枚银牌,让韩国媒体颜面扫地

贬低林孝埈、嘲讽刘少昂!孙龙用一枚银牌,让韩国媒体颜面扫地

十点街球体育
2026-02-13 14:25:03
南京Lily姐火了。
​38岁陪读妈妈,牵着70岁德国工程师的手

南京Lily姐火了。 ​38岁陪读妈妈,牵着70岁德国工程师的手

岁月有情1314
2026-02-05 11:13:16
江苏杨某军,没批文让老板垫1个亿,硬是把52个老小区给翻新了。

江苏杨某军,没批文让老板垫1个亿,硬是把52个老小区给翻新了。

林子说事
2026-02-01 09:40:29
赖清德受访,“台独”本质现形

赖清德受访,“台独”本质现形

环球时报国际
2026-02-13 15:08:33
4-0!1-1!足坛疯狂一夜:马竞碾压巴萨,枪手掉链子,曼城收大礼

4-0!1-1!足坛疯狂一夜:马竞碾压巴萨,枪手掉链子,曼城收大礼

北纬的咖啡豆
2026-02-13 14:21:44
218:213!美国选举新规落地,选民需持身份证方可投票

218:213!美国选举新规落地,选民需持身份证方可投票

凑近看世界
2026-02-12 19:39:05
“神祇”竟然不读shén dǐ,正确读音是什么?你知道吗?

“神祇”竟然不读shén dǐ,正确读音是什么?你知道吗?

AI读书
2026-02-11 14:30:14
刘伯温预言成真?那位东方圣人早已出世,大概率就藏在这三地

刘伯温预言成真?那位东方圣人早已出世,大概率就藏在这三地

z千年历史老号
2026-02-05 16:31:39
全网恭喜!45岁宋佳正式上任,职务不一般,黑龙江人民这下有福了

全网恭喜!45岁宋佳正式上任,职务不一般,黑龙江人民这下有福了

查尔菲的笔记
2026-02-10 15:47:57
媒体人爆料:泰山队签下葡系发牌手!潍坊杯旧人,年薪或仅百万欧

媒体人爆料:泰山队签下葡系发牌手!潍坊杯旧人,年薪或仅百万欧

体坛小鹏
2026-02-13 10:59:10
55岁的阿姨,旅游时贪图新鲜感出轨,回到家后十分痛苦

55岁的阿姨,旅游时贪图新鲜感出轨,回到家后十分痛苦

惟来
2026-02-12 14:46:52
拿完国内一万退休金,再去澳洲领两千周薪?这种便宜还能占多久?

拿完国内一万退休金,再去澳洲领两千周薪?这种便宜还能占多久?

冷峻视角下的世界
2026-02-10 03:28:05
留洋代表作!余嘉豪11中9独揽27分12板2助2帽1断

留洋代表作!余嘉豪11中9独揽27分12板2助2帽1断

懂球帝
2026-02-12 16:45:11
金融战已经打响

金融战已经打响

白浅娱乐聊
2026-02-12 19:39:55
现场直击!大批港人上街抗议,反对外国势力干预香港!

现场直击!大批港人上街抗议,反对外国势力干预香港!

港漂圈
2026-02-12 10:13:27
吴彦姝和女儿吃火锅被偶遇!女儿断崖式衰老,3年时间像变了个人

吴彦姝和女儿吃火锅被偶遇!女儿断崖式衰老,3年时间像变了个人

地理三体说
2026-02-12 23:10:27
NBA讨论遏制摆烂新方案!打锦标赛争夺高顺位 乐透概率按两年计算

NBA讨论遏制摆烂新方案!打锦标赛争夺高顺位 乐透概率按两年计算

罗说NBA
2026-02-13 07:51:19
突发!日本长崎外海强扣中国渔船,逮捕船长,时隔四年再出手

突发!日本长崎外海强扣中国渔船,逮捕船长,时隔四年再出手

老马拉车莫少装
2026-02-13 12:56:29
“网友把网红同款买回家后……”哈哈哈哈哈哈到底是哪里出问题了!!

“网友把网红同款买回家后……”哈哈哈哈哈哈到底是哪里出问题了!!

不二表姐
2026-02-12 23:54:07
2026-02-13 15:43:00
呼呼历史论
呼呼历史论
分享有趣的历史
493文章数 16307关注度
往期回顾 全部

科技要闻

DeepSeek更新后被吐槽变冷变傻?

头条要闻

双航母压境美国"王牌"装备尽出 伊朗被指可能很难抵御

头条要闻

双航母压境美国"王牌"装备尽出 伊朗被指可能很难抵御

体育要闻

这张照片背后,是米兰冬奥最催泪的故事

娱乐要闻

米兰冬奥摘银 谷爱凌再遭美国网友网暴

财经要闻

华莱士母公司退市 疯狂扩张下的食安隐忧

汽车要闻

探秘比亚迪巴西工厂 居然是这个画风!

态度原创

旅游
本地
手机
艺术
公开课

旅游要闻

千城胜景|云南临沧临翔:油菜花海染金妆

本地新闻

下一站是嘉禾望岗,请各位乘客做好哭泣准备

手机要闻

小米澎湃OS 3上线2026马年春节限定水印

艺术要闻

书法大师的神作现身,引发网友热议!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版