网易首页 > 网易号 > 正文 申请入驻

谷歌夺回王座:Gemini 3.1 Pro来了!姚顺宇:后面还有更好的

0
分享至



机器之心编辑部

上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3.1 Pro。



参与了 Gemini 3 Deep Think 研究的姚顺宇也发推介绍了这项新突破,并表示:「后续还会有更好的模型源源不断地涌现」。



谷歌表示,基于 Gemini 3 系列,3.1 Pro 在核心推理能力上实现了进一步跃升。针对复杂问题的求解,3.1 Pro 提供了一个更聪明、更强大的能力基准。这一点也体现在团队的多项严格基准测试进展中。

在 ARC-AGI-2(一个评估模型解决全新逻辑模式能力的基准测试)上,3.1 Pro 取得了经验证的 77.1% 成绩,其推理性能是 3 Pro 的两倍以上



此外,内部基准测试表明,3.1 Pro 在各个专业领域都具有很强的竞争力:

  • 科学知识:在 GPQA 钻石级测试中得分为 94.3%;
  • 编码:在 LiveCodeBench Pro 上 Elo 得分为 2887,在 SWE-Bench Verified 上得分为 80.6%;
  • 多模态理解:在 MMMLU 测试中达到了 92.6%。

这些技术进步不仅仅是渐进式的,它们代表了模型处理「思考」token 和长期任务方式的改进,为构建自主智能体的开发者提供了更可靠的基础。

来自第三方公司 Artificial Analysis 的评估表明,谷歌的 Gemini 3.1 Pro 已经跃居榜首,再次成为世界上功能最强大、性能最佳的 AI 模型。



它的得分领先 Claude Opus 4.6 4 分,而运行成本却不到后者的一半。



而 Gemini 3.1 Pro 的各项强大功能,意味着它可以将复杂主题可视化、整理零散数据,并将创意项目化为现实。

为了呈现这种能力跃升,谷歌制作了一个经典的「鹈鹕骑自行车」SVG,与之前的效果进行对比,还测试了其他动物的效果。可以说,谷歌基本已经「杀死」了比赛。



目前,谷歌正在将 3.1 Pro 部署到面向消费者和开发者的各类产品中,以让这一智能进步进入到大家的日常应用中。

即日起,3.1 Pro 将陆续上线:

  • 面向开发者:通过 Google AI Studio 中的 Gemini API、Gemini CLI、智能体开发平台 Google Antigravity,以及 Android Studio 提供预览;
  • 面向企业:上线 Vertex AI 和 Gemini Enterprise;
  • 面向消费者:通过 Gemini 应用程序(APP)和 NotebookLM 推出。

资料显示,谷歌的企业合作伙伴已经开始整合 3.1 Pro 预览版,并称其在可靠性和效率方面有了显著提升。

Databricks 首席技术官 Hanlin Tang 称,3.1 Pro 在一项针对表格和非结构化数据进行基于事实推理的基准测试 OfficeQA 上取得了「同类最佳结果」。Cartwheel 联合创始人 Andrew Carr 也强调,该模型「对 3D 变换的理解有了显著提升」,并指出它解决了 3D 动画管线中长期存在的旋转顺序漏洞等。

值得注意的是,3.1 Pro 的定价稍显复杂:

  • 输入价格:提示词不超过 20 万 token,每百万 token 收费 2.00 美元;提示词超过 20 万 token,每百万 token 收费 4.00 美元。
  • 输出价格:提示词不超过 20 万 token,每百万 token 收费 12.00 美元;提示词超过 20 万 token,每百万 token 收费 18.00 美元。
  • 上下文缓存:根据提示词规模,每百万 token 收取 0.20 至 0.40 美元,外加每小时每百万 token 4.50 美元的存储费。
  • 联网搜索(Grounding):每月前 5000 次提示免费,之后每 1000 次搜索查询收费 14 美元。

3.1 Pro,好用吗?

谷歌表示,3.1 Pro 的设计初衷,就是为了应对那些「简单答案」解决不了的问题。它将先进的推理能力,转化为帮你攻克最棘手挑战的实用工具。这种更强的智能,能在实际应用中帮上大忙 —— 无论是想通过清晰的图文讲解搞懂一个复杂概念,想把零散的数据整合成一目了然的视图,还是想给创意项目注入活力,它都能助你一臂之力。

以下是 3.1 Pro 的一些应用效果展示:

1、基于代码的动画:3.1 Pro 可以直接根据文字提示,生成网站可用的、自带动效的 SVG 图片。由于这些动画是用纯代码而非像素构建的,所以无论放大到什么尺寸都依然清晰,并且和传统视频相比,文件体积也小得惊人。

2、复杂系统整合:3.1 Pro 能运用其强大的推理能力,在复杂的 API 接口和用户友好的设计之间架起桥梁。比如在这个例子中,该模型就搭建了一个实时航空仪表盘,成功接入公共遥测数据流,将国际空间站的运行轨道直观地呈现出来。

3、交互式设计:3.1 Pro 能编写出复杂的 3D 椋鸟群飞模拟代码。它不仅能生成视觉代码,还能打造出沉浸式的互动体验 —— 用户可以通过手势追踪来控制鸟群的飞行,同时听到根据鸟群动作实时变化的生成式配乐。对于研究人员和设计师来说,这为打造感官丰富的交互界面原型,提供了一种强大的新途径。

4、创意编程:3.1 Pro 能将文学主题转化为实用的代码。当要求它为艾米莉・勃朗特的《呼啸山庄》构建一个现代风格的个人作品集网站时,该模型并非只是简单复述文本内容。它会深入理解小说中那种充满氛围感的基调,并以此构思出一个时髦又现代的界面,最终打造出一个能精准捕捉主人公精神内核的网站。

下一步计划

谷歌表示,今天推出的 Gemini 3.1 Pro 是一个预览版,之后将在自主工作流等领域寻求进一步突破,不久后,会正式全面开放给大家使用。

从今天开始,Gemini app 中的 3.1 Pro 版本将逐步面向 Google AI Pro 和 Ultra 套餐的用户开放更高的使用额度。同时,3.1 Pro 也已登陆 NotebookLM,专供 Pro 和 Ultra 用户使用。对于开发者和企业用户,现在可以在 Gemini API 中通过 AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI 和 Android Studio 平台抢先体验 3.1 Pro 的预览版。

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

https://x.com/GoogleDeepMind/status/2024516464892334129

https://x.com/ArtificialAnlys/status/2024518545510662602

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“坏胆固醇”下降10%!Nature子刊:仅连续吃2天燕麦,就能显著降低胆固醇,且效果至少持续6周

“坏胆固醇”下降10%!Nature子刊:仅连续吃2天燕麦,就能显著降低胆固醇,且效果至少持续6周

梅斯医学
2026-02-20 07:53:33
反转!初中生扶摔倒老人遭索赔22万后续: 细节曝光,确实被吓到了

反转!初中生扶摔倒老人遭索赔22万后续: 细节曝光,确实被吓到了

离离言几许
2026-02-20 10:17:52
军令如山!3月1日起全军实行终身负责制,从严治军强根基

军令如山!3月1日起全军实行终身负责制,从严治军强根基

我心纵横天地间
2026-02-19 23:15:18
特朗普将解密外星生命相关文件,实物黄金即将迎来宇宙级暴涨

特朗普将解密外星生命相关文件,实物黄金即将迎来宇宙级暴涨

东方豪侠
2026-02-20 14:28:41
深夜突发,三大指数盘中直线拉升!美国最高法院裁定特朗普政府大规模关税政策违法,美国或需退还1750亿美元!特朗普:判决可耻丨美股开盘

深夜突发,三大指数盘中直线拉升!美国最高法院裁定特朗普政府大规模关税政策违法,美国或需退还1750亿美元!特朗普:判决可耻丨美股开盘

每日经济新闻
2026-02-21 00:01:05
超越国界!苏翊鸣激动拥抱日本女选手,感恩日本教练培养

超越国界!苏翊鸣激动拥抱日本女选手,感恩日本教练培养

米修体育
2026-02-20 16:12:13
别再花冤枉钱!iPhone自带多款高效应用,全部免费更实用

别再花冤枉钱!iPhone自带多款高效应用,全部免费更实用

小柱解说游戏
2026-02-20 09:16:19
大反转!雷军宣布停产,一代神车没了!

大反转!雷军宣布停产,一代神车没了!

财经要参
2026-02-18 22:21:37
短道收官日:女子1500米张楚桐、金吉莉同组

短道收官日:女子1500米张楚桐、金吉莉同组

懂球帝
2026-02-20 17:01:32
谷爱凌回击万斯批评:很多人代表他国参赛,我只是他们的出气筒

谷爱凌回击万斯批评:很多人代表他国参赛,我只是他们的出气筒

全景体育V
2026-02-20 12:09:01
9年前,那个3岁识千字、6岁夺央视冠军的神童王恒屹,如今怎样

9年前,那个3岁识千字、6岁夺央视冠军的神童王恒屹,如今怎样

娱说瑜悦
2026-02-19 17:50:07
冬奥会奇迹!金牌夫妇“诞生”,王心迪徐梦桃2天同项目连获金牌

冬奥会奇迹!金牌夫妇“诞生”,王心迪徐梦桃2天同项目连获金牌

奥拜尔
2026-02-20 21:59:01
研究显示:“猎鹰9”火箭解体致高空大气锂原子浓度飙升10倍

研究显示:“猎鹰9”火箭解体致高空大气锂原子浓度飙升10倍

界面新闻
2026-02-20 16:34:02
连涨3天,电影《镖人》成春节档首部实现单日票房逆跌新片,其主演吴京电影票房成绩突破350亿元,位列华语男演员票房榜第二位

连涨3天,电影《镖人》成春节档首部实现单日票房逆跌新片,其主演吴京电影票房成绩突破350亿元,位列华语男演员票房榜第二位

大风新闻
2026-02-20 10:26:04
王心迪空中技巧夺冠!对手抱头,王心迪跪地仰天,教练比1庆祝

王心迪空中技巧夺冠!对手抱头,王心迪跪地仰天,教练比1庆祝

篮球资讯达人
2026-02-20 22:07:07
美联储官员发出警告:AI如果继续快速发展,将导致许多人终身失业

美联储官员发出警告:AI如果继续快速发展,将导致许多人终身失业

爆角追踪
2026-02-20 10:53:11
13球6助攻!曝阿尔瓦雷斯7000万欧加盟巴萨,马竞降价出售新核心

13球6助攻!曝阿尔瓦雷斯7000万欧加盟巴萨,马竞降价出售新核心

夏侯看英超
2026-02-21 01:16:59
女子购买泰康在线“慢病百万医疗险”,理赔遭拒后保单莫名消失;保险公司存在哪些问题?律师说法

女子购买泰康在线“慢病百万医疗险”,理赔遭拒后保单莫名消失;保险公司存在哪些问题?律师说法

中国能源网
2026-02-20 11:33:16
7名中国游客沉入贝加尔湖溺亡,该旅游团涉嫌未正式注册,目击者:疑因司机强闯冰面裂缝;系1个月内第二起涉中国游客安全事故

7名中国游客沉入贝加尔湖溺亡,该旅游团涉嫌未正式注册,目击者:疑因司机强闯冰面裂缝;系1个月内第二起涉中国游客安全事故

大象新闻
2026-02-20 21:52:07
2月20日俄乌最新:无比强硬的停火条件

2月20日俄乌最新:无比强硬的停火条件

西楼饮月
2026-02-20 20:02:11
2026-02-21 01:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12323文章数 142569关注度
往期回顾 全部

数码要闻

苹果macOS 26.3代码曝光平价MacBook和新显示器

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

艺术
亲子
手机
健康
公开课

艺术要闻

你绝对不想错过的石涛五十幅国画作品!

亲子要闻

春节儿童吃撑了怎么办?家长可用山楂、麦芽煮水代茶饮

手机要闻

春节后影像机皇之争:OPPO Find X9 Ultra与vivo X300 Ultra规格曝光

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版