网易首页 > 网易号 > 正文 申请入驻

谷歌夺回王座:Gemini 3.1 Pro来了!姚顺宇:后面还有更好的

0
分享至



机器之心编辑部

上周,谷歌发布了 Gemini 3 Deep Think 的一次重大更新,以应对当今科学、研究和工程领域的复杂挑战。而就在刚刚,谷歌正式推出支撑这些突破的升级版核心智能:Gemini 3.1 Pro。



参与了 Gemini 3 Deep Think 研究的姚顺宇也发推介绍了这项新突破,并表示:「后续还会有更好的模型源源不断地涌现」。



谷歌表示,基于 Gemini 3 系列,3.1 Pro 在核心推理能力上实现了进一步跃升。针对复杂问题的求解,3.1 Pro 提供了一个更聪明、更强大的能力基准。这一点也体现在团队的多项严格基准测试进展中。

在 ARC-AGI-2(一个评估模型解决全新逻辑模式能力的基准测试)上,3.1 Pro 取得了经验证的 77.1% 成绩,其推理性能是 3 Pro 的两倍以上



此外,内部基准测试表明,3.1 Pro 在各个专业领域都具有很强的竞争力:

  • 科学知识:在 GPQA 钻石级测试中得分为 94.3%;
  • 编码:在 LiveCodeBench Pro 上 Elo 得分为 2887,在 SWE-Bench Verified 上得分为 80.6%;
  • 多模态理解:在 MMMLU 测试中达到了 92.6%。

这些技术进步不仅仅是渐进式的,它们代表了模型处理「思考」token 和长期任务方式的改进,为构建自主智能体的开发者提供了更可靠的基础。

来自第三方公司 Artificial Analysis 的评估表明,谷歌的 Gemini 3.1 Pro 已经跃居榜首,再次成为世界上功能最强大、性能最佳的 AI 模型。



它的得分领先 Claude Opus 4.6 4 分,而运行成本却不到后者的一半。



而 Gemini 3.1 Pro 的各项强大功能,意味着它可以将复杂主题可视化、整理零散数据,并将创意项目化为现实。

为了呈现这种能力跃升,谷歌制作了一个经典的「鹈鹕骑自行车」SVG,与之前的效果进行对比,还测试了其他动物的效果。可以说,谷歌基本已经「杀死」了比赛。



目前,谷歌正在将 3.1 Pro 部署到面向消费者和开发者的各类产品中,以让这一智能进步进入到大家的日常应用中。

即日起,3.1 Pro 将陆续上线:

  • 面向开发者:通过 Google AI Studio 中的 Gemini API、Gemini CLI、智能体开发平台 Google Antigravity,以及 Android Studio 提供预览;
  • 面向企业:上线 Vertex AI 和 Gemini Enterprise;
  • 面向消费者:通过 Gemini 应用程序(APP)和 NotebookLM 推出。

资料显示,谷歌的企业合作伙伴已经开始整合 3.1 Pro 预览版,并称其在可靠性和效率方面有了显著提升。

Databricks 首席技术官 Hanlin Tang 称,3.1 Pro 在一项针对表格和非结构化数据进行基于事实推理的基准测试 OfficeQA 上取得了「同类最佳结果」。Cartwheel 联合创始人 Andrew Carr 也强调,该模型「对 3D 变换的理解有了显著提升」,并指出它解决了 3D 动画管线中长期存在的旋转顺序漏洞等。

值得注意的是,3.1 Pro 的定价稍显复杂:

  • 输入价格:提示词不超过 20 万 token,每百万 token 收费 2.00 美元;提示词超过 20 万 token,每百万 token 收费 4.00 美元。
  • 输出价格:提示词不超过 20 万 token,每百万 token 收费 12.00 美元;提示词超过 20 万 token,每百万 token 收费 18.00 美元。
  • 上下文缓存:根据提示词规模,每百万 token 收取 0.20 至 0.40 美元,外加每小时每百万 token 4.50 美元的存储费。
  • 联网搜索(Grounding):每月前 5000 次提示免费,之后每 1000 次搜索查询收费 14 美元。

3.1 Pro,好用吗?

谷歌表示,3.1 Pro 的设计初衷,就是为了应对那些「简单答案」解决不了的问题。它将先进的推理能力,转化为帮你攻克最棘手挑战的实用工具。这种更强的智能,能在实际应用中帮上大忙 —— 无论是想通过清晰的图文讲解搞懂一个复杂概念,想把零散的数据整合成一目了然的视图,还是想给创意项目注入活力,它都能助你一臂之力。

以下是 3.1 Pro 的一些应用效果展示:

1、基于代码的动画:3.1 Pro 可以直接根据文字提示,生成网站可用的、自带动效的 SVG 图片。由于这些动画是用纯代码而非像素构建的,所以无论放大到什么尺寸都依然清晰,并且和传统视频相比,文件体积也小得惊人。

2、复杂系统整合:3.1 Pro 能运用其强大的推理能力,在复杂的 API 接口和用户友好的设计之间架起桥梁。比如在这个例子中,该模型就搭建了一个实时航空仪表盘,成功接入公共遥测数据流,将国际空间站的运行轨道直观地呈现出来。

3、交互式设计:3.1 Pro 能编写出复杂的 3D 椋鸟群飞模拟代码。它不仅能生成视觉代码,还能打造出沉浸式的互动体验 —— 用户可以通过手势追踪来控制鸟群的飞行,同时听到根据鸟群动作实时变化的生成式配乐。对于研究人员和设计师来说,这为打造感官丰富的交互界面原型,提供了一种强大的新途径。

4、创意编程:3.1 Pro 能将文学主题转化为实用的代码。当要求它为艾米莉・勃朗特的《呼啸山庄》构建一个现代风格的个人作品集网站时,该模型并非只是简单复述文本内容。它会深入理解小说中那种充满氛围感的基调,并以此构思出一个时髦又现代的界面,最终打造出一个能精准捕捉主人公精神内核的网站。

下一步计划

谷歌表示,今天推出的 Gemini 3.1 Pro 是一个预览版,之后将在自主工作流等领域寻求进一步突破,不久后,会正式全面开放给大家使用。

从今天开始,Gemini app 中的 3.1 Pro 版本将逐步面向 Google AI Pro 和 Ultra 套餐的用户开放更高的使用额度。同时,3.1 Pro 也已登陆 NotebookLM,专供 Pro 和 Ultra 用户使用。对于开发者和企业用户,现在可以在 Gemini API 中通过 AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI 和 Android Studio 平台抢先体验 3.1 Pro 的预览版。

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

https://x.com/GoogleDeepMind/status/2024516464892334129

https://x.com/ArtificialAnlys/status/2024518545510662602

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
冯小刚新片《抓特务》厦门低调展映无龙标完整版:内行看见的,不只是谍战。。。。。。

冯小刚新片《抓特务》厦门低调展映无龙标完整版:内行看见的,不只是谍战。。。。。。

手工制作阿歼
2026-06-04 01:06:08
北京大兴机场航空业务部副总经理王强:机场正在成为旅客认识一座城市的第一站或最后一站

北京大兴机场航空业务部副总经理王强:机场正在成为旅客认识一座城市的第一站或最后一站

北京商报
2026-06-03 21:42:08
胡歌拿下白玉兰视帝,于和伟陪跑真可惜

胡歌拿下白玉兰视帝,于和伟陪跑真可惜

情感大头说说
2026-06-03 19:18:27
一男子在湖南邵阳县街头殴打路人,警方通报:嫌疑人已抓获

一男子在湖南邵阳县街头殴打路人,警方通报:嫌疑人已抓获

界面新闻
2026-06-03 19:46:57
机器人“搭子”来了!全球首款全尺寸超仿生人形机器人开始预售

机器人“搭子”来了!全球首款全尺寸超仿生人形机器人开始预售

深圳晚报
2026-06-03 08:01:52
直言不讳!英伟达CEO黄仁勋称:台湾缺电!国台办回应来了……

直言不讳!英伟达CEO黄仁勋称:台湾缺电!国台办回应来了……

王爷说图表
2026-06-03 17:21:34
筹备3年!周星驰电影《女足》携手两大顶流,压力给到贾玲了

筹备3年!周星驰电影《女足》携手两大顶流,压力给到贾玲了

悠悠说世界
2026-06-03 15:41:07
哈马斯宣布:愿移交加沙所有治理权!以军遭无人机袭击,多人受伤,真主党:不接受“部分停火”!遭特朗普怒斥“疯了”,以总理强硬表态

哈马斯宣布:愿移交加沙所有治理权!以军遭无人机袭击,多人受伤,真主党:不接受“部分停火”!遭特朗普怒斥“疯了”,以总理强硬表态

每日经济新闻
2026-06-03 12:38:20
迈阿密泳装周开幕,超模姐妹同台,封面女郎自曝“真实宣言”

迈阿密泳装周开幕,超模姐妹同台,封面女郎自曝“真实宣言”

影视情报室
2026-06-03 01:40:17
腿部出现4个症状,提示一种死亡率极高的疾病已经盯上你了

腿部出现4个症状,提示一种死亡率极高的疾病已经盯上你了

凤凰卫视
2026-06-02 18:32:05
男篮最强高塔!2米26徐昕热身赛砍10+8+4帽,多家美国大学想要他

男篮最强高塔!2米26徐昕热身赛砍10+8+4帽,多家美国大学想要他

林小湜体育频道
2026-06-03 23:44:04
车圈大地震!放弃华为智驾,赛力斯联手字节造车

车圈大地震!放弃华为智驾,赛力斯联手字节造车

蒋东文
2026-06-02 20:44:55
《教父》早就讲透:男人真正吸引异性的,从来不是甜言蜜语,也不是吃喝玩乐,而是这两种底层能力

《教父》早就讲透:男人真正吸引异性的,从来不是甜言蜜语,也不是吃喝玩乐,而是这两种底层能力

心理观察局
2026-06-03 07:39:04
官方通报苏州一废品回收仓库发生火灾:火已扑灭,2人灼伤已送医

官方通报苏州一废品回收仓库发生火灾:火已扑灭,2人灼伤已送医

半岛晨报
2026-06-03 18:47:08
王楚钦上任仅24小时,丑闻频发引争议

王楚钦上任仅24小时,丑闻频发引争议

萧狡科普解说
2026-06-03 13:03:31
为什么往死里扫黄?网友分享太真实了,一次说透

为什么往死里扫黄?网友分享太真实了,一次说透

另子维爱读史
2026-05-27 20:16:03
圣彼得堡经济论坛召开之际,乌克兰无人机来了

圣彼得堡经济论坛召开之际,乌克兰无人机来了

山河路口
2026-06-03 14:23:11
9年投入5800万!董路没教练证却带足球小将夺冠 孙继海:马戏团

9年投入5800万!董路没教练证却带足球小将夺冠 孙继海:马戏团

念洲
2026-06-03 06:51:28
“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

江山挥笔
2026-06-02 18:47:02
两万多买的联动云下线“观致5”,深夜莫名被拖走,数十名车主陷维权困局

两万多买的联动云下线“观致5”,深夜莫名被拖走,数十名车主陷维权困局

大风新闻
2026-06-03 11:40:10
2026-06-04 05:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13159文章数 142660关注度
往期回顾 全部

数码要闻

郭明錤:苹果眼镜路线图生变 Vision Pro后续版本被砍

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

健康
教育
艺术
数码
时尚

违规干细胞抗衰美容,为何肆无忌惮

教育要闻

根据题意,求这些付哈各代表了什么数字

艺术要闻

二十年前割麦的场景

数码要闻

高通CEO安蒙:“2026年是智能体之年”,Token成AI新货币

月经、初潮与生育真相,那些藏在动画片里的性启蒙

无障碍浏览 进入关怀版