网易首页 > 网易号 > 正文 申请入驻

谷歌Gemini最“小”的一次迭代,姚顺宇为何高呼“不可阻挡”?

0
分享至



人们还在津津乐道OpenAI和Anthropic两家公司的老板拒绝牵手,以至于握拳高举的滑稽画面,另一边,谷歌一个反手迭代了模型。



而且这次迭代,颇像是狼披上了羊皮——从模型后缀的数字序号看,这是谷歌最“小”的一次迭代,之前都是从Gemini 2.0到Gemini 2.5这样的迭代,这次从Gemini 3.0到Gemini 3.1Pro Preview。



但是这“.1”的迭代,进步得却不是一星半点。

谷歌CEO皮查伊(Sundar Pichai)表示,新代模型非常擅长处理“超级复杂的任务”。例如将复杂概念可视化、将数据综合成单一视图或者将创意项目变为现实。



姚顺宇也专门在X上发帖为Gemini 3.1 Pro Preview振臂,盛赞:

“Gemini不仅仅是一个好模型,更好的模型正在以不可阻挡之势到来。”



需要注意的是,大约一周前,谷歌推出了“专用推理模式”Gemini 3 Deep Think,专为科学、研究、工程等复杂、开放式问题设计。

Demini 3 Deep Think是姚顺宇从Anthropic跳槽到谷歌DeepMind之后参与的第一个项目。

而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千丝万缕的关系,官方表示“直接构建在Gemini 3 Deep Think的经验和技术之上”。相当于把Deep Think的核心推理提升技术“下放”到更广泛可用的Pro模型中。

01

Gemini 3.1 Pro Preview能做什么

既然这次新代模型的突出能力在处理“超级复杂”的任务,那么普通的对话放一边,谷歌的官方博文中,重点给出了几种示例秀肌肉。

第一,通过简单的提示词,创建SVG动画。

这个功能前代也有,但是对比之下进步明显。

比如提示词“生成一个SVG,描绘一只变色龙静静地坐在树枝上。让变色龙的眼睛跟随用户的鼠标光标在屏幕上移动。”

Gemini 3 Pro生成的动画背景是单一的白色,变色龙也看起来很呆板,甚至一侧有两只眼睛。

Gemini 3.1 Pro生成的动画则有丰富的“深绿色丛林”背景,变色龙身体有黄色斑纹和圆点装饰,眼睛立体,腿部姿势自然弯曲。



再比如提示词“生成一个滑动切换开关的SVG,当鼠标悬停在太阳图标上时,将其变成发光的月亮,同时背景从明亮平滑渐变到黑暗。采用干净的扁平UI风格。”

Gemini 3 Pro给出的动画虽然完成了任务,图标可以随鼠标变化,但是主图标单一,是一个缺角的圆形图案,用黄色代表白天,白色代表夜间。

Gemini 3.1 Pro生成的动画要复杂得多,白天是黄日白云,夜间是月牙繁星,两套图标丝滑变换。



总而言之,Gemini 3 Pro做的动画,让人想起多年前那个“学了三年动画”的梗。



而Gemini 3.1 Pro交付的SVG动画,已经达到了可以直接使用的效果。

第二,构建工程级别系统。

Gemini 3.1 Pro已经可以根据一段高复杂度的自然语言指令,直接生成一个集3D渲染、实时太阳星历计算、API异步拉取和物理光效于一体的完整交互系统,而不是简单页面demo。

谷歌给出的示例中,用户给出文字指令,Gemini 3.1 Pro生成了构建一个高保真、可交互的3D国际空间站(ISS)轨道追踪器。使用高分辨率的Blue Marble纹理贴图渲染一个精细的3D地球模型。



第三,生成交互式创意系统。

在另一个示例中,谷歌展示了Gemini 3.1 Pro编写的一个复杂的3D椋鸟群舞(murmuration)模拟。



它不仅生成视觉代码,还构建了一个沉浸式体验,用户可以通过手部追踪操控鸟群,并聆听根据鸟群运动变化的生成式配乐。

对于研究人员和设计师而言,这提供了一种强有力的方式来原型化感官丰富的界面。

第四,将文学主题转化为可运行的代码。

这个示例可能是普通人也最容易get到厉害之处的一个。



当被要求为艾米莉·勃朗特(Emily Brontë)的《呼啸山庄》(Wuthering Heights)打造一个现代个人作品集网站时,该模型并未简单地总结文本内容,而是基于小说的氛围与情绪进行推理,设计出一个简洁、当代感十足的界面,创建出一个捕捉主人公精神内核的网站。

抽象推理,这种能力的含金量不用多说。

02

到底有多强?

新代模型免不了过一下刷榜这一步。

而“.1”的升级,获得了动辄倍数跃升的成绩。

根据谷歌官方博文放出的测试结果,

在ARC-AGI-2基准测试中,3.1 Pro的验证得分达到了77.1%。比3 Pro的推理性能提升了一倍以上。

这也符合3.1 Pro的示例,因为这个测试评估的是模型解决全新逻辑模式的能力。用人话说就是,抽象推理解谜的能力。



此外,在GPQA Diamond(科学知识测试)中,3.1 Pro得分94.3%;智能体类基准MCP Atlas上,得分69.2%;真实网络浏览与信息整合能力的基准BrowseComp上,得分85.9%。

这些成绩,均超过了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2与GPT-5.3-Codex。

谷歌Gemini 3.1 Pro这次在ARC抽象推理和BrowseComp搜索任务上显著拉开差距,显示出明显的Agent倾向,而非单纯知识模型。

此外,专门做大模型基准测试与对比分析的第三方评测机构也发布了相关测试结果,大赞Gemini 3.1 Pro在构成Artificial Analysis Intelligence Index的10项评测中领先6项,相较于Gemini 3 Pro Preview在多项能力上显著提升,尤其是在推理与知识、代码能力以及降低幻觉方面进步最大。



而且,Gemini 3.1 Pro Preview保持较高的token效率。

运行完整Artificial Analysis Intelligence Index约需5700万token(比Gemini 3 Pro Preview多100万)。

这一token使用量低于其他在最大推理模式下运行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。

结合更低的单token定价,Gemini 3.1 Pro Preview在前沿模型中具有成本优势,运行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不过仍约为领先开源模型GLM-5的两倍。

03

能力翻倍价格不变

谷歌官方API定价显示,Gemini 3 Pro/3.1 Pro Preview的收费结构是按token计费的:

小于200k tokens时,每百万token输入约2美元,输出价格为4美元。大于200k tokens时,每百万token输入4美元,输出18美元。

在上下文缓存方面,根据提示词规模,每百万 token 收取 0.20 至 0.40 美元,外加每小时每百万 token 4.50 美元的存储费。

这个价格,整体上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起来,还是相对便宜的。 Opus这类模型输入/输出单价能在$5/$25左右。

尤其是结合当下它在模型能力上相当突出,这个价格更显得极具竞争力。

不要忘了,谷歌这次发布的只是“预览(Preview)”,谷歌很快就会推出正式版。而“.1”的迭代,谷歌也是在暗示其只是小秀肌肉。

目前,开发者可以在AI Studio、Gemini API、Gemini CLI、智能体开发平台Google Antigravity以及Android Studio使用3.1 Pro;企业用户则可以在Vertex AI和Gemini Enterprise使用;普通用户在Gemini应用和NotebookLM都能用上,不过后者仅限Pro和Ultra订阅用户。

各个社区里已经有不少人迫不及待上手操作,真的就和谷歌的演示一样,手搓了不少惊艳的玩意。

有人用Gemini 3.1 Pro 生成了一个可交互的 3D 机械级汽车悬架系统模拟器,包含真实几何结构、连杆约束与实时转向和行程计算,相当于把机械工程建模、物理逻辑和3D可视化一次性写成可运行工具,接近工程级原型能力。



有人用3.1 Pro制作“捉鬼猎人走过一栋闹鬼的房子”的循环动画,惊呼“Gemini没有开玩笑”。



总之,谷歌这回是真憋了个大招。

小小一个“.1”,却把推理和代码能力拉得飞起,定价还这么稳。

社区里满溢的手搓demo的热情,也证明了它的能力与实用性。

AI圈越来越现实了。模型再强,终究得看账单值不值。企业开始精打细算每个token的回报,开发者也得掂量掂量性价比。谷歌这一步,不仅是抢回王座,更是把竞争推向“谁更会过日子”的新阶段。

且看接下来,捏着拳头的Anthropic和OpenAI,以及xAI、Meta、微软等一众竞争对手该如何应对吧。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

高志凯:中国若真给日本断供,别说大蒜、洋葱,棺材板可能都没了

云舟史策
2026-02-19 07:16:32
快船险胜!马瑟林38+5+4,赛后鲍尔默怒吼庆祝,穆雷直接走入通道

快船险胜!马瑟林38+5+4,赛后鲍尔默怒吼庆祝,穆雷直接走入通道

担酒
2026-02-20 14:18:15
一商务车大年夜在上海市中心掉下1只帆布袋,沪上老夫妻拾起一看:不得了!赶快报警!真相出人意料

一商务车大年夜在上海市中心掉下1只帆布袋,沪上老夫妻拾起一看:不得了!赶快报警!真相出人意料

新民晚报
2026-02-20 15:13:11
保守派大法官主动退休!川普有望提名第四名大法官,创造历史

保守派大法官主动退休!川普有望提名第四名大法官,创造历史

大洛杉矶LA
2026-02-20 05:53:43
今年的微信拜年暴跌50%,这是为什么?

今年的微信拜年暴跌50%,这是为什么?

静思姐
2026-02-19 17:46:25
世界第一西班牙约战国足!邵佳一迎生涯大考,身价相差近百倍!

世界第一西班牙约战国足!邵佳一迎生涯大考,身价相差近百倍!

海浪星体育
2026-02-20 13:43:17
韩媒道歉:林孝埈对不起!你是韩国最有天赋选手 本无罪却被封杀

韩媒道歉:林孝埈对不起!你是韩国最有天赋选手 本无罪却被封杀

念洲
2026-02-20 08:21:33
开始了!《惊蛰无声》票房被吴京反超,张艺谋还是走到了这一步

开始了!《惊蛰无声》票房被吴京反超,张艺谋还是走到了这一步

得得电影
2026-02-20 14:55:42
这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

这种饮料正在摧毁你的胰岛细胞!很多糖尿病,都和这种饮料有关!

蜉蝣说
2026-01-29 14:46:50
国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

国防部直接把话挑明了,家里有满18岁男青年必须办的就是兵役登记

南权先生
2026-02-12 15:38:28
别追妖股!8只低估科技黑马,业绩连增横盘待风口

别追妖股!8只低估科技黑马,业绩连增横盘待风口

慧眼看世界哈哈
2026-02-20 12:50:57
认同吗,董宇辉给9位主播最大的体面不是高工资,不是高福利…

认同吗,董宇辉给9位主播最大的体面不是高工资,不是高福利…

福建平子
2026-02-19 06:17:35
湖北12死烟花爆燃:死者身份公布,大量内部照流出,责任人被控制

湖北12死烟花爆燃:死者身份公布,大量内部照流出,责任人被控制

博士观察
2026-02-19 11:41:09
广西局长一家被灭门,竟是小姨子作案,行刑前:这辈子值了

广西局长一家被灭门,竟是小姨子作案,行刑前:这辈子值了

悬案解密档案
2025-03-28 10:58:32
3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

林子说事
2026-02-19 23:46:29
香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

读懂世界历史
2026-02-12 21:48:53
17岁韩国首金得主崔佳恩三处骨折,对未直播夺冠“有点失望”

17岁韩国首金得主崔佳恩三处骨折,对未直播夺冠“有点失望”

懂球帝
2026-02-20 16:31:05
湖北烟花燃爆事故曝光 零星爆燃到全面爆燃仅十几秒

湖北烟花燃爆事故曝光 零星爆燃到全面爆燃仅十几秒

每日经济新闻
2026-02-20 11:11:43
大年初二,驻韩美军机群在黄海与我军机对峙!韩军方向美表达忧虑

大年初二,驻韩美军机群在黄海与我军机对峙!韩军方向美表达忧虑

倾世璃歌
2026-02-20 18:32:01
九大开幕!朝鲜式社会主义全面发展期进入第二阶段

九大开幕!朝鲜式社会主义全面发展期进入第二阶段

IN朝鲜
2026-02-20 16:51:06
2026-02-20 19:27:00
字母榜 incentive-icons
字母榜
让未来不止于大。
2241文章数 8042关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

歌曲被王菲春晚选中 原唱感激:王菲让这首歌充满神性

头条要闻

歌曲被王菲春晚选中 原唱感激:王菲让这首歌充满神性

体育要闻

宁忠岩:我拿过那么多银牌和铜牌 现在终于赢了

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

艺术
教育
旅游
亲子
游戏

艺术要闻

李白若在世,诺贝尔文学奖会是他的囊中物吗?

教育要闻

“院校专业组”志愿怎么填?2026年最新填报步骤与策略

旅游要闻

看表演、赏花灯、踏云梯 各地精彩活动让年味儿更浓

亲子要闻

宝蓝用新鲜水果和牛奶做了冰淇淋,好玩又好吃~

《生化危机9》结局剧透已在网络散布 卡普空全力制止

无障碍浏览 进入关怀版