网易首页 > 网易号 > 正文 申请入驻

Gemini 3.1 Pro 曝光,能力翻倍价格不变,谷歌想重新定义 AI 竞争规则

0
分享至


推理能力翻倍,价格不变,这一次 Google 是真的想重新定义 AI 竞争的规则。


作者|桦林舞王

编辑|靖宇

马年「AI 春运」赛程过半,OpenAI、Anthropic、阿里等玩家相继拿出新活儿,现在,Google 也正式加入!

当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。

这一次,Google 没有玩什么花哨的概念,直接用数据说话。

在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。

77.1% 对比 31.1%,这不是渐进式改进,这是推理能力的翻倍突破

更让人意外的是,Google 选择了一个近乎「反商业」的策略:价格不涨。Gemini 3.1 Pro 保持了与 Gemini 3 Pro 完全相同的定价结构——相当于给所有API用户免费升级了推理能力

JetBrains 的 AI 总监 Vladislav Tankov 在测试后直言:相比之前版本有 15% 的质量改进,「更强、更快……且更高效,需要的输出 tokens 更少」。

这种「暴力美学」式的升级,让我想起了早期 Google 的做派——用技术说话,用实力碾压。

这次,Google 能凭借 Gemini 3.1 Pro,继续惊艳世界吗?

01

「.1」版本号的野心

细心的人可能注意到,这是 Google 第一次使用「.1」这样的增量版本号

在软件行业,「.1」通常意味着重要的功能更新,但不是颠覆性的架构重构。Google 选择 3.1 而不是 4.0,其实在向市场传递一个信号:

我们还有更大的招数没出


Gemini 3.1 Pro 与自家和友商模型数据对比|图片来源:9to5Google

从企业客户的反馈来看,这个「.1」的威力确实不小。

Databricks 的 CTO 报告说,新模型在 OfficeQA 基准上取得了「同类最佳的结果」。Cartwheel 的联合创始人更是直接指出,模型对 3D 变换的理解有了「显著提升」,解决了 3D 动画管道中长期存在的旋转顺序问题。

Box AI 的企业评估数据更加直观:在医疗和生命科学领域,准确性从 47% 跃升到 67%;在法律任务中,准确性从 57% 提升到 74%。

这些不是实验室里的跑分游戏,而是真实商业场景中的能力验证。

02

AI 竞争进入「推理纪元」

如果说过去一年的 AI 竞争是「谁更聪明」的比拼,那么 Gemini 3.1 Pro 的发布策略,可能正在把游戏规则拉向「谁更划算」

在大多数基准测试中,Gemini 3.1 Pro 都领先于 Anthropic 的 Opus 4.6 和 OpenAI 的 GPT-5.2,但价格却是 Opus 4.6 的一半。这种性价比优势,对于大量使用 AI API 的企业客户来说,吸引力是致命的。

一位开发者在社区分享了一个令人印象深刻的案例:他用单个提示让 Gemini 3.1 Pro 构建了一个功能完整的 Windows 11 风格网络操作系统,包括文本编辑器、Python 终端、代码编辑器、文件管理器、绘画应用和可玩游戏。

这种「一个提示解决复杂问题」的能力,正是推理模型的核心价值所在。

当然,Gemini 3.1 Pro 也不是完美无缺。在 GDPval-AA 这个衡量真实世界经济任务的基准测试中,它的得分为 1317 分,明显低于 Anthropic Sonnet 4.6 的 1633 分。这提醒我们,即使是最先进的 AI 模型,在处理复杂现实问题时仍有局限性。


Gemini 3.1 Pro 在设计上也更有「品味」了|图片来源:Google

VentureBeat 的分析师一针见血地指出:「Google 加倍投入核心推理和 ARC-AGI-2 等专业基准,表明 AI 竞赛的下一阶段,将由能够思考问题的模型赢得,而不仅仅是预测下一个词。」

这句话道出了当前 AI 竞争的本质变化。

过去两年,我们见证了 ChatGPT 从「会聊天的 AI」进化为「会推理的 AI」,见证了 Claude 从「安全的助手」变成「深度思考的伙伴」。

现在,Google 用 Gemini 3.1 Pro 告诉市场:推理能力才,是 AI 模型的核心护城河

从技术角度看,Gemini 3.1 Pro 与 Google 的新型代理开发平台 Antigravity 深度集成,开发者可以切换不同的「推理预算」,在速度和准确性之间找到平衡。这种灵活性,可能是未来 AI 应用开发的新范式。

从商业角度看,Google 选择「性能翻倍、价格不变」的策略,实际上是在用规模经济对抗技术溢价。这背后的逻辑很简单:我有足够的资源和效率优势,可以用更低的成本提供更好的服务。

这场 AI 军备竞赛,正在从「技术炫技」回归到「商业本质」。

Gemini 3.1 Pro 的发布,让我想起了那个曾经「不作恶」的 Google——用技术改变世界,用创新降低门槛。虽然这家公司在过去几年经历了不少争议,但在 AI 这个关键战场上,它似乎正在找回自己最擅长的节奏。

当然,OpenAI 和 Anthropic 不会坐以待毙。这场推理能力的军备竞赛才刚刚开始。

*头图来源:Google

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你觉得 Google 能凭借

Gemini 3.1 Pro 重夺 AI 王座吗?


Sam Altman:未来物质会极度丰饶,人类的注意力才是稀缺品。

点赞关注极客公园视频号,

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

3月开始中国或将迎来四大降价潮:除房价以外,这三类也要降价了

爱看剧的阿峰
2026-02-19 04:14:11
从“毛姐”到无人问津:她曾坐拥14亿,如今饭店周末仅两三桌客人

从“毛姐”到无人问津:她曾坐拥14亿,如今饭店周末仅两三桌客人

牛牛叨史
2026-02-05 22:46:34
竟然有这么多人生回报率高的小习惯!网友: 简单的事情要重复做

竟然有这么多人生回报率高的小习惯!网友: 简单的事情要重复做

夜深爱杂谈
2026-02-19 22:50:03
利空来袭!集体下跌!

利空来袭!集体下跌!

中国基金报
2026-02-20 08:23:32
续航 + 230km / 隔音大升级!Model Y 悄悄上新,专治家庭出行痛点

续航 + 230km / 隔音大升级!Model Y 悄悄上新,专治家庭出行痛点

阿芒娱乐说
2026-02-20 02:28:46
42岁王濛再破天花板!退役12年,再次让李琰和整个冰坛“沉默”了

42岁王濛再破天花板!退役12年,再次让李琰和整个冰坛“沉默”了

翰飞观事
2026-02-16 11:29:39
72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

72万个充电桩,年入40亿,常州夫妇边赚钱边收割,如今要上市了

三农老历
2026-02-20 02:39:16
战满三盘遭淘汰!辛纳爆冷不敌05后新星,无缘多哈站四强

战满三盘遭淘汰!辛纳爆冷不敌05后新星,无缘多哈站四强

全景体育V
2026-02-20 06:54:03
陈慧琳晒过年全家福,老公刘建浩谢顶变光头,俩儿子身高都超180

陈慧琳晒过年全家福,老公刘建浩谢顶变光头,俩儿子身高都超180

乐悠悠娱乐
2026-02-19 13:29:09
春晚这一夜,“跌落神坛”的王菲,让所有人见识了她的江湖地位!

春晚这一夜,“跌落神坛”的王菲,让所有人见识了她的江湖地位!

深度解析热点
2026-02-18 15:13:48
斯诺克赛程:决出4强,赵心童PK墨菲,或保持不败,塞尔比翻车?

斯诺克赛程:决出4强,赵心童PK墨菲,或保持不败,塞尔比翻车?

刘姚尧的文字城堡
2026-02-20 07:40:37
杜富国晋升二级军士长,距离“兵王”只差一步,妻子待遇来了​

杜富国晋升二级军士长,距离“兵王”只差一步,妻子待遇来了​

阿器谈史
2026-01-14 20:47:10
断供来了,斯洛伐克真扛不住了,接下来咋办?

断供来了,斯洛伐克真扛不住了,接下来咋办?

奇思妙想生活家
2026-02-20 06:04:47
发现一个奇怪现象:喜欢把家里打扫得很干净的人,往往会有这3种命运,并非迷信

发现一个奇怪现象:喜欢把家里打扫得很干净的人,往往会有这3种命运,并非迷信

LULU生活家
2025-12-23 18:33:20
随着吉达国民4-1,沙特联最新积分榜:C罗主队跌至第三

随着吉达国民4-1,沙特联最新积分榜:C罗主队跌至第三

侧身凌空斩
2026-02-20 07:40:39
国际雪联主席评苏翊鸣冬奥再夺冠:对中国滑雪发展意义重大

国际雪联主席评苏翊鸣冬奥再夺冠:对中国滑雪发展意义重大

澎湃新闻
2026-02-19 10:32:06
为何奉劝老年人最好不要独居?65岁大妈:一个人住久了没安全感

为何奉劝老年人最好不要独居?65岁大妈:一个人住久了没安全感

热心柚子姐姐
2026-02-19 11:45:23
65岁大爷找老伴遭对方嫌弃退休金太少,大爷怒怼:8千你还嫌少?

65岁大爷找老伴遭对方嫌弃退休金太少,大爷怒怼:8千你还嫌少?

惟来
2026-02-19 11:58:24
1965年毛主席批判《海瑞罢官》,田家英:那以后没人敢研究历史了

1965年毛主席批判《海瑞罢官》,田家英:那以后没人敢研究历史了

大运河时空
2026-02-18 11:35:03
弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

弘一法师:不要太操心你的孩子和在意的亲人,每个人都有自己的命

木言观
2026-01-18 13:56:24
2026-02-20 13:31:00
极客公园
极客公园
让最棒的创新成为头条
11812文章数 78764关注度
往期回顾 全部

数码要闻

4.769 GHz!AMD Radeon RX 9060 XT刷新显卡超频纪录

头条要闻

《惊蛰无声》展示国安干警工作模式 专家回应泄密担忧

头条要闻

《惊蛰无声》展示国安干警工作模式 专家回应泄密担忧

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
艺术
教育
家居
亲子

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

李白若在世,诺贝尔文学奖会是他的囊中物吗?

教育要闻

2026年高考十大热门专业前瞻分析(下):五大经典专业深度解读

家居要闻

本真栖居 爱暖伴流年

亲子要闻

自从生了妹妹优奈后,海渡阳翔两个哥哥有什么变化?

无障碍浏览 进入关怀版