网易首页 > 网易号 > 正文 申请入驻

刚刚,让谷歌翻身的Gemini 3,上线Flash版

0
分享至




机器之心编辑部

OpenAI 还在卷跑分,谷歌已经打穿应用层了。

北京时间周四零点,Google 发布了高速、低成本模型 Gemini 3 Flash,作为其今年大模型领域的收官之作。

该模型基于上个月发布的 Gemini 3,明显带有抢 OpenAI 风头的意味。与此同时,Google 还将 Gemini 3 Flash 设为 Gemini 应用和搜索 AI 模式中的默认模型。

这款新的 Flash 模型距离 Google 发布 Gemini 2.5 Flash 仅过去六个月,但在性能上实现了显著跃升。基准测试显示,Gemini 3 Flash 相比前代模型有大幅提升,并在部分指标上达到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。

在智能 / 成本上,它成为了全球性价比最高的模型。



例如,在 Humanity’s Last Exam 基准测试中(该测试旨在评估模型在不同专业领域的综合能力),在不使用工具的情况下,Gemini 3 Flash 取得了 33.7% 的成绩。作为对比,Gemini 3 Pro 的得分为 37.5%,Gemini 2.5 Flash 为 11%,而新发布的 GPT-5.2 则为 34.5%。

与此同时,谷歌也将这款新模型在全球范围内向数以百万计的用户开放,覆盖以下渠道:

  1. 开发者:通过 Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的智能体开发平台 Google Antigravity
  2. 所有用户:通过 Gemini 应用,以及搜索中的 AI 模式(AI Mode in Search)
  3. 企业用户:通过 Vertex AI 和 Gemini Enterprise

Gemini 3 Flash 发布后,大家第一时间进行了使用测试,发现这个 AI 回答问题的响应速度基本都在 1 秒以内,的确是跟搜索引擎一样快。而且它在回答问题的时候相比以前更加详细,知识的覆盖面、准确性也很高,看起来像是默认联网的。

网友们猜测,Gemini 3 Flash 可以被谷歌用来代替搜索引擎,或是逐渐移植到移动端侧。不论如何,新模型都预示着 AI 模型的新时代正在到来。

Gemini 3 Flash:规模化的前沿智能

Gemini 3 Flash 证明了,速度与规模并不必然以牺牲智能为代价。在多项博士级推理与知识基准测试中,例如 GPQA Diamond(90.4%) 和 Humanity’s Last Exam(在不使用工具的情况下为 33.7%),Gemini 3 Flash 均展现出前沿级性能,可与更大规模的前沿模型相媲美,并在多项基准测试中显著超越了此前最强的 2.5 代模型 ——Gemini 2.5 Pro。

同时,在多模态推理基准 MMMU Pro 上,Gemini 3 Flash 以 81.2% 的高分达到了当前最先进水平,其表现与 Gemini 3 Pro 不相上下。



从基准测试上可以看到,Gemini 3 Flash 性能强大,在各方面都超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 测试中胜过了 Gemini 3 Pro。

现在,精简后的模型(体积缩小 3-4 倍)已经超越了 6 个月前的「前沿」模型。

除了具备前沿级的推理能力和多模态能力之外,Gemini 3 Flash 在设计之初就以极高的效率为目标,进一步推动了质量与成本、速度之间的帕累托前沿。

在最高思考等级下运行时,Gemini 3 Flash 能够动态调节自身的思考深度:面对更复杂的使用场景,它会投入更长时间进行推理;而在处理日常任务时,则能以更高性能完成目标,同时在典型业务流量下,平均使用的 token 数量比 Gemini 2.5 Pro 减少约 30%。

这使得 Gemini 3 Flash 能够在保证准确性的同时,以更低的成本和更高的效率完成日常任务。



Jeff Dean 表示:「我们再次突破了效率与智能之间的帕累托边界。」

Gemini 3 Flash 的核心优势在于其极致的原生速度,延续并强化了开发者和消费者早已青睐的 Flash 系列特性。根据 Artificial Analysis 的基准测试结果,Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同时,速度提升达到 3 倍,而成本仅为其一小部分。

在定价方面,Gemini 3 Flash 的费用为:

  1. 输入:每 100 万 token 收费 0.50 美元
  2. 输出:每 100 万 token 收费 3 美元
  3. 音频输入:仍为每 100 万 token 收费 1 美元



Gemini 3 Flash 在速度和效率上均显著优于 Gemini 2.5 Pro。在上一代模型尚未完成处理之前,Gemini 3 Flash 已经生成了复杂图形、3D 模型以及一个 Web 应用。

面向开发者:始终跟得上节奏的智能

Gemini 3 Flash 专为高频迭代开发而打造,在保持低延迟的同时,提供 Gemini 3 Pro 级别的代码能力,能够在高并发、快节奏的工作流中迅速进行推理并解决问题。

在用于评估代码智能体能力的基准测试 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的成绩,不仅超越了 2.5 系列模型,也优于 Gemini 3 Pro。

这使 Gemini 3 Flash 在智能体编程(agentic coding)、生产级系统以及高响应性的交互式应用场景中,实现了性能、速度与成本之间的理想平衡。

Gemini 3 Flash 在推理能力、工具使用以及多模态能力方面的强劲表现,使其非常适合希望开展更复杂的视频分析、数据抽取和视觉问答(Visual Q&A) 的开发者。这也意味着,它能够支撑更具智能水平的应用场景 —— 例如游戏内助手或 A/B 测试实验,在这些场景中,既需要快速响应,又要求深度推理能力。



Gemini 3 Flash 在一款手势追踪的投球解谜游戏中实现了多模态推理,提供了近乎实时的 AI 辅助。



Gemini 3 Flash 能够近乎实时地构建和进行 A/B 测试新的加载指示器设计,从而简化了从设计到编码的流程。

采用 Gemini 3 Flash 的企业反馈非常积极。包括 JetBrains、Bridgewater Associates 和 Figma 在内的多家公司,已经开始使用该模型推动业务转型,并认可其在推理速度、效率以及推理能力方面的表现,能够与更大规模的模型相媲美。

目前,Gemini 3 Flash 已通过 Vertex AI 和 Gemini Enterprise 正式向企业客户开放。

Cursor 开发者体验副总裁表示,他们的工程师发现,Gemini 3 Flash 与 Cursor 的 Debug Mode 配合使用效果非常出色。该模型在问题排查和定位 Bug 根本原因方面表现出速度快、准确性高的优势。



面向所有人:Gemini 3 Flash 全球上线

Gemini 3 Flash 现已成为 Gemini 应用的默认模型,取代了 2.5 Flash。这意味着全球 Gemini 用户都已能免费体验 Gemini 3,从而大幅提升日常任务的处理效率。

凭借 Gemini 3 Flash 卓越的多模态推理能力,你可以利用它更快地查看、聆听和理解各种类型的信息。例如,你可以让 Gemini 理解视频和图像,并在短短几秒钟内将这些内容转化为实用且可行的计划。



或者,你无需任何编程知识,即可使用语音快速从零开始构建实用的应用程序。只需随时随地向 Gemini 发出语音指令,它就能在几分钟内将人们零散的想法转化为功能完善的应用程序。

使用 Gemini 3 Flash 描述一个想法,并在几分钟内将其转化为可行的原型。

Gemini 3 Flash 也正在逐步推广,谷歌希望它能成为全球用户使用的搜索功能中 AI 模式的默认模型。

基于 Gemini 3 Pro 的推理能力,搭载 Gemini 3 Flash 的 AI 模式能够更有效地理解你问题的细微之处。它会考虑查询的各个方面,提供全面的回复,以易于理解的方式呈现 —— 从网络上提取实时本地信息和有用的链接。最终结果有效地将研究与实际行动相结合:生成条理清晰的分析以及具体的建议。最后,一切都以搜索的速度完成。

在处理需要考虑多个因素的复杂目标时,例如计划一次说走就走的旅行,或快速学习复杂的教育概念,这项功能尤其出色。

谷歌表示,Gemini 3 Flash 现已通过 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供预览版。你还可以通过其他开发者工具(例如 Gemini CLI 和 Android Studio)访问新模型。此外,它也已开始在 Gemini 应用和搜索的 AI 模式中面向所有用户推出。

参考链接:https://blog.google/products/gemini/gemini-3-flash/

文中视频链接:
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
少女们的美丽刑具,安踏年销140亿的印钞机

少女们的美丽刑具,安踏年销140亿的印钞机

快刀财经
2026-05-11 22:12:42
90人冲进四七九!成都这7所黑马初中,让三小联中都坐不住了……

90人冲进四七九!成都这7所黑马初中,让三小联中都坐不住了……

糖逗在娱乐
2026-05-12 06:18:42
物理老师用道具冒充金条测密度后道歉

物理老师用道具冒充金条测密度后道歉

三言科技
2026-05-11 18:20:07
张军被查创下多个尴尬“纪录”,18年前曾因酒驾被查

张军被查创下多个尴尬“纪录”,18年前曾因酒驾被查

元芳有看法
2026-04-30 09:25:44
4-2轻松晋级,4-0横扫对手!成季后赛最大黑马,这5笔交易太值了

4-2轻松晋级,4-0横扫对手!成季后赛最大黑马,这5笔交易太值了

篮球扫地僧
2026-05-11 10:48:02
赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

祥松谈
2026-05-02 15:01:46
活塞vs骑士G4预测:米切尔篮板+坎宁安助攻双押注

活塞vs骑士G4预测:米切尔篮板+坎宁安助攻双押注

体育硬核说
2026-05-12 06:44:43
20多天就认怂!印尼对中企举的镍矿大刀,先砍到了自己脚趾头

20多天就认怂!印尼对中企举的镍矿大刀,先砍到了自己脚趾头

锅锅爱历史
2026-05-12 07:13:02
撒贝宁一家现身上海迪士尼!7岁儿子穿东北花衬衫,混血颜值出挑

撒贝宁一家现身上海迪士尼!7岁儿子穿东北花衬衫,混血颜值出挑

可乐谈情感
2026-05-12 03:18:16
日乒主帅不甘心!盛赞梁靖崑的同时,张本智和竟成他口中的背锅侠

日乒主帅不甘心!盛赞梁靖崑的同时,张本智和竟成他口中的背锅侠

十点街球体育
2026-05-11 11:41:37
没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

没有外援就拔刀相向?神权杖硬刚枪杆子,塔利班进入内斗阶段!

寰球经纬所
2026-05-10 10:55:10
25三分追平历史纪录!尼克斯4-0横扫76人进东决 恩比德空砍24分

25三分追平历史纪录!尼克斯4-0横扫76人进东决 恩比德空砍24分

醉卧浮生
2026-05-11 06:13:45
罗马诺:曼联将从本周起正式收到那不勒斯买断霍伊伦的4400万欧;拉什福德:如果我是魔术师,我会留在巴萨

罗马诺:曼联将从本周起正式收到那不勒斯买断霍伊伦的4400万欧;拉什福德:如果我是魔术师,我会留在巴萨

MUREDS
2026-05-11 23:31:15
国乒夺冠后阵容或迎洗牌,3人稳坐主力,4人争抢剩余名额

国乒夺冠后阵容或迎洗牌,3人稳坐主力,4人争抢剩余名额

老曁科普
2026-05-11 11:09:13
军购刚结束,郑丽文立刻派张荣恭赴陆交底,直接送上一份大礼!

军购刚结束,郑丽文立刻派张荣恭赴陆交底,直接送上一份大礼!

共工之锚
2026-05-11 22:11:56
为啥孩子上初中了,每天还要接送?班主任给家长们说了实话

为啥孩子上初中了,每天还要接送?班主任给家长们说了实话

枕边聊育儿
2026-05-11 08:59:14
最低调沙特王子被迪拜富商街头掌掴:无视50亿封口费,只提一条件

最低调沙特王子被迪拜富商街头掌掴:无视50亿封口费,只提一条件

小哥很OK
2026-05-11 23:35:44
一帧定生死:伦敦碗4分17秒,照出英超冠军与降级的双重真相!

一帧定生死:伦敦碗4分17秒,照出英超冠军与降级的双重真相!

落夜足球
2026-05-11 20:56:22
出逃前赖昌星不忘带上她,如今58岁孤独一人,她后悔了吗?

出逃前赖昌星不忘带上她,如今58岁孤独一人,她后悔了吗?

椰青美食分享
2026-05-11 20:26:25
上汽奥迪高管炮轰行业乱象:很多品牌用特调车刷圈速 轮胎换过、悬挂改过、软件单独写

上汽奥迪高管炮轰行业乱象:很多品牌用特调车刷圈速 轮胎换过、悬挂改过、软件单独写

快科技
2026-05-09 15:40:14
2026-05-12 08:51:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12970文章数 142648关注度
往期回顾 全部

科技要闻

纳德拉法庭爆料:拒当“AI时代的IBM”

头条要闻

牛弹琴:特朗普要来了 可以肯定这不是一次寻常的访问

头条要闻

牛弹琴:特朗普要来了 可以肯定这不是一次寻常的访问

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

特朗普要来了,我们且淡定

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

健康
亲子
手机
艺术
旅游

干细胞能让人“返老还童”吗

亲子要闻

带孩子看完《绵羊侦探团》果然有惊喜!

手机要闻

苹果更新全家桶系统,iOS 26.5修复超50项安全漏洞

艺术要闻

江青早年电影照曝光,手稿惊艳引热议。

旅游要闻

首航售罄,账本承压:“长江行·揽月”号驶入三峡旅游的深水区

无障碍浏览 进入关怀版