网易首页 > 网易号 > 正文 申请入驻

刚刚,让谷歌翻身的Gemini 3,上线Flash版

0
分享至




机器之心编辑部

OpenAI 还在卷跑分,谷歌已经打穿应用层了。

北京时间周四零点,Google 发布了高速、低成本模型 Gemini 3 Flash,作为其今年大模型领域的收官之作。

该模型基于上个月发布的 Gemini 3,明显带有抢 OpenAI 风头的意味。与此同时,Google 还将 Gemini 3 Flash 设为 Gemini 应用和搜索 AI 模式中的默认模型。

这款新的 Flash 模型距离 Google 发布 Gemini 2.5 Flash 仅过去六个月,但在性能上实现了显著跃升。基准测试显示,Gemini 3 Flash 相比前代模型有大幅提升,并在部分指标上达到了 Gemini 3 Pro 和 GPT-5.2 等前沿模型的水平。

在智能 / 成本上,它成为了全球性价比最高的模型。



例如,在 Humanity’s Last Exam 基准测试中(该测试旨在评估模型在不同专业领域的综合能力),在不使用工具的情况下,Gemini 3 Flash 取得了 33.7% 的成绩。作为对比,Gemini 3 Pro 的得分为 37.5%,Gemini 2.5 Flash 为 11%,而新发布的 GPT-5.2 则为 34.5%。

与此同时,谷歌也将这款新模型在全球范围内向数以百万计的用户开放,覆盖以下渠道:

  1. 开发者:通过 Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的智能体开发平台 Google Antigravity
  2. 所有用户:通过 Gemini 应用,以及搜索中的 AI 模式(AI Mode in Search)
  3. 企业用户:通过 Vertex AI 和 Gemini Enterprise

Gemini 3 Flash 发布后,大家第一时间进行了使用测试,发现这个 AI 回答问题的响应速度基本都在 1 秒以内,的确是跟搜索引擎一样快。而且它在回答问题的时候相比以前更加详细,知识的覆盖面、准确性也很高,看起来像是默认联网的。

网友们猜测,Gemini 3 Flash 可以被谷歌用来代替搜索引擎,或是逐渐移植到移动端侧。不论如何,新模型都预示着 AI 模型的新时代正在到来。

Gemini 3 Flash:规模化的前沿智能

Gemini 3 Flash 证明了,速度与规模并不必然以牺牲智能为代价。在多项博士级推理与知识基准测试中,例如 GPQA Diamond(90.4%) 和 Humanity’s Last Exam(在不使用工具的情况下为 33.7%),Gemini 3 Flash 均展现出前沿级性能,可与更大规模的前沿模型相媲美,并在多项基准测试中显著超越了此前最强的 2.5 代模型 ——Gemini 2.5 Pro。

同时,在多模态推理基准 MMMU Pro 上,Gemini 3 Flash 以 81.2% 的高分达到了当前最先进水平,其表现与 Gemini 3 Pro 不相上下。



从基准测试上可以看到,Gemini 3 Flash 性能强大,在各方面都超越了 Gemini 2.5 Pro,甚至在 ARC-AGI-2 和 SWE-Bench Verified 测试中胜过了 Gemini 3 Pro。

现在,精简后的模型(体积缩小 3-4 倍)已经超越了 6 个月前的「前沿」模型。

除了具备前沿级的推理能力和多模态能力之外,Gemini 3 Flash 在设计之初就以极高的效率为目标,进一步推动了质量与成本、速度之间的帕累托前沿。

在最高思考等级下运行时,Gemini 3 Flash 能够动态调节自身的思考深度:面对更复杂的使用场景,它会投入更长时间进行推理;而在处理日常任务时,则能以更高性能完成目标,同时在典型业务流量下,平均使用的 token 数量比 Gemini 2.5 Pro 减少约 30%。

这使得 Gemini 3 Flash 能够在保证准确性的同时,以更低的成本和更高的效率完成日常任务。



Jeff Dean 表示:「我们再次突破了效率与智能之间的帕累托边界。」

Gemini 3 Flash 的核心优势在于其极致的原生速度,延续并强化了开发者和消费者早已青睐的 Flash 系列特性。根据 Artificial Analysis 的基准测试结果,Gemini 3 Flash 在性能上超越 Gemini 2.5 Pro 的同时,速度提升达到 3 倍,而成本仅为其一小部分。

在定价方面,Gemini 3 Flash 的费用为:

  1. 输入:每 100 万 token 收费 0.50 美元
  2. 输出:每 100 万 token 收费 3 美元
  3. 音频输入:仍为每 100 万 token 收费 1 美元



Gemini 3 Flash 在速度和效率上均显著优于 Gemini 2.5 Pro。在上一代模型尚未完成处理之前,Gemini 3 Flash 已经生成了复杂图形、3D 模型以及一个 Web 应用。

面向开发者:始终跟得上节奏的智能

Gemini 3 Flash 专为高频迭代开发而打造,在保持低延迟的同时,提供 Gemini 3 Pro 级别的代码能力,能够在高并发、快节奏的工作流中迅速进行推理并解决问题。

在用于评估代码智能体能力的基准测试 SWE-bench Verified 上,Gemini 3 Flash 取得了 78% 的成绩,不仅超越了 2.5 系列模型,也优于 Gemini 3 Pro。

这使 Gemini 3 Flash 在智能体编程(agentic coding)、生产级系统以及高响应性的交互式应用场景中,实现了性能、速度与成本之间的理想平衡。

Gemini 3 Flash 在推理能力、工具使用以及多模态能力方面的强劲表现,使其非常适合希望开展更复杂的视频分析、数据抽取和视觉问答(Visual Q&A) 的开发者。这也意味着,它能够支撑更具智能水平的应用场景 —— 例如游戏内助手或 A/B 测试实验,在这些场景中,既需要快速响应,又要求深度推理能力。



Gemini 3 Flash 在一款手势追踪的投球解谜游戏中实现了多模态推理,提供了近乎实时的 AI 辅助。



Gemini 3 Flash 能够近乎实时地构建和进行 A/B 测试新的加载指示器设计,从而简化了从设计到编码的流程。

采用 Gemini 3 Flash 的企业反馈非常积极。包括 JetBrains、Bridgewater Associates 和 Figma 在内的多家公司,已经开始使用该模型推动业务转型,并认可其在推理速度、效率以及推理能力方面的表现,能够与更大规模的模型相媲美。

目前,Gemini 3 Flash 已通过 Vertex AI 和 Gemini Enterprise 正式向企业客户开放。

Cursor 开发者体验副总裁表示,他们的工程师发现,Gemini 3 Flash 与 Cursor 的 Debug Mode 配合使用效果非常出色。该模型在问题排查和定位 Bug 根本原因方面表现出速度快、准确性高的优势。



面向所有人:Gemini 3 Flash 全球上线

Gemini 3 Flash 现已成为 Gemini 应用的默认模型,取代了 2.5 Flash。这意味着全球 Gemini 用户都已能免费体验 Gemini 3,从而大幅提升日常任务的处理效率。

凭借 Gemini 3 Flash 卓越的多模态推理能力,你可以利用它更快地查看、聆听和理解各种类型的信息。例如,你可以让 Gemini 理解视频和图像,并在短短几秒钟内将这些内容转化为实用且可行的计划。



或者,你无需任何编程知识,即可使用语音快速从零开始构建实用的应用程序。只需随时随地向 Gemini 发出语音指令,它就能在几分钟内将人们零散的想法转化为功能完善的应用程序。

使用 Gemini 3 Flash 描述一个想法,并在几分钟内将其转化为可行的原型。

Gemini 3 Flash 也正在逐步推广,谷歌希望它能成为全球用户使用的搜索功能中 AI 模式的默认模型。

基于 Gemini 3 Pro 的推理能力,搭载 Gemini 3 Flash 的 AI 模式能够更有效地理解你问题的细微之处。它会考虑查询的各个方面,提供全面的回复,以易于理解的方式呈现 —— 从网络上提取实时本地信息和有用的链接。最终结果有效地将研究与实际行动相结合:生成条理清晰的分析以及具体的建议。最后,一切都以搜索的速度完成。

在处理需要考虑多个因素的复杂目标时,例如计划一次说走就走的旅行,或快速学习复杂的教育概念,这项功能尤其出色。

谷歌表示,Gemini 3 Flash 现已通过 Google AI Studio、Google Antigravity、Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供预览版。你还可以通过其他开发者工具(例如 Gemini CLI 和 Android Studio)访问新模型。此外,它也已开始在 Gemini 应用和搜索的 AI 模式中面向所有用户推出。

参考链接:https://blog.google/products/gemini/gemini-3-flash/

文中视频链接:
https://mp.weixin.qq.com/s/a47cr-7HwZ78gsFRaszEIg

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
退休后这三张纸比退休证还重要!社保局提醒:漏办吃大亏

退休后这三张纸比退休证还重要!社保局提醒:漏办吃大亏

爱下厨的阿酾
2026-03-22 06:25:58
深圳女子高德订房深夜扑空,到店查无此单只能另外花钱,平台却标注“已入住”拒退款

深圳女子高德订房深夜扑空,到店查无此单只能另外花钱,平台却标注“已入住”拒退款

信网
2026-03-22 06:05:02
阿拉伯国家谴责以色列

阿拉伯国家谴责以色列

参考消息
2026-03-21 21:46:09
伊朗再发警告:若伊能源设施遭袭 将打击美及其盟友三类关键设施

伊朗再发警告:若伊能源设施遭袭 将打击美及其盟友三类关键设施

财联社
2026-03-22 09:04:21
太难了!我是最早一批回家的人,网友哭诉在浙江十几天没找到工作

太难了!我是最早一批回家的人,网友哭诉在浙江十几天没找到工作

火山詩话
2026-03-21 11:27:47
随着瓦伦西亚2-0,西班牙人1-2,莱万特4-2,西甲最新积分榜出炉

随着瓦伦西亚2-0,西班牙人1-2,莱万特4-2,西甲最新积分榜出炉

侧身凌空斩
2026-03-22 06:19:16
布鲁斯威利迎71岁生日! 黛咪摩尔晒天伦照:你需要的只有爱

布鲁斯威利迎71岁生日! 黛咪摩尔晒天伦照:你需要的只有爱

ETtoday星光云
2026-03-20 13:30:04
扎心!官方发布:医学硕士就业率跌破40%

扎心!官方发布:医学硕士就业率跌破40%

医脉圈
2026-03-20 12:09:22
原来他们是父女,都是知名演员,20多年隔阂难消除,他69岁仍单身

原来他们是父女,都是知名演员,20多年隔阂难消除,他69岁仍单身

素衣读史
2026-03-21 20:40:56
陪玩陪睡仅开胃菜,继关晓彤事件后,岳云鹏再次揭露内娱的阴暗面

陪玩陪睡仅开胃菜,继关晓彤事件后,岳云鹏再次揭露内娱的阴暗面

梁濆爱玩车
2026-03-20 13:53:50
伊朗人为何不惊慌?

伊朗人为何不惊慌?

西楼饮月
2026-03-11 20:59:17
哈滕9+20+10力压榜眼,亚历山大40分创纪录,雷霆大胜奇才11连胜

哈滕9+20+10力压榜眼,亚历山大40分创纪录,雷霆大胜奇才11连胜

钉钉陌上花开
2026-03-22 07:38:11
谢文能飞铲染红!鲍亚雄逃过一劫,媒体人:致人受伤加重处罚

谢文能飞铲染红!鲍亚雄逃过一劫,媒体人:致人受伤加重处罚

奥拜尔
2026-03-21 22:13:29
单人票价6800!国足零点直飞悉尼:已17个月未包机 7年前由奢入俭

单人票价6800!国足零点直飞悉尼:已17个月未包机 7年前由奢入俭

风过乡
2026-03-22 09:01:47
他骗过斯大林和蒋介石两大枭雄,最后却亲手杀了毛主席的亲弟弟,下场极惨

他骗过斯大林和蒋介石两大枭雄,最后却亲手杀了毛主席的亲弟弟,下场极惨

历史回忆室
2026-03-22 00:09:05
34分钟1.5万台!小米新车又爆火,但雷军却变了

34分钟1.5万台!小米新车又爆火,但雷军却变了

象视汽车
2026-03-21 07:00:05
金价跳水,菜百店里挤满人,有人刚卖完金又抢着买回来

金价跳水,菜百店里挤满人,有人刚卖完金又抢着买回来

趣味萌宠的日常
2026-03-21 20:32:15
中美达成共识,48小时刚过,美方就宣布中国已经增持了109亿美债

中美达成共识,48小时刚过,美方就宣布中国已经增持了109亿美债

共工之锚
2026-03-21 14:51:18
鱼朝恩之死:敢骑在皇帝头上的太监,一顿寒食宴,当场被勒死!

鱼朝恩之死:敢骑在皇帝头上的太监,一顿寒食宴,当场被勒死!

锅锅爱历史
2026-03-21 18:43:11
伊朗最高领袖自爆:我也打车出门听八卦,百姓骂经济我都听到了

伊朗最高领袖自爆:我也打车出门听八卦,百姓骂经济我都听到了

Ck的蜜糖
2026-03-21 08:45:29
2026-03-22 09:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12555文章数 142590关注度
往期回顾 全部

科技要闻

库克在华这四天,一场既定的市场秀

头条要闻

男子在壶口瀑布外拍视频喊"门口要钱"被投诉 景区回应

头条要闻

男子在壶口瀑布外拍视频喊"门口要钱"被投诉 景区回应

体育要闻

谁在决定字母哥未来?

娱乐要闻

田栩宁终于凉了?出轨风波影响恶劣

财经要闻

睡梦中欠债1.2万?这只“虾”杀疯了

汽车要闻

小鹏汽车2025年Q4盈利净赚3.8亿 全年营收767亿

态度原创

亲子
游戏
旅游
公开课
军事航空

亲子要闻

“锌”是聪明根!春天孩子多吃高锌菜,脑子灵、记性好、个头猛长

拒绝做大做强!《幻兽帕鲁》开发商不想打造媒体帝国

旅游要闻

推出四条核心特色线路产品,崂山风景区2026旅行商大会举办

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊导弹击中以核设施附近 爆炸视频公布

无障碍浏览 进入关怀版