网易首页 > 网易号 > 正文 申请入驻

Gemini 3 Flash闪电来袭:智力竟反超Pro!速度快3倍,全球免费

0
分享至

  

  新智元报道

  编辑:定慧 好困

  【新智元导读】谷歌在2025年底甩出「王炸」:Gemini 3 Flash! 这款模型彻底打破了「快就一定笨、强就一定贵」的定律,以3倍于前代的速度实现「零延迟」响应,甚至在编程和逻辑推理上反超了Pro级大哥。

  Gemini 3 Flash正式发布!

  至此,Gemini 3家族成为完全体:Flash、Pro和Deep Think。

  Flash模型已经全面上线Gemini APP、AI Studio、Google Antigravity和Gemini CLI,用户打开Gemini就是默认Gemini 3 Flash版本,直接免费使用!

  

  

  

  左右滑动查看

  如果说之前的AI模型是在模拟人类的思考,那么Gemini 3 Flash就是在模拟人类的「直觉」。

  3倍于Gemini 2.5 Pro的速度,却拥有超越Pro级的推理能力。

  这不仅仅是一次升级,这是对现有AI交互体验的一次降维打击!

  

  

  实测Gemini 3 Flash之后,只有一个感受:快!简直太快了。

  速度快到「没有加载条」,这种体验简直是「零延迟」的魔法,刚敲完回车,答案就已经在屏幕上渲染完毕。

  它不仅快得离谱,更可怕的是,它的智力竟然在某些领域直接「背刺」了自家的Pro大哥。

  

  通常「Flash」意味着「降智」,但这次不同。

  Gemini 3 Flash在某些复杂的Agentic Coding(智能体编程)任务上,甚至直接超越了Gemini 3 Pro!

  比如Flash在MMMU Pro(多模态理解和推理)上取得了81.2%,反超Gemini 3 Pro的81.0%,

  要知道从API成本来看,相比Gemini 3 Pro,Flash成本直接砍到了四分之一。

  更便宜,但是性能反而不降反升!

  估计今夜谷歌又让整个大模型行业「集体失眠」了。

  

  

  

  拳打Claude,脚踢GPT

  在Artificial Analysis的最新评估中,3 Flash相比上一代2.5 Flash直接来一次质变飞跃,这应该是2025年同个系列模型的最大跨度升级!

  很难想象,一个Flash轻量级模型能够超过Cladue的旗舰模型Opus 4.5。(估计相比OpenAI,Anthropic对一个坐不住了)。

  

  

  其他指标,Flash也达到了最顶级模型的水平。

  Flash在GPQA Diamond(90.4%)和Humanity’s Last Exam(无工具条件下33.7%)等博士级推理和知识基准测试中展现了前沿性能,足以媲美更大的前沿模型,并且在多项基准测试中显著优于前代旗舰Gemini 2.5 Pro。

  

  在ARC-AGI Semi-Private Eval上,Gemini 3 Flash的表现同样极具竞争力,且成本大幅低于其他前沿模型。

  ARC-AGI-1: 84.7%, $0.17/任务

  ARC-AGI-2: 33.6%, $0.23/任务

  

  

  在LMArena上,Gemini 3 Flash的文本能力直接跃升至第3!

  

  Gemini 3 Flash证明了速度和规模并不一定要以牺牲智能为代价。

  除了前沿级的推理和多模态能力外,Gemini 3 Flash专为高效而生,推动了质量与成本、速度之间的帕累托前沿(Pareto frontier)。

  在进行最高层级的思维处理时,Gemini 3 Flash能够调节其「思考量」。

  对于更复杂的用例,它可能会思考更久,但在典型流量下,它平均比2.5 Pro少消耗30%的Token,却能以更高的性能准确完成日常任务。

  

  Gemini 3 Flash的核心优势在于其原生速度!

  它的表现优于2.5 Pro,但速度快了3倍(基于Artificial Analysis基准测试),而成本却只是零头。

  Gemini 3 Flash的定价为每百万输入Token 0.50美元,每百万输出Token 3美元(音频输入保持在每百万输入Token 1美元)。

  

  

  

  

  左右滑动查看

  开发者新宠:极速与深度的完美平衡

  对于开发者来说,模型的响应速度是第一位。

  Gemini 3 Flash专为迭代开发打造,提供Gemini 3 Pro级的编码性能和低延迟——它能够在高频工作流中快速推理并解决任务。

  在评估编码智能体能力的SWE-bench Verified基准测试中,Gemini 3 Flash获得了78%的分数,不仅超越了2.5系列,还超过了Gemini 3 Pro。

  可以说,它在智能体编码、生产级系统和响应式交互应用之间实现了理想的平衡。

  与此同时,Gemini 3 Flash在推理、工具使用和多模态能力方面的强劲表现,非常适合希望进行更复杂的视频分析、数据提取和视觉问答的开发者。

  这意味着它可以赋能那些景既需要极速响应,也需要深度推理的更智能的应用程序。

  比如,Gemini 3 Flash能在一款手部追踪的「弹球益智游戏」中实现多模态推理,提供近乎实时的AI辅助。

  

  或者,近乎实时地构建并A/B测试新的加载动画设计,帮助简化了从设计到代码的流程。

  

  以及,根据非常简单的一段提示词,编写出三种独特的设计变体。

  

  甚至,还能通过多模态推理分析图像,并生成带有上下文UI覆盖层的字幕,来将静态图像转化为互动体验。

  

  全民AI时代:搜你想搜,做你想做

  Gemini 3 Flash现已成为Gemini App中的默认模型,取代了2.5 Flash。

  这意味着全球所有的Gemini用户都将免费获得Gemini 3的体验,让处理日常任务的能力得到重大升级。

  得益于Gemini 3 Flash惊人的多模态推理能力,你可以用它来帮助你更快地看、听和理解任何类型的信息。

  例如,你可以让Gemini理解你的视频和图像,并在几秒钟内将这些内容转化为有用且可执行的计划。

  比如,它可以通过分析短视频的内容,来为你制定改善高尔夫挥杆动作的计划。

  

  上传一段音频录音,Gemini 3 Flash会识别你的知识盲区,创建一个定制测验,并针对答案给出详细解释。

  

  此外,针对速度进行优化了的Gemini 3 Flash,还能在你画草图时就猜出你在画什么。

  

  或者,即便没有任何编程知识,你也可以仅用语音从头开始快速构建有趣、实用的App。

  只需随时随地口述给Gemini,它就能在几分钟内将你原本非结构化的想法转化为功能完善的App。

  

  Gemini 3 Flash也开始作为搜索中AI模式的默认模型推出,面向全球用户开放。

  建立在Gemini 3 Pro的推理能力之上,采用Gemini 3 Flash的AI模式在解析问题的细微差别方面更加强大。

  它会考量你查询的方方面面,提供深思熟虑、全面且视觉上易于消化的回答——并从全网提取实时的本地信息和有用的链接。

  结果有效地结合了研究与即时行动:你能在获得特定推荐的同时得到智能梳理的内容细分——一切都以搜索的速度呈现。

  当处理涉及多重考量的复杂目标时,这一点尤为出色,比如试图规划一次说走就走的旅行,或快速学习复杂的教育概念。

  

  收官2025:留给对手的时间不多了

  Gemini 3 Flash的发布传递了一个清晰的信号:高性能AI不再昂贵,也不再迟钝。

  Gemini 3 Flash的逻辑很简单:比我聪明的没我快,比我快的没我聪明,关键是它们都比我贵。

  谷歌正在用极其激进的策略——顶级推理+极致速度+地板价格,试图在2025年底收割战场。

  对于普通用户来说,Gemini App里的对话将变得极其流畅;对于开发者来说,构建实时、复杂的AI应用不再是烧钱的梦想,因为API真的太便宜了。

  2025年是充满挑战的一年,AI真正迈入了一个新时代,模型不再只是演示品,而是被大规模使用的日用品。

  谷歌这一年并未追逐单一旗舰模型,他们推出了一系列产品阵容,而且每个模型都特别能打:

  追求速度,选Flash

  追求深度,选Pro

  追求推理,选Deep Think

  开启「智能平权」时代

  Gemini 3 Flash发布最大的颠覆之处还是在Agentic Coding等任务上超过Gemini 3 Pro。

  过去AI圈的逻辑是「大就是好」,但Gemini 3 Flash的意义在于它开启了「智能平权」时代:

  彻底降维打击低成本模型市场:

  在3 Flash出现之前,开发者在「便宜但笨」(如 GPT-4o-mini, 2.5 Flash)和「聪明但贵且慢」(如Pro)之间痛苦抉择。Gemini 3 Flash把Pro级的智力拉到了Flash级的价格和速度,直接封死了竞品低端模型的生存空间。

  为智能体时代铺路:

  智能体工作的核心是「循环(Loop)」——思考、行动、观察、再思考。如果模型太慢或太贵,这个循环就无法跑通。Flash极高的Token/秒/美元效率,是智能体能大规模商用的唯一基石。

  构建「延迟感」护城河:

  谷歌意识到,在搜索和交互中,100ms的延迟差异比5%的准确度差异更能决定用户留存。Flash的「瞬发」感让它在AI搜索模式下拥有了类似传统搜索的爽快感。

  现在的压力,全部来到了OpenAI这边。

  奥特曼,还坐得住吗?是不是又要拉响红色警报了~

  

  彩蛋

  目前来看,AI卷到Gemini 3 Flash这个程度感觉已经到头了

  我们试着用Gemin 3 Flash「套磁」了一下Gemini 4会在什么时候推出,能够达到什么水平?

  还是有惊喜的。

  Gemini 4可能在2026年Google I/O大会推出(不过按照今年2.5的规律,大概率会是3.5)。

  而3 Flash给的另一点则更加有意义,如果说Gemini 3是推理和速度的完美极致,那么下一代模型将聚焦于:

  智能体的主动性

  真正理解物理世界

  长程记忆

  以及超越人类的科学发现

  真是太期待明年的到来了!

  

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

10亿都救不了一命!京东副总裁蔡磊,生命进入倒计时

听风喃
2026-04-06 11:16:04
伊朗议长:伊武装部队已做好准备应对任何侵略行为

伊朗议长:伊武装部队已做好准备应对任何侵略行为

财联社
2026-05-12 03:07:07
侯友宜正式向大陆摊牌:将统一模式强加于台湾人,主流民意不接受

侯友宜正式向大陆摊牌:将统一模式强加于台湾人,主流民意不接受

杰丝聊古今
2026-05-06 14:10:21
45岁阿娇现身活动,胯粗屁股大身高是硬伤,五官精致立体像18岁

45岁阿娇现身活动,胯粗屁股大身高是硬伤,五官精致立体像18岁

往史过眼云烟
2026-05-11 19:27:04
世界正在发生一个极其恶心的变化!印度最终可能会成为地球大患

世界正在发生一个极其恶心的变化!印度最终可能会成为地球大患

世界圈
2026-05-04 16:42:27
第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

第1现场|俄乌对峙下的红场阅兵:36年来首次未见坦克

澎湃新闻
2026-05-09 21:40:28
妻子出轨后,对方妻子主动联系我,提议搭伙过日子每月给我五万块

妻子出轨后,对方妻子主动联系我,提议搭伙过日子每月给我五万块

千秋文化
2026-05-05 20:25:29
盲人网红盲道被电动车撞受伤,对方还出口辱骂,相关部门正式回应

盲人网红盲道被电动车撞受伤,对方还出口辱骂,相关部门正式回应

新游戏大妹子
2026-05-11 11:47:11
爽,张本智和被日媒点名!“数典忘祖”的人,多忠心,也是笑谈

爽,张本智和被日媒点名!“数典忘祖”的人,多忠心,也是笑谈

开成运动会
2026-05-11 12:13:43
CBA官方:浙江因观众辱骂裁判、投掷杂物、投资人违规进场,罚款16万

CBA官方:浙江因观众辱骂裁判、投掷杂物、投资人违规进场,罚款16万

懂球帝
2026-05-11 19:33:05
在名为“统治东方”的地方,让东方人去庆贺?海参崴阅兵未免过了

在名为“统治东方”的地方,让东方人去庆贺?海参崴阅兵未免过了

历史摆渡
2026-05-10 18:55:03
14岁送上北野武的床,17岁拍写真,被操控半生,年过50仍风韵犹存

14岁送上北野武的床,17岁拍写真,被操控半生,年过50仍风韵犹存

飘飘然的娱乐汇
2026-05-11 20:05:06
结婚才2年,萧敬腾就尝到老妻少夫的残酷,其实舒淇早就把话说透

结婚才2年,萧敬腾就尝到老妻少夫的残酷,其实舒淇早就把话说透

枯蝶
2026-05-11 09:20:17
我敢打赌99%的男人会选绿衣服女孩做老婆,看腿型就知道

我敢打赌99%的男人会选绿衣服女孩做老婆,看腿型就知道

娱乐洞察点点
2026-04-21 00:47:32
完胜印度队,中国队拿到U17女足世界杯门票,但主教练马晓旭并不满意

完胜印度队,中国队拿到U17女足世界杯门票,但主教练马晓旭并不满意

文汇报
2026-05-12 03:57:25
李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

李赛凤的乱伦,床缝摸出个用过的套,衣柜里还藏着个半裸的干儿子

西楼知趣杂谈
2026-04-26 10:18:11
赔偿262082元!广东46岁男子哭诉15年半的职场深耕,太不值当了

赔偿262082元!广东46岁男子哭诉15年半的职场深耕,太不值当了

火山詩话
2026-05-11 19:08:25
铜价无视中东逼近历史新高,花旗:一旦霍尔木兹解封,将直奔15000美元

铜价无视中东逼近历史新高,花旗:一旦霍尔木兹解封,将直奔15000美元

华尔街见闻官方
2026-05-11 15:28:38
我50岁才悟出一个道理:凡是从不参加同学聚会、不爱发动态、不混圈子的人,十有八九在这两个方面远超常人,观察了身边上百人屡试不爽

我50岁才悟出一个道理:凡是从不参加同学聚会、不爱发动态、不混圈子的人,十有八九在这两个方面远超常人,观察了身边上百人屡试不爽

心理观察局
2026-05-08 10:35:21
正式官宣!张继科重返赛场,5月份参加国际赛事,只为给自己正名

正式官宣!张继科重返赛场,5月份参加国际赛事,只为给自己正名

谢纶邮轮摄影
2026-04-13 12:23:43
2026-05-12 04:55:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
15185文章数 66863关注度
往期回顾 全部

数码要闻

DJI ROMO P2:有了 AI 就能让它能扫得更干净?

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

头条要闻

母女二人一年用水量高达400多吨 警方发现背后隐情

体育要闻

梁靖崑:可能是最后一届了,想让大家记住这个我

娱乐要闻

“孕妇坠崖案”王暖暖称被霸凌协商解约

财经要闻

宗馥莉罢免销售负责人 部分业务将外包

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

艺术
健康
数码
房产
军事航空

艺术要闻

震撼!Nicole Nodland镜头下的绝美时尚女神!

干细胞能让人“返老还童”吗

数码要闻

荣耀600系列全解读:肖战代言、幸运星设计、2亿影像,值得冲吗?

房产要闻

产业赋能教育!翰林府与北师大的这场签约,绝不那么简单!

军事要闻

特朗普:伊朗的回应“完全不可接受”

无障碍浏览 进入关怀版