网易首页 > 网易科技 > IT业界 > 正文

谷歌凌晨炸场,Pro级智商只卖“白菜价”,OpenAI还怎么玩?

0
分享至

作者 | 小小

出品 | 网易科技

推理强、速度快、还省钱,谷歌这次真的“杀疯了”。

就在旗舰模型Gemini 3 Pro发布仅一个月、死对头GPT-5.2发布仅仅5天后,今天凌晨,谷歌祭出大杀器 Gemini 3 Flash

大家惊讶地发现,这款新模型不讲武德:不仅在GPQA(博士级推理) 上拿到了90.4% 的高分,更以Pro级的推理智能,跑出了Flash级的逆天延迟。

谷歌CEO桑达尔·皮查伊(Sundar Pichai)高呼:“我们又回来了!” 他直言,新模型突破了性能和效率的帕累托极限——性能超越2.5 Pro,速度提升3倍,价格却低得多。


这种“加量不加价”的暴力美学,试图彻底改写大模型市场的性价比规则。正如DeepMind创始人哈萨比斯所言:“这是目前市面上性价比最高的模型,没有之一。”

一、帕累托边界的极限跨越:它是怎么做到的?

(图片由AI生成)

Gemini 3 Flash的核心逻辑简单粗暴:保留Gemini 3 Pro级别的推理底色,同时注入Flash系列的极致响应速度。

Google DeepMind负责人杰夫·迪恩(Jeff Dean)指出,Gemini 3 Flash标志着以往仅在超大型模型中具备的推理能力,如今能以Flash级的延迟运行。


这种“小而强”的进化并非牺牲了智能,而是通过调节“思考程度”实现了质量与成本的平衡。 对于日常任务,它比2.5 Pro平均节省30%的Token使用量,但在准确率上反而更胜一筹。

DeepMind研究科学家阿里·伊斯拉米(Ali Eslami)也感慨道:“距Pro版发布仅29天,Flash版同样智能,价格却便宜4倍,速度快得多!”

二、硬核测评:屠榜级表现,Pro级灵魂

在AI圈,不跑分的测评都是耍流氓。Gemini 3 Flash在多个权威基准测试中展现了“屠榜”姿态:

· 博士级推理(GPQA Diamond): 准确率达到90.4%,足以匹敌顶尖的前沿大模型。

· 多模态理解(MMMU Pro): 获得81.2% 的优异成绩,与“大哥”Gemini 3 Pro持平。

· 编码智能体(SWE-bench Verified): 取得了78% 的惊人分数,不仅横扫2.5全系列,甚至超越了刚刚发布不久的Gemini 3 Pro。

(图片由AI生成)

独立测评机构Artificial Analysis的预发布测试更是为这些数据注入了“现实感”:Gemini 3 Flash的原始吞吐量达到每秒218个输出Token,显著快于OpenAI GPT-5.1 high(125 Token/秒)。

(图片由AI生成)

更令人振奋的是,该机构将其冠以AA-Omniscience知识基准测试的新领导者,其知识准确率达到了目前所有测试模型的巅峰。

尽管这种智能带来了一定的“推理税”(处理复杂索引时Token量比2.5 Flash多一倍),但谷歌通过极激进的定价策略(输入Token 0.50美元/100万,输出Token 3美元/100万)完美对冲了这一成本。


三、给复杂应用,装上一颗“闪电大脑”

凭借在推理、工具调用及多模态维度的全线爆发,Gemini 3 Flash堪称复杂视频分析、海量数据提取与视觉问答(VQA)领域的全能型选手。

它不仅重塑了开发者对轻量化模型的认知,更让那些既追求极致响应、又渴望深度推理的智能应用,从此告别了在速度与智商之间的两难抉择。

举例来说,

· 在手部追踪的弹球益智游戏中,Gemini 3 Flash展现了惊人的多模态推理速度,能够毫秒级识别操作意图并提供近乎实时的AI战术辅助。

· 告别漫长等待: Gemini 3 Flash能够近乎实时地构建并自动化执行加载动画的A/B测试,极大地压缩了从创意设计到生产环境代码部署的转化链路 。

· 逻辑推理能力的下放: 仅凭一段简单的自然语言提示,Gemini 3 Flash即可瞬间编写出三种风格迥异的设计变体代码,为开发者提供了极高的迭代效率 。

· 依托深厚的多模态底座,Gemini 3 Flash通过图像分析自动生成带有上下文感知的UI覆盖层字幕,一键将枯燥的静态图像转化为可感知的交互式数字化体验 。

四、降本增效的终极杀招:思考层级与上下文缓存

为了让企业更放心地投入预算,谷歌在Gemini 3 Flash中引入了精细的“思考层级”参数。 开发者可以在“低”(简单任务降延迟)和“高”(复杂任务升深度)之间自由切换,实现“可变速度”的应用程序。

(图片由AI生成)

此外,上下文缓存(Context Caching)技术让处理海量静态数据集(如法律库或大型代码库)时,重复查询的成本可直接降低90%。

Gemini 3 Flash的发布,标志着前沿智能正在进入“Flash化”时代。 通过将Pro级推理下放到Flash级定价区间,谷歌不仅为速度较慢的竞争对手设下了伏击(trap),更向全球开发者展示了:前沿AI能力正变得前所未有的廉价与高效。

目前,Gemini 3 Flash已作为搜索AI模式和Gemini App的默认模型向全球数百万用户推出。

五、早期用户体验:这不只是升级,这是重塑

对于开发者和企业而言,Gemini 3 Flash的到来意味着原本因“高延迟、高成本”而被封印的场景,现在可以规模化落地了。

1. 法律与金融:复杂索引的专家

AI法律平台Harvey应用研究负责人尼科·格鲁彭(Niko Grupen)表示,在内部“BigLaw Bench”基准测试中,其推理能力较前代提升了7% 。这对于从海量合同中提取定义条款、交叉引用等高吞吐量法律任务具有重要影响。


Bridgewater Associates首席科学家贾斯吉特·塞孔(Jasjeet Sekhon)也对此表示赞赏:“我们需要处理海量非结构化数据且不牺牲深度。Gemini 3 Flash首次以工作流所需的速度,提供了专业级的推理。它在长上下文表现上尤为出色。”

2. 软件开发:智能体编程的新纪元

JetBrains AI开发工具生态系统负责人丹尼斯·希里亚耶夫(Denis Shiryaev)评价道:“在我们的Junie智能编码评估中,Gemini 3 Flash的质量已接近Pro级,但延迟和成本显著降低。它让复杂的多步骤智能体在生产环境中变得快速且可预测。”

Warp创始人扎克·劳埃德(Zach Lloyd)透露,其“建议代码变更”功能在升级后,修复准确率提升了8% 。

Replit总裁米歇尔·卡塔斯塔(Michele Catasta)指出,Gemini 3 Flash首次将速度、经济性与足够强大的能力相结合,足以驱动一个编码智能体的核心循环 。

Cursor开发者体验副总裁李·罗宾逊(Lee Robinson)反馈,Flash在调查问题、定位Bug根本原因时既快速又准确 。

3. 多模态与游戏:毫秒级的响应

Astrocade联合创始人阿里·萨德吉安(Ali Sadeghian)表示,该模型的速度使他们能通过单次提示生成完整的游戏关卡计划 。

Latitude首席执行官尼克·沃特森(Nick Waltson)的评价是:Gemini 3 Flash以低成本达到了过去只有顶级收费模型才能实现的高质量输出。

六、社交媒体炸锅:开发者们的“真香”时刻

模型好不好,社交媒体上的开发者最有发言权。Gemini 3 Flash发布后的反馈几乎是一边倒的惊叹:

网友@omarsar0被Gemini 3 Flash彻底“拿捏”了。 他感叹,这可不是什么小打小闹的升级,而是一个“要啥有啥”的六边形战士:推理强、速度快、还省钱。


@AliShazil_认为,Flash版本带来的“速度-成本-质量”新平衡,其意义远超性能榜单上的跑分结果,将真正改变实际应用场景。

Hyperbolic联合创始人Yuchen Jin从更宏观的角度评价称,这种“更小、更快、更强”的趋势并非个例,它标志着技术迭代的节奏正在急剧加快。他还认为强大的设备端AI已触手可及,目标直指苹果!

有网友惊叹谷歌在LLM领域的设计依然是王者。它保留了Gemini 3的所有设计理念,但速度快得多!

当然,硬币也有另一面。

有网友指出Gemini 3 Flash在AA-Omniscience基准测试中的幻觉率引发了关注,LisanBench的数据也暗示其平均有效性仍有提升空间。

但正如Warp创始人劳埃德所言,对于需要“低延迟和成本效率”的功能,Gemini 3 Flash依然是无可争议的最佳选择。

结语:是圣诞礼物,也是行业战书

对于全球开发者而言,Gemini 3 Flash无疑是2025年末收到的一份厚重的圣诞礼物。它打破了“智能与成本”的悖论,让AI应用的落地变得前所未有的简单。

(图片由AI生成)

这对于用户是福音,但对于那些技术壁垒不高、成本控制不力的竞争对手来说,却是灭顶之灾。

随着价格战的枪声打响,2026年注定将是AI行业的“大洗牌”之年。当潮水退去,究竟是谷歌重回王座,还是会有新的黑马杀出重围?答案,就在下一个版本的迭代里。

相关推荐
热点推荐
博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

博主被陌生网友辱骂3个月,默默观察其2年半,终于找到机会碰面了

离离言几许
2026-03-26 15:01:41
连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一

连续两个月从中国进口镓锗为零后,日本宣布无人机要做世界第一

小小科普员
2026-03-26 19:07:58
华山医院候诊屏现“照顾号”引热议,院方:为75岁以上老人等优待群体提供便利

华山医院候诊屏现“照顾号”引热议,院方:为75岁以上老人等优待群体提供便利

上游新闻
2026-03-26 15:33:08
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
受权发布|中华人民共和国国务院令  第833号

受权发布|中华人民共和国国务院令  第833号

新华社
2026-03-26 17:03:04
4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

4月1日医保7号令落地!1965-1985年出生的,这6件事务必抓紧办

混沌录
2026-03-25 15:50:11
中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

中方拒收道歉,日本自卫官被转移,小泉进次郎沉默24小时后发声

何氽简史
2026-03-26 15:40:58
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

引而不发才是王道,封锁霍尔木兹海峡,伊朗打完了最后一张牌……

家传编辑部
2026-03-26 10:34:27
伊朗称正在搜捕逃亡美军

伊朗称正在搜捕逃亡美军

界面新闻
2026-03-25 23:21:14
家长违停孩子开门杀撞人后逃逸?交警回应

家长违停孩子开门杀撞人后逃逸?交警回应

中国新闻周刊
2026-03-26 14:46:51
突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

突发传闻:封锁霍尔木兹的伊朗关键人物被击毙

桂系007
2026-03-26 16:19:32
伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

伊朗战争还将持续多久?据传特朗普希望4-6周内终结战事

财联社
2026-03-26 18:29:05
张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

张雪峰奶奶近况令人担忧,4年内子孙相继离世,不设追思会瞒着她

古希腊掌管松饼的神
2026-03-26 11:29:25
坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

坚决反对中国任何城市申办奥运会,国际奥委会这次怕是真失算了

南权先生
2026-03-25 15:25:11
张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

张雪峰猝然离世,办公室内景曝光,摆设奇怪,写真照被指像遗照,生前的话字字催泪

笔墨V
2026-03-26 14:53:51
41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

41岁张雪峰去世后续,其婚姻被扒,已离婚6年,前妻很低调

180视角
2026-03-26 13:01:03
斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

斯柯达退出中国?大众中国回应:销售持续至年中,客户将持续获得全面售后支持

澎湃新闻
2026-03-26 17:02:26
一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

一觉醒来,爱吃活鱼的人天塌了,央视曝光的内幕真可怕!

涛哥锐评
2026-03-26 17:57:04
2026-03-26 20:35:00

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
时尚
亲子
家居
军事航空

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

皮衣+裙,高级到炸

亲子要闻

这就是引导型老师的厉害吗?

家居要闻

傍海而居 静观蝴蝶海

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版
×