网易首页 > 网易科技 > 网易科技 > 正文

I/O大会,谷歌对自己开了一枪,逼死对手,先革己命!

0
分享至

出品 | 网易智能

作者 | 小小

编辑 | 王凤枝

Google I/O今日凌晨开幕,谷歌打了两枪。

第一枪,先打向自己。

谷歌把存在了25年的搜索框重写了。过去,搜索的核心是把用户带到网页;现在,AI直接住进搜索框里,替用户比价、追踪降价、生成仪表板,甚至跨商店统一结账。搜索不再只是给链接,而是直接办事。


这等于主动动摇自己的现金牛。搜索广告长期贡献Alphabet过半营收,但如果搜索从"给链接"变成"直接办事",广告竞价和流量分发的逻辑都会被重新改写。可谷歌没得选。它不动手,Perplexity们会替它动。

第二枪,再打向对手。

Gemini 3.5 Flash的能力接近四个月前旗舰模型3.1 Pro的九成,速度快4倍,成本降到三分之一到一半。皮查伊在台上算了一笔账:一家每天跑1万亿token的企业,如果把八成工作负载切到这个模型上,一年能省10亿美元。

这话不是说给极客听的,而是说给企业CFO们听的。

回头看,这场I/O的核心不是"谷歌有没有发布最强模型",而是它正在换战场:不再只拼谁更聪明,而是拼谁更便宜、谁更能干活、谁能无处不在地嵌进用户工作流

至于谷歌亲手拆掉旧搜索之后,能不能立起一个新的AI入口,还要等几个月后的真实使用来验证。

01搜索框里住了个"万事通":不仅会找,还会做

今年的Google I/O,谷歌从模型到应用全面出击。发布清单很长:Gemini 3.5 Flash模型、个人AI智能体Gemini Spark、Antigravity 2.0平台、翻新的Gemini应用、Flow创意工具升级、视频模型Gemini Omni(多模态输入输出+实时修改)、CodeMender安全智能体、智能体支付协议、第八代TPU芯片(TPU 8o/8i双架构),以及1800亿至1900亿美元的年度资本支出计划。

在所有这些发布中,最激进的一刀砍向了自己:搜索业务迎来25年来最大改版。

新的搜索框被拉长了,以适应人们向聊天机器人提问时那种更复杂、更口语化的习惯。但形态变化是表层的。真正的变化在于:AI智能体直接住进了搜索框。

搜索不仅能找到信息,还能动手做事。你搜索一个概念,它能直接生成一段解释视频或动态图表,嵌入搜索结果中。谷歌在台上演示了一个关于黑洞的搜索,智能体实时生成了解释视频,直接放进结果页面。

皮查伊的说法是:新的信息智能体将全天候在后台工作,在正确时刻找到用户确切需要的东西,并帮助采取行动。借助Antigravity平台的编码能力,搜索能为用户的个性化问题构建自定义交互体验,视觉模拟、仪表板、跟踪器,都能按需生成。

一个名为"生成式UI"的功能将在今年夏天上线。它根据不同回复类型(视频、图片、新闻)在浏览器中实时创建自定义布局,让最相关的内容自动获得最合适的呈现方式。

谷歌高级副总裁尼克·福克斯(Nick Fox)说,搜索的目标是让你把脑海中任何问题直接扔进去,不用管格式对不对。"我们应该能够在人们对搜索能做什么的理解上拓宽他们的视野。"今年夏天信息智能体上线后,它们会7×24在后台监控网络,某款产品降价了、某个你感兴趣的新研究发布了,智能体会主动推送,甚至帮你预订。

购物体验的改变更为直观。谷歌将推出跨商家的"通用购物车":浏览网页时把不同网站的心仪商品添加进去,智能体帮你跟踪价格变化、提示新品或新颜色。决定下单时,可以一次性结清分散在不同商店里的所有商品,使用谷歌的安全支付系统完成。当然,也可以选择回到原始零售商网站支付。

福克斯强调:"我们非常致力于让搜索能够服务于全球数十亿用户。"付费订阅用户还能在搜索中开启自定义仪表板,用于管理婚礼策划或健身计划等长期任务。

几个数字:谷歌搜索中的AI模式月活已超10亿,自推出以来每季度查询量翻倍。AI概览功能拥有超过25亿月活。谷歌的五项核心服务(搜索、Gmail、Android、Chrome和YouTube)各自拥有超过30亿用户。

02新模型不拼参数,拼的是性价比

另一个硬核更新:Gemini 3.5 Flash。谷歌的目标很明确,打破模型越聪明就越慢、越贵的铁律。

根据谷歌内部测试及独立分析机构Artificial Analysis的数据,在编码和智能体等多项基准测试中,这款模型的性能已超过四个月前的旗舰模型Gemini 3.1 Pro。具体来看:编码和智能体任务测试Terminal-Bench 2.1得分76.2%;多模态理解测试CharXiv Reasoning达到84.2%;多模态评估MMU-Pro拿到84%的最高分,让谷歌模型包揽该榜单前两名。


智能体能力是Gemini系列历史上的短板。这次,3.5 Flash的GDPval-AA分数从Gemini 3 Flash的1204和3.1 Pro的1314跃升至1656,仅略低于GPT-5.4在最高设置下的1674分。幻觉率降至61%,比Gemini 3 Flash改善了31个百分点。

AI与软件工程师马克·克雷奇曼(Mark Kretschmann)在体验后指出,谷歌基本上是在说,Flash现在已经足够强大,可以用于真正的智能体编码工作,而不仅仅是廉价和快速的替代品。"Flash曾经意味着妥协。现在它开始看起来像是默认选择。"

但最大的卖点不是跑分。谷歌DeepMind首席技术官兼首席AI架构师科雷·卡武克库奥卢(Koray Kavukcuoglu)透露,团队开发了一个更极端的优化版本,在相同质量下比竞争对手的前沿模型快12倍。这个版本从周二起在Antigravity平台内提供。

几个硬指标:输出速度超过每秒280个token,比Gemini 3 Flash及多个竞品快约70%;智能指数得分55,与3.1 Pro并驾齐驱,强化了谷歌在平衡速度与智能方面的一贯优势。

规模方面:谷歌云上模型API每分钟处理约190亿个token;所有自有平台(搜索、Gemini应用、Workspace等)每月处理超过3200万亿个token,过去一年增长七倍。皮查伊透露,超过375家Google Cloud客户在过去12个月中每家使用了超过1万亿个token。

世界顶尖免疫学专家、AI研究者德里亚·乌努特马兹(Derya Unutmaz)看到3.5 Flash的跑分后评论:它在编码和代理基准中比3.1 Pro好得多,成本仅为一小部分。他迫不及待想看到3.5 Pro,认为这些升级"是一次变革性的进步"。


这个期待不无道理。谷歌确认3.5 Pro正在内部使用,下个月向公众推出。按照每六个月一次大更新的节奏,届时市场将看到又一次跃升。

但并非所有开发者买账。软件开发者艾哈迈德·阿尔内米(Ahmed AlNeaimy)在实际项目中测试后,用"BenchMaxed"来形容,认为模型被过度优化以在基准测试上刷高分,真实工作中却频繁出现幻觉、卡住或无限循环。

他说模型"甚至连一个任务都完不成",完全不遵循指令。在他看来,"Flash"系列就是在用较低的智能换取速度,基准成绩与真实体验之间存在落差。他建议同行不要轻信跑分,直接用实际工作去检验。

03 Antigravity上的实战:从杂乱代码库到自制游戏

基准测试是实验室里的体检报告。Antigravity平台上发生的事情更像真实的运动表现。

一个例子来自代码维护:有开发者把一个杂乱的遗留代码库丢给3.5 Flash,要求迁移到Next.js框架。3.5 Flash在Antigravity中自主完成了整个过程,一堆技术债变成了结构清晰的现代项目。


内容管理场景中,3.5 Flash能根据动态标准自动重命名和分类非结构化的资产文件。一个外表失控的文件库交给模型,它按内容类型、日期、关联项目自动归类,把杂乱的共享盘变成可检索的资产库。

谷歌还在AI Studio上展示了创意和设计场景的能力:把一篇研究论文交给3.5 Flash,它直接生成交互式动画来阐释核心概念,而不是返回文字摘要。把一段纯文本描述变成可交互的硬件模型,能旋转、能拆解的三维展示。

在一所学校的筹款活动策划中,3.5 Flash并行执行多个创意方案:Logo、海报、邀请函、社交媒体文案,一次性产出完整品牌方案。在产品设计环节,60秒为一个结账流程生成多种不同的用户体验方案,让设计师快速比较和筛选方向。

这种能力溢出到了消费者端。谷歌搜索利用3.5 Flash构建了一个解释Gyroid图案的交互式可视化页面。过去搜索这种抽象数学概念,结果是维基百科链接加几张静态示意图。现在智能体实时搭建三维模型,让用户在浏览器里旋转、缩放,直观理解这个复杂结构。

04企业账单一年省10亿?皮查伊算了一笔token账

速度优势最终体现在账单上。

皮查伊在发布会上算了一笔很具体的账:"在谷歌云上,一家每天处理大约1万亿个token的企业,如果能将80%的工作负载从其他前沿模型迁移到Gemini 3.5 Flash上,一年可以节省超过10亿美元。"他还补了一刀:"你们可能从CIO那里听过,有些公司才到五月份就已经用完了全年的AI token预算。"

这个数字背后是残酷的现实:AI智能体在执行多步骤任务时不断推理、调用工具、修改代码,消耗的token是简单问答的几十上百倍。3.5 Flash单价看起来比前代贵,但推理更强、处理复杂任务更高效,整体拥有成本反而显著下降。

卡武克库奥卢强调,谷歌主要模型更新的节奏大约是每六个月一次。一个每六个月就能以更低综合成本超越之前旗舰的模型,从根本上改变了企业AI投资的规划周期。

这一逻辑已在早期测试中得到验证。

Box CEO亚伦·列维(Aaron Levie)分享了测试结果,向Box AI Agent提供各行业的常见任务,给定一组相关文档。结果:金融服务准确率从73%升至81%,公共部门从59%升至76%,医疗保健从51%升至73%,生命科学从47%升至67%。列维的评价:"持续的性能提升真是令人难以置信。"

沃顿商学院教授伊桑·莫里克(Ethan Mollick)提前体验后的感受:速度非常快,能力很强。他用它生成了一次性的程序化城镇,模型在过程中犯了一个错误,然后自己发现并纠正了它,这种自我纠错能力在复杂任务中尤为关键。


05智能体指挥中心 + AI私人管家

为了让企业更容易部署多智能体工作流,谷歌同步发布了Antigravity 2.0,一个独立的桌面应用,充当协调多个智能体的指挥中心。可以同时运行一个智能体编写网站、第二个生成品牌资产、第三个规划产品架构,所有智能体并行工作,单一界面管理。

Antigravity 2.0将谷歌内部工程师的token消耗量推到了每天3万亿个。皮查伊说,十周前这个数字还是0.5万亿,使用量"实际上每隔几周"就翻一番。这种规模创造了强大的反馈回路,模型团队能收集到大量真实世界信号,不断改进模型。

支撑这一切的是巨额基础设施。谷歌预计2026年资本支出约1800亿至1900亿美元,是四年前310亿美元的六倍。关键部分是第八代TPU芯片,首次采用训练和推理分离的双芯片架构(TPU 8o和TPU 8i)。配合Pathways系统,模型训练可以分布在多个数据中心,扩展到全球超过100万个TPU,目前世界上最大的训练集群。皮查伊说:"这意味着在几周内训练更大、更有能力的模型,而不用几个月。"

基于这套既快又省的基础设施,谷歌正式推出了Gemini Spark,一个真正意义上的个人AI智能体。

它完全在谷歌云端运行。你关掉笔记本电脑、锁上手机,它也能在后台继续工作。负责该项目的谷歌副总裁乔什·伍德沃德(Josh Woodward)的形容一如既往:"就像你把事情往身后一抛,Spark就会接住并完成工作。"

获得授权后,Spark可以连接Gmail、文档、幻灯片等工具。你可以设定重复任务:每月自动解析信用卡账单,标出新出现的订阅扣款。或者创建复杂工作流:去收件箱找出孩子学校发来的所有邮件,提取重要截止日期,整合成一份摘要,发送给你和你的伴侣。

它还能学习新技能。你正在计划一场活动,让它综合散落在邮件和聊天记录里的会议笔记,整理成一份谷歌文档,甚至起草后续沟通邮件。

安全方面,谷歌为它设定了严格边界:在执行花钱、发邮件等高影响操作前,Spark会先征求明确许可。伍德沃德将这种设计比作"给青少年他们的第一张借记卡"。谷歌还宣布了智能体支付协议:用户可设置品牌白名单、消费上限、指定商家等防护栏,智能体只能在框定范围内代表用户花钱。

06剩下的事:让AI变得好玩

除了处理事务的智能体,谷歌也没忘让AI变得好玩。

全新的视频生成模型Gemini Omni,能将文本、图片、视频等多种输入融合,输出电影级质量的视频。你给它一段走过金属雕塑的视频,说"把雕塑变成看起来像泡泡做的",它就能直接修改视频中的现实。谷歌强调,Omni改进了物理效果的处理,重力、动能、流体动力学,这些正是区分"看起来像AI视频"和"看起来像真实镜头"的细节。每个Omni生成的视频都带有SynthID数字水印。

去年的Flow工具集也获得了新能力:一张旧照片,上传后根据人物、环境和气氛,一次性生成16个不同的视频片段。用钢琴弹一小段旋律,录下来交给Flow,它把草稿扩展成一首制作精良的歌曲。

Gemini应用做了一次彻底翻新。新的设计语言叫Neural Expressive:流畅动画、鲜艳色彩、新字体。麦克风重新设计,允许用户按自己的节奏讲述复杂想法,不会因为"嗯""那个"等自然停顿被打断。数据:Gemini应用月活突破9亿,覆盖230多个国家和地区,支持超过70种语言。一年前是4亿。

但并非所有企业用户都买账。健康营销公司Klick Health的执行副总裁西蒙·史密斯(Simon Smith)大会后表示,他的脑袋被谷歌的工具矩阵搞得"天旋地转"。他列出一串名字(Spark、Antigravity、AI Studio、Flow、Pomelli、Pics)正是谷歌在此次I/O上展示的不同产品入口。

他向OpenAI和Anthropic喊话,请求"避免过度扩散",只给他一个能完成所有事情的强大智能体工具。但在他看来,真正的AGI不应该需要这么多界面。

结语:两枪打完,效果还没出来

但也有人持保留态度。X用户TheQuantLord在大会后评论:整场I/O证实了一个判断,谷歌并没有引领AI,而是在迎头追赶。3.5 Flash、智能体间通信协议A2A、模型降价、搜索中嵌入智能体,每一条公告都能在其他厂商的动作中找到先例。"真正的故事不是谷歌宣布了什么,而是他们只是在跟随,而不是设定节奏。"

这场持续一个多小时的主题演讲,落点不在任何单一产品上,而在于谷歌正在构建的一套完整叙事:AI不再比拼单纯的参数,而是要成为在你背后持续运行的引擎。从搜索框到文档编辑器再到购物车,谷歌试图让AI智能体成为所有服务的默认层。

但两枪都是盲狙。

第一枪打向搜索广告,拆了旧的,新的能不能补上,没人知道。通用购物车和智能体订阅的营收,能不能填上广告流失的窟窿,要看接下来几个季度的财报。

第二枪打向对手,便宜到让你不换别家。但阿尔内米的实测提醒了一件事:跑分高不等于干活行。如果Flash在真实项目里频繁翻车,企业CFO省下的10亿美元可能是纸面上的。

谷歌这次没有在"谁最强"的擂台上继续打。它把竞争拖进了自己选的战场。至于这个战场是不是它以为的样子,过几个月才知道。

相关推荐
热点推荐
真的没油了!CBA今夏很大可能退役的4位球星

真的没油了!CBA今夏很大可能退役的4位球星

男足的小球童
2026-05-20 19:19:52
“见过最廉价的兜底”,一份趁热吃的山姆烤鸡,让家长被全网群嘲

“见过最廉价的兜底”,一份趁热吃的山姆烤鸡,让家长被全网群嘲

妍妍教育日记
2026-05-20 16:49:27
江苏一地发布最新人事任免

江苏一地发布最新人事任免

扬子晚报
2026-05-20 17:34:27
26年前的5000美元变成50000棵树,筹款者赛考斯:迫不及待想去毛乌素,和殷玉珍一起,种下新的树苗

26年前的5000美元变成50000棵树,筹款者赛考斯:迫不及待想去毛乌素,和殷玉珍一起,种下新的树苗

新京报
2026-05-19 21:21:13
49岁当大官,73岁被开除党籍!薄一波亲家李雪峰,后劲太大了

49岁当大官,73岁被开除党籍!薄一波亲家李雪峰,后劲太大了

混沌录
2026-05-19 19:23:07
泡药时一声不吭,滞销时哭泣卖惨,果农的眼泪,换不来网友的同情

泡药时一声不吭,滞销时哭泣卖惨,果农的眼泪,换不来网友的同情

谭谈社会
2026-05-17 23:02:27
中国人最尊敬的清华校长携巨款逃去美国,如今惊人秘密浮出水面

中国人最尊敬的清华校长携巨款逃去美国,如今惊人秘密浮出水面

随梦而飞起
2026-05-20 07:05:31
学医后才知道,脑梗最危险信号,不是手脚麻,而是频繁出现4症状

学医后才知道,脑梗最危险信号,不是手脚麻,而是频繁出现4症状

路医生健康科普
2026-05-20 17:57:48
张本智和连夜搬空日本豪宅,21岁世界第三为何甘愿“逃跑”?

张本智和连夜搬空日本豪宅,21岁世界第三为何甘愿“逃跑”?

南宗历史
2026-05-20 00:53:41
伊能静写长文给秦昊庆生!只吃蛋糕很简朴,9岁米粒皮肤黑黄随爸

伊能静写长文给秦昊庆生!只吃蛋糕很简朴,9岁米粒皮肤黑黄随爸

枫尘余往逝
2026-05-20 14:34:13
普京到了,美俄元首为何接连访华?

普京到了,美俄元首为何接连访华?

中国新闻周刊
2026-05-20 00:12:34
骑士G1不敌尼克斯!网友怒撕:NBA历史最大假球,果然是商业联盟

骑士G1不敌尼克斯!网友怒撕:NBA历史最大假球,果然是商业联盟

小徐讲八卦
2026-05-20 13:22:40
盒马误将水仙当百合配送致顾客中毒,官方处罚了!消费者:盒马告我敲诈,将诉讼

盒马误将水仙当百合配送致顾客中毒,官方处罚了!消费者:盒马告我敲诈,将诉讼

新民晚报
2026-05-20 13:48:56
老公婚后借给别人钱上瘾,妻子:没钱刷信用卡也要借!父亲患癌需用钱,借款人却拒不还款……

老公婚后借给别人钱上瘾,妻子:没钱刷信用卡也要借!父亲患癌需用钱,借款人却拒不还款……

鲁中晨报
2026-05-20 16:50:17
网传女骑手越来越多了,说明了什么?评论区炸锅…

网传女骑手越来越多了,说明了什么?评论区炸锅…

慧翔百科
2026-05-20 17:27:17
医生忠告:肺癌早期不是咳嗽,而是频繁出现这3个症状,小心异常

医生忠告:肺癌早期不是咳嗽,而是频繁出现这3个症状,小心异常

芹姐说生活
2026-05-20 15:00:20
普京访华规格和特朗普比谁高?

普京访华规格和特朗普比谁高?

烽火观天下
2026-05-20 12:07:45
1.72亿英镑!曼联分红仅次于阿森纳曼城,今夏3位置已定顶级新援

1.72亿英镑!曼联分红仅次于阿森纳曼城,今夏3位置已定顶级新援

体坛鉴春秋
2026-05-20 18:24:37
5月20日A股猛料:国务院高层重磅发声!国家队正悄无声息的加仓!

5月20日A股猛料:国务院高层重磅发声!国家队正悄无声息的加仓!

丁丁鲤史纪
2026-05-20 10:45:34
北京协和专家:2块钱的维生素B12,是失眠的顶尖药,便宜又管用!

北京协和专家:2块钱的维生素B12,是失眠的顶尖药,便宜又管用!

健康科普365
2026-05-19 09:25:22
2026-05-20 19:48:49

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

头条要闻

杨梅被"一刀切"禁入 福建杨梅协会会长恳求给果农生路

头条要闻

杨梅被"一刀切"禁入 福建杨梅协会会长恳求给果农生路

体育要闻

不再美丽的阿森纳,终于成为英超冠军

娱乐要闻

王菲“没事儿”,成年人学不来的松弛

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

焕新极氪009上市41.38万起 齐家版让MPV回归家庭

态度原创

房产
旅游
教育
健康
公开课

房产要闻

别被中介带了节奏,你的房子可能比你想的值钱

旅游要闻

贵阳避暑季启幕,多项惠客政策诚意满满

教育要闻

志愿不是一定能录才能填

专家:别把PRP当作“自体干细胞”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×