网易首页 > 网易号 > 正文 申请入驻

Google I/O 2026炸场:世界模型、AI数字水印来了,Gemini正式进入“Agent时代

0
分享至

文 | 大模型之家

北京时间5月20日凌晨,谷歌年度开发者大会Google I/O 2026在加州山景城拉开帷幕,谷歌 CEO 桑达尔・皮查伊正式宣布:我们已经进入了"智能体Gemini时代"。

十年 AI-first,从实验室走向数十亿人

"十年前我们将公司转向AI-first,今天我们仍然认为AI是推进我们使命、大规模改善人们生活的最深刻方式。"皮查伊在开场演讲中说道。

他用一组震撼的数据展示了过去一年AI的爆发式增长:

  • 谷歌每月处理的tokens从两年前的9.7万亿,增长到去年的480万亿,今天已经突破3200万亿(3.2 quadrillion),增长了7倍;
  • Gemini应用月活用户从去年的4亿,增长到今天的9亿多,日请求量增长了7倍;
  • 搜索AI Mode推出仅一年,月活用户已超过10亿,成为谷歌历史上增长最快的功能之一;
  • 超过850万开发者每月使用谷歌的AI模型构建应用。

支撑这一切的是谷歌史无前例的基础设施投入。皮查伊透露,2022年谷歌的资本支出为310亿美元,2026年这一数字将达到1800-1900亿美元,增长了近6倍。

首次推出“双芯片策略”:推倒数据中心的隐形物理墙

面对全球性的电力紧缺与单一数据中心容量逼近物理极限的残酷现实,谷歌首次推出了双芯片策略,将底层硬件架构划分为互不干扰的两条主线:专门用于大规模预训练的TPU 8t,以及针对高并发推理极限优化的TPU 8i

作为训练怪兽,TPU 8t带来了较上一代接近三倍的原始算力提升。但更根本的转变在于底层软件栈的彻底解放。通过底层分布式框架JAX与Pathways的深度重构,谷歌向行业昭示了一种全新的可能:模型训练不再受限于单一巨型数据中心的物理围墙。依靠这两项核心技术的全网调度,谷歌成功在全网范围内实现了跨越多个物理站点的协同训练,在全球范围内无缝串联起超过100万个TPU。

这一技术突破直接瓦解了过去堆砌单体机房的军备竞赛。对于模型构建者而言,这意味着超大规模模型的训练周期从过去的数月缩短至数周。而负责推理的TPU 8i则一击切中了商业化落地的最大痛点——延迟。谷歌在过去27年的搜索工程中提炼出的核心信条在这颗芯片上体现得淋漓尽致:在AI时代,延迟依然决定着应用的生死。TPU 8i在推理执行的每一个微小步骤上都进行了硬件级加速,为上层智能体的实时响应提供了可能。

Gemini 3.5与Gemini Omni:从文本概率到物理世界模拟器的升维

基础设施的跃迁直接催生了全新底座模型家族的落地。谷歌在会场正式揭晓了Gemini 3.5系列模型,其演进策略展现出极强的针对性:不再一味追求参数体量的空前膨胀,而是全面转向速度、经济性与行动力的平衡。

作为即日起全球上线的默认主力,Gemini 3.5 Flash的表现几乎打破了行业对轻量化模型的认知。在多项基准测试中,它的表现全面超越了上一代的旗舰主力Gemini 3.1 Pro。尤其在编程能力与全新引入的GDPVal(经济价值评估测试)中,Gemini 3.5 Flash展现出了显著优势。

在维持顶尖智能的同时,Gemini 3.5 Flash在每秒输出Token的数量上,达到了其他同级别前沿模型的四倍。这种极端的性价比优势,是谷歌试图在开发者层面对开源与闭源竞争对手实施降维打击的战略底牌。

更具颠覆性的底层突破来自全新亮相的Gemini Omni家族。这并非传统意义上的多模态模型,谷歌将其定义为一个真正意义上的“世界模型”。

Gemini Omni的本质是一套能够将任何输入模态(文本、图像、视频、音频)转化为任何输出模态的统一网络。作为该家族首款落地的产品,Gemini Omni Flash不仅能完美理解输入的各种视听信号,更具备了对物理世界的直观感知能力。谷歌在现场演示中表明,该模型已经能够理解动力学规律、动能转换与重力效应,并被直接应用于前沿机器人的训练中。

在面向用户的体验层面,Gemini Omni Flash将推理与内容生成的边界彻底模糊。在一场演示中,用户仅通过自然的对话沟通,就能让Omni将一段复杂的关于氨基酸的定格动画短片进行精准编辑,无论是替换背景、调整分镜还是改变角色的物理运动轨迹,模型均能通过对话实时渲染输出高品质的电影级视频。Omni的出现,实际上将Nano、Genie和Veo等独立模型的能力完全熔炼于一炉,完成了多模态向全模态的升维。

Gemini Spark——7*24小时在线的个人AI智能体

模型的升维引发了应用层交互逻辑的剧烈塌陷。谷歌在会上重磅推出了面向大众的全面智能力量——Gemini Spark,一个能够7×24小时在后台自主运转的个人AI智能体。

与过往“用户输入提示词、AI做出单次反馈”的被动交互模式截然不同,Gemini Spark依托于谷歌全新的Antigravity(反重力)开发平台,具备了极为罕见的主动性特征。它像一个永远不知疲倦的数字秘书,隐匿在系统后台,甚至在用户合上笔记本电脑或锁死手机屏幕时,依然在云端不间断地处理复杂任务。它可以自主翻阅用户上个月的银行账单,精准捕捉并标记出那些隐藏很深的连续扣费订阅;也可以实时检索全家人的邮件与日程,在清晨自动生成一份毫无冗余、极具行动导向的家庭日常简报。

这种深入到系统底层的自主性,建立在一项重大的生态联盟之上。Gemini Spark不仅打通了谷歌自身的Workspace组件,更通过MCP深度集成了包括AdobeAsanaDropboxLyftUberZillow在内的超过30款主流第三方应用。通过这一协议,智能体彻底摆脱了应用孤岛的限制,能够跨平台串联起复杂的行动链条。

为了防止自主智能体在执行任务时失控,谷歌同步推出了配套的底层合规防御系统——Agent Payments Protocol(智能体支付协议,简称AP2)。作为Gemini Spark与所有外部商业接口交互的最高护栏,AP2严格限制了AI在未经用户显式授权或知情的情况下的任何越权消费或财务承诺行为,确保了技术在向高自主性演进过程中的金融资产安全。

在开发者端,谷歌Flow的推出则让“Vibe Code”的概念走向大众。开发者乃至完全不懂代码的创意人员,如今可以直接在Flow环境中,通过纯粹的意图对话、手绘草图或者视听素材的堆叠,实时构建出各种复杂的视觉工具、定格动画图层或视频特效工具。开发不再是枯燥的语法编译,而变成了对创意的实时捕捉与即时显现。

从多模态搜索到全场景AI的野心

在更广泛的生态落地层面,谷歌展现出了全面解构传统互联网入口的意图。谷歌搜索的AI Mode引入了名为Generative UI(生成式用户界面)的技术。

现在,当用户在搜索框中提出一个复杂的系统性问题——例如探究太阳系行星的轨道周期时,搜索引擎返回的不再是冰冷的链接和一段总结性的文字,而是基于当前问题在前端实时组装、动态渲染出来的一个具备完整交互功能的动态星体轨道模拟组件。网络界面不再是预先设计好的死板网页,而是根据用户意图即时生成的专属应用程序。结合通用购物车与信息智能体的协同,整个搜索体验正在转变为一个闭环的决策与执行引擎。

为了应对生成式内容泛滥可能导致的信任危机,谷歌宣布将SynthID数字水印技术从原有的多模态生成软件全面扩大至Google SearchChrome浏览器底层。用户可以通过“圈选搜索”或直接右键点击,在毫秒级时间内调取C2PA内容凭证,死死卡住虚假合成内容的生存空间。

而在办公与日常高频场景中,谷歌也推出了各种新的功能:

  • Docs Live允许用户通过极其随意的语音倾倒,由Gemini在后台实时将其梳理为结构严密、逻辑严谨、毫无口语碎屑的专业级正式文书。
  • Google Pics成为全新的深度图像生成与生成式编辑核心组件,彻底重构了 Workspace 内部的视觉资产创作链路。
  • Daily Brief作为开箱即用的常驻Agent,在清晨为用户提供最具优先级的日程和任务穿透式编排。

现场,谷歌还宣布与三星达成深度硬件合作,并联合时尚眼镜品牌Warby Parker及Gentle Monster,共同推出了搭载Gemini Intelligence的全新智能眼镜。

在大模型之家看来,谷歌真正想推向给市场的,是一整套新的工作方式:模型负责理解,代理负责执行,产品负责把执行嵌进每一个高频场景里。Search、Gmail、Docs、YouTube、Shopping、Android、Chrome,这些原本分散的入口,正在被同一套Gemini逻辑重新串起来。

如今的AI竞争,已经不是谁能生成一段更像人的回答,而是谁能在用户还没意识到的时候,把事情默默办完。按谷歌自己的说法,这些能力会按地区和订阅层级分批开放;但从产品线的密度和更新速度看,谷歌已经把牌面摆得很清楚:它要争夺的,不只是模型榜单,更是下一代操作系统式的入口。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
果然有内情!广西老表收割机爬梯被偷后续,当事人透露更多引热议

果然有内情!广西老表收割机爬梯被偷后续,当事人透露更多引热议

火山詩话
2026-06-02 07:04:40
姚明恩师!火箭22连胜功勋教练去世,球迷发文缅怀

姚明恩师!火箭22连胜功勋教练去世,球迷发文缅怀

体育吐槽
2026-06-02 11:20:09
别撸铁了,撸前额叶吧!9件小事帮你疯狂长脑子,13岁以上通用

别撸铁了,撸前额叶吧!9件小事帮你疯狂长脑子,13岁以上通用

蓁蓁心理抚养
2026-05-22 07:20:03
孩子压岁钱账户原有20多万 父母离婚时却只剩40元!母亲称100%花在孩子身上 法院判决:返还22万

孩子压岁钱账户原有20多万 父母离婚时却只剩40元!母亲称100%花在孩子身上 法院判决:返还22万

闪电新闻
2026-06-02 09:38:46
安家费都没有了,今年是博士就业最难的一年

安家费都没有了,今年是博士就业最难的一年

新浪财经
2026-06-02 09:10:57
“牛鼻子”校友有了新身份,就职衡水泰华中学科技校长

“牛鼻子”校友有了新身份,就职衡水泰华中学科技校长

趣笔谈
2026-05-06 11:30:03
毛远新透露,毛主席最后的遗嘱应该只有9个字

毛远新透露,毛主席最后的遗嘱应该只有9个字

历史伟人录
2024-09-27 13:44:11
郑丽文登机前,赵少康再发声,或上演“换柱”闹剧,王金平成关键

郑丽文登机前,赵少康再发声,或上演“换柱”闹剧,王金平成关键

一口娱乐
2026-06-01 19:07:50
19岁悠仁亲王首次出席国宴,全程英语交流举止得体,爱子沦为背景

19岁悠仁亲王首次出席国宴,全程英语交流举止得体,爱子沦为背景

照见古今
2026-06-01 18:14:49
胡彦斌AI手搓App上线:仅耗时一个多月 最会编程的歌手出现了

胡彦斌AI手搓App上线:仅耗时一个多月 最会编程的歌手出现了

快科技
2026-06-01 11:01:07
喝完肚子疼发现已经过期9天 顾客在便利店买到过期椰子水 门店负责人:无法回应

喝完肚子疼发现已经过期9天 顾客在便利店买到过期椰子水 门店负责人:无法回应

闪电新闻
2026-06-02 11:15:24
西班牙大热必死?梅西卫冕魔咒?排除法做完,只剩三支球队能夺冠

西班牙大热必死?梅西卫冕魔咒?排除法做完,只剩三支球队能夺冠

宝哥精彩赛事
2026-06-02 00:59:28
利好来袭!刚刚,上海重磅发布!

利好来袭!刚刚,上海重磅发布!

数据宝
2026-06-01 21:59:35
抽烟又火了?医生研究发现:冠心病病人在抽烟时,需要多注意6点

抽烟又火了?医生研究发现:冠心病病人在抽烟时,需要多注意6点

今日养生之道
2026-06-02 09:09:52
央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

央视三胎宣传片惹争议,脱离现实强行把孕妇塑造成超人式幸福?

番外行
2026-05-24 09:14:38
上海或将迎来大洗牌!未来五年,这些片区要沸腾了!

上海或将迎来大洗牌!未来五年,这些片区要沸腾了!

水泥土的搞笑
2026-06-01 20:55:07
孩子压岁钱账户20多万,离婚时只剩几十元,父母双方闹上法庭!母亲:100%都花在孩子身上了;法院:10日内返还22万元

孩子压岁钱账户20多万,离婚时只剩几十元,父母双方闹上法庭!母亲:100%都花在孩子身上了;法院:10日内返还22万元

都市快报橙柿互动
2026-06-01 23:30:31
释放信号,连《火遮眼》都能不删减上映,电影审批真的放宽松了

释放信号,连《火遮眼》都能不删减上映,电影审批真的放宽松了

星宿影视鸭
2026-06-02 11:38:13
释永信获刑24年:大树倒下,九旬老母泪洒,家族繁华散尽

释永信获刑24年:大树倒下,九旬老母泪洒,家族繁华散尽

趣味萌宠的日常
2026-06-02 10:16:16
外蒙古彻底绷不住了!脱离中国独立,现在后悔了吗?

外蒙古彻底绷不住了!脱离中国独立,现在后悔了吗?

奇思妙想生活家
2026-06-01 19:50:09
2026-06-02 12:15:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
134417文章数 862213关注度
往期回顾 全部

科技要闻

英伟达RTX Spark 很猛,但首批机型不便宜

头条要闻

英国教授来中国考察被震撼:堪称人类史上最伟大功绩

头条要闻

英国教授来中国考察被震撼:堪称人类史上最伟大功绩

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

本地
家居
旅游
数码
公开课

本地新闻

用剪纸的方式,打开江苏扬州

家居要闻

流线型轮廓 包容多元身形

旅游要闻

中国文旅看山西丨千年古邑承文脉 风华汾西启新程

数码要闻

华为nova 16系列发布:2999元起 全系配备后置红枫原色镜头

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版