今天凌晨,谷歌I/O 2026开发者大会在美国山景城正式开幕,当整个AI行业还在为谁是最强模型打得不可开交时,谷歌在今年的I/O大会上用实际行动做出了回应。
那就是与其跟别人挤同一张牌桌,不如直接换一个牌桌重新开打,并且带来了很多给力的产品,对于AI行业来说,应该有着很大的冲击。
关键发布了这么多的产品,对于用户来说,可能不知道有多少细节,为此迪子给大家汇总了全部的细节,并且进行了一定程度的详解。
或许可以说,真正的较量不在于谁造出最聪明的模型,而在于谁能最先让模型融入所有人的日常生活。
![]()
Gemini 3.5 Flash,干翻上代Pro!
首先登场的,是谷歌这次大会上最让人眼前一亮的狠货:Gemini 3.5 Flash。
简单说就是全面进化,Gemini 3.5 Flash融合了前沿模型的智能水平与Flash系列标志性的速度优势,是谷歌迄今为止最强大的智能体与编程模型。
而且在多项权威测试中,Gemini 3.5 Flash全面超越了自家的上一代旗舰Gemini 3.1 Pro,在Terminal-Bench 2.1测试中,它拿到了76.2%的高分,而3.1 Pro只有70.3%。
在GDPval-AA测试中更是飙到了1656 Elo,MCP Atlas测试也以83.6%的成绩拿下全场最高,就连多模态理解测试CharXiv Reasoning中,它的84.2%得分依然是全场第一。
![]()
但跑分只是一部分,Gemini 3.5 Flash真正的杀手锏是速度,它的输出速度超过了280 token/秒,是GPT-5.5和Claude Opus 4.7的整整4倍。
用谷歌自己的话说,过去开发者需要几天、审计人员需要几周才能完成的工作,现在在Gemini 3.5 Flash的协助下,时间可以大幅缩短,更重要的是使用成本往往还不到其他前沿模型的一半。
最关键的是谷歌宣布这一最强大模型将面向全球所有用户免费开放,覆盖谷歌全系产品和开放API,即日起生效。
稍微遗憾的是,Gemini 3.5 Pro确认将在下个月正式推出,目前已在谷歌内部投入使用,官方只说它的进步非常强,但具体细节暂时还未公布。
![]()
Gemini Omni:把AI带进世界模型时代!
谷歌将Omni定义为世界模型向前迈出的关键一步,用皮查伊的话说,AI正在从预测文本转向模拟现实,而Omni是第一个可以从任何输入生成任何输出的模型。
比如给在一张白纸上手绘一个圆圈,再加上一句文字描述,Gemini Omni就能直接输出一个完整的特效视频,如果对画面元素或风格不满意,只要一句话就能精准修改指定元素。
同时Omni Flash模型即日起在Gemini App、Google Flow、YouTube Shorts等平台上线,面向AI Plus、Pro和Ultra订阅用户开放。
与此同时,所有由Omni创建或编辑的内容都会被嵌入谷歌不可察觉的数字水印SynthID,用以应对AI生成内容的安全问题。
![]()
让人人都能当程序员,反重力2.0颠覆开发模式!
开发者侧的核弹当属反重力(Antigravity)2.0,它的定位不再是简单的IDE,而是一个通用智能体优先工作平台,可以同时部署多个子智能体,分别处理不同编程任务,并能安排后台自动化例程。
而且反重力2.0的恐怖能力在大会上得到了现场验证:在Gemini 3.5 Flash的加持下,仅用12个小时就从零搭建了一个操作系统内核,而整个开发过程的AI API成本还不到一千美元。
同时谷歌还同步推出了Antigravity CLI命令行工具和可本地部署的SDK,让开发者可以基于谷歌编码工具构建自定义智能体。
此外,谷歌还通过Gemini API推出了Managed Agents,开发者只需一次API请求就能启动一个运行在隔离Linux环境中的软件智能体。
![]()
不仅会写代码,更能当24小时AI管家!
如果说反重力2.0让开发者兴奋,那Gemini Spark的亮相则让普通用户彻底坐不住了,Gemini Spark被定义为全天候在云端运行的个人AI代理,即使你关掉电脑屏幕、锁上手机,它依然在后台默默帮你工作。
比如Spark深度整合了Gmail、Docs、日历等谷歌Workspace应用,能自动解析信用卡账单、监控学校邮件截止日期、筹划派对并自动发送提醒邮件,全程无需用户干预。
今年夏天它还将通过MCP协议进一步扩展到Uber、OpenTable等第三方应用。
在交互方式上,未来用户甚至可以直接通过短信和电子邮件与Spark对话,Gemini Spark将率先向Google AI Ultra订阅用户开放,这标志着Gemini不再只是一个被动回答问题的助手,而是能够主动采取行动的数字伙伴。
![]()
AI搜索、智能购物车、Android XR眼镜,谷歌要把AI塞进每一个入口
在重塑人们工作方式的同时,谷歌还不忘把AI渗透进用户最熟悉的场景中,谷歌宣布搜索的AI模式和AI概述现已全面采用Gemini 3.5 Flash,搜索框除了支持文本输入外,还新增了对图像、文件、视频和Chrome标签的支持。
一个更亮眼的功能是生成式UI,当用户提出陀飞轮是怎么工作的这类复杂问题时,搜索界面不再以传统对话框形式回复,而是自动生成一个互动式动态演示页面。
搜索中的智能体功能也得到了全面升级,现在支持创建和管理多个AI智能体,可以自动监控网页变化并向用户推送更新,并且代理编码功能即将引入搜索,搜索将能够使用动态布局、交互式小部件实时构建自定义响应。
同样炸裂的还有谷歌推出的全新通用购物车,这项AI驱动的购物体验横跨谷歌搜索、Gemini、YouTube和Gmail,用户可以随时随地将商品添加至智能购物车。
![]()
在内容消费端,YouTube推出了Ask YouTube功能,用户可以通过自然语言聊天式交互,系统引导用户找到符合搜索意图的视频片段并直接跳转至视频中的相关位置,彻底改变了传统的关键词搜索模式。
在办公效率上,Docs Live功能允许用户直接通过语音与Google Docs对话,Gemini可以自动从Gmail和Drive中提取相关信息,帮助用户快速创建和编辑文档,无需手动输入任何提示词。
而硬件方面,谷歌与三星联手打造的Android XR音频眼镜无疑是最大亮点,这款与Gentle Monster和Warby Parker合作设计的智能眼镜,佩戴者可通过语音命令让Gemini拍照、导航、翻译或播放音乐,且无需掏出手机。
值得一提的是,谷歌AI超级计划的定价也迎来重大调整:顶级Ultra套餐从250美元降价至200美元每月,同时新增100美元每月的中端超级套餐。
![]()
总之,这届I/O大会上,谷歌发布的新品之多、覆盖场景之广,几乎是科技行业史上最密的一次AI全家桶式轰炸,模型、开发者工具、个人智能体、搜索、购物、穿戴设备,谷歌几乎在每一个关键入口都布下了AI棋局。
对此,大家有什么想表达的吗?一起来说说看吧。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.