网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

谷歌深夜放送：比肩GPT-4o的多模态助手、AI概述搜索结果、新视频生成模型Veo……

2024-05-15 05:59:41　来源: 头号AI玩家

上海举报

0

分享至

作者 | 卷毛‍‍‍‍

编辑 | 张洁‍‍

面对OpenAI的贴脸开大，谷歌选择原地回击。

今天凌晨1点（北京时间），谷歌在2024年I/O大会上放出大招——

更强的多模态Agent助手Astra，能实时理解镜头内外的世界。

多模态和长文本是本次发布的关键词，谷歌CEO桑达尔·皮查伊表示，多模态和长文本相结合，扩展了我们可以提出的问题类型，也扩展了我们可以得到的答案类型。

Gemini系列模型卷起了长文本，1.5 Pro的上下文窗口将扩展到200万个token；新发布的Flash是轻量级模型，定价每100万个token35美分，远低于GPT-4o 5美元的价格。

搭载了Gemini的谷歌家族产品也华丽升级：谷歌搜索支持输入视频提问，还将上线“AI概述”的结果页面；安卓系统手机内置AI助手，图上画个圈就能全局搜索。

AIGC方面，更逼真的图像生成模型Imagen 3发布；全新的视频生成模型Veo剑指Sora，可生成时长超60秒的高清视频……

皮查伊称目前有20亿用户在使用Gemini，Gemini时代刚刚拉开帷幕，谷歌希望最终让AI造福每个人。

“头号AI玩家”全程围观了直播，以下是我们梳理的本次主旨演讲的要点。

多模态Agent来了，Gemini精准打击GPT-4o

众所期待的Agent（AI智能代理）终于来了。

谷歌在I/O大会上分享了新项目Project Astra，一个不亚于GPT-4o的AI智能助手，可以像人一样了解周遭的复杂世界，在日常生活中提供实时帮助。

比如在办公室里开着摄像头转一圈，AI能识别出画面中的物品，解释正在写的代码，判断所在的地理位置。

演示视频中，官方还展示了如何将Astra与AR眼镜相结合，这也成为其中一个亮点。戴上眼镜后，Astra的回答会实时显示在眼前，比如帮助修改白板上的流程图时，会用箭头指出修改位置。

不过，与昨天OpenAI推出的GPT-4o相比，后者在演示中展现了更多令人惊喜的情感丰沛的互动，虽然也有即刻网友评论，“感觉OpenAI想为每个人打造自己的专属舔狗”。

此前谷歌刚发布Gemini时，其多模态交互演示视频还需要经过剪辑，如今发布的Astra视频特意强调了是“一次性实时拍摄的”。

Agent是一种智能系统，可以了解多模态信息，提前规划多个步骤，并代表用户采取行动。从演示来看，Astra延迟低、反应快、互动自然，仿佛就是身边的一个专家助理。

此外，谷歌还公布了Gemini系列模型的最新进展。

Gemini 1.5 Pro的上下文窗口将扩展到200万个token，可以处理数百页文档，并向开发人员提供私人预览版。

面向全球开发者开放的Gemini Advanced则提供长达100万token的上下文窗口，支持超过35种语言。

Gemini Advanced将在几周内上线新的数据分析功能，晚些时候还会增加旅行计划功能，通过高级推理创建个性化的行程。

Gemini 1.5 Flash是新推出的轻量级模型，针对低延迟和低成本任务进行了优化，可以更高效率地部署。开发人员即日起可在Google AI Studio和Vertex AI中使用，上下文窗口可达100万token。

Gemini的Gems功能将在今年夏天推出，类似于GPTs，可通过Prompt设置为不同专长的AI助理。

同时，作为原生的多模态模型，Gemini的语音和视频能力迎来升级，即将上线的“Live”功能，其逼真程度可以说是对标GPT-4o。

你能与Gemini进行更深入的双向对话，回答中可以随时打断，打开摄像头，Gemini就能看见和理解周遭发生的一切。看来AI头号玩家们的理想AI助手都有电影《Her》的影子。

新增图像视频搜索，AI一键联网总结

随着ChatGPT、Copilot等AI产品席卷全球，用户获取信息的方式正悄然改变，本次谷歌的当家产品“谷歌搜索”率先迎来了重大升级，集成了最新的智能代理助手。

在搜索时，你可以通过视频提问，比如录一段视频问道：“为什么这个放不上去？”

Gemini能理解问题是视频中的唱片为什么不能固定在唱片机上，并迅速搜索文章、论坛、视频等全网信息，给出解决办法。

相比传统的搜索结果罗列，如今有了Gemini加持的谷歌搜索还将上线全新的搜索结果整合功能“AI概述”（AI Overviews）。

比如在现场演示中，当我们想要在波士顿找到最好的瑜伽或普拉提工作室，并在结果中显示它们的入会优惠信息，以及与住址的距离。

Gemini一次搜索就能获得所有信息，并组织呈现出有条理的搜索结果页面。

据介绍，谷歌搜索升级后支持多步骤推理功能，可以将大问题分解为若干部分，并找出要解决的问题以及解决的顺序，因此原本可能需要花费数分钟甚至数小时才能得出的结果，现在可以在几秒钟内完成。

“AI搜索概述”功能将在美国率先推出，未来将覆盖10亿用户。

此外，在手机端，谷歌相册（Google Photos）即将推出的一项新功能“Ask Photos”。

在图片上画个圈，就能搜索指定的对象，比如搜索带有车牌号的照片，或者问问“最近女儿游泳学得怎么样”，Gemini能理解复杂的语境，轻松找到对应的照片和视频。

AIGC模型上新，Veo可生成超60秒高清视频

在图像、音乐、视频领域，谷歌都分别都发布了新的模型或产品。

图像生成

谷歌推出了迄今为止最高质量的文本到图像生成模型Imagen 3，生成的图像细节更丰富、更真实，而且能理解复杂文本提示。

Imagen 3生成

音乐生成

谷歌和YouTube共同打造了Music AI Sandbox，这是一套专业的AI音乐创作工具，可以帮助创作者从0开始快速创作。

视频生成

谷歌发布了最新的视频生成模型Veo，只需一个文本、图片或视频提示，即可创建超过60秒的高质量1080p片段，支持多种电影风格，包括写实主义、超现实主义、动画等。或许未来每个人都会成为导演。

以上这些AIGC模型，目前都可以在labs.google上申请试用。

谷歌全家桶AI升级，安卓手机抢先搭载AI助手

不出所料，升级后的Gemini 1.5 Pro将集成在更多的谷歌全家桶产品中，包括邮件、会议、文档等软件，以及手机等硬件设备。

比如Gmail中的Gemini能一键总结邮件内容，自己不用去多个邮件、附件中查阅，Gemini会根据语境分析，还会给出回复建议。

向Excel中的Gemini提问，不用再费力编写公式，AI会自动进行数据分析，以图表形式给出计算结果。

对于以AI为核心的手机，谷歌提到了三个关键应用：AI驱动搜索（上文提到的图片画圈搜索），系统自带的AI助手（目前安卓系统可用），AI保护隐私和安全（提示诈骗风险）。

谷歌表示，今年晚些将拓展Gemini Nano的多模态功能，新增视觉、声音、口语输入，这意味着AI手机可以帮助更多视力障碍群体等用户更好地交流和生活。

皮查伊近日在接受《The Circuit With Emily Chang》专访时提到，在技术领域，如果你不持续创新以保持领先，那么任何公司都将不可避免地走向衰败。

自2016年起，人工智能便一直是谷歌公司的核心焦点，谷歌的研究人员发明了Transformer，也就是GPT中的T。那时，OpenAI开发的ChatGPT尚处于起步阶段。

而到了如今的生成式AI时代，谷歌却屡次被OpenAI抢了风头，同时还面临着微软等竞争对手的严峻挑战。

从今年I/O大会主旨演讲发布了这么多新模型和产品升级来看，谷歌仍在坚持AI First的战略方向，无论是搜索还是AIGC应用等，AI的前沿高地必有谷歌的位置。

更多关于本次谷歌I/O大会的内容可前往官网查阅：https://io.google/2024/intl/zh/

「头号AI玩家交流群」进群方式：添加微信“banggebangmei”并备注姓名+职业/公司+进群，欢迎玩家们来群里交流，一起探索见证AI的进化。

欢迎分享、点赞、在看

一起研究AI

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

奥特曼点赞的谷歌AI播客爆火 Meta：我有开源平替谷歌的AI播客产品NotebookLM火爆外网

量子位 2024-10-29 11:48:57
0 跟贴 0
华人带队，小扎亲自督战！Meta秘密研发8个月，打造自家AI搜索引擎

新智元 2024-10-30 12:57:52
2 跟贴 2

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

量子位 2024-09-08 13:27:35
57 跟贴 57

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

机器之心Pro 2024-09-03 14:38:55
0 跟贴 0
鹅厂造了个AI翻译公司：专攻网络小说，真人和GPT-4看了都说好

量子位 2024-05-25 15:40:12
0 跟贴 0

“全面拟人”机器人来了！直膝行走，狂踹不倒

量子位 2024-10-30 08:00:00
8 跟贴 8

肌肉骨骼居然和人类一样。外网爆火的克隆机器人，灵活性超高，胸腔里还复刻了人类的心脏瓣膜，宛如《西部世

量子位 2024-10-26 12:28:00
0 跟贴 0
o1驾驶无人机后空翻，OpenAI开发者日惊掉下巴！2分钟爆改代码写App

新智元 2024-10-31 13:50:31
20 跟贴 20

搭载ChatGPT的《星际穿越》机器人爆火，马斯克：想要！ ChatGPT复刻版《星际穿越》机器人T

量子位 2024-07-09 12:03:11
0 跟贴 0
网友一个定积分的WIFI密码，测出了AI数学之王。Grok超强数学思维碾压ChatGPT，引马斯克点

量子位 2024-10-31 18:55:41
12 跟贴 12
不会写代码全交给AI，它能写出完整的APP吗？这是我们的测试结果

量子位 2024-09-04 13:29:57
0 跟贴 0
全世界跑得最快的人形机器人，还能跳科目三都知道波士顿动力的机器人会空翻，那你知道中国品牌宇树科技有

爱范儿 2024-07-04 20:41:36
6175 跟贴 6175
告别屈膝小碎步让机器人像人一样走路国产团队造出“钢铁侠”

量子位 2024-10-24 11:42:12
396 跟贴 396
全球最远1.4米！国产宇树创人形机器人跳远纪录，外网惊叹碾压特斯拉

量子位 2024-10-19 12:16:06
2647 跟贴 2647
人形机器人狂奔！山地、草地、公路无障碍，原速演示全程高能

量子位 2024-10-14 13:19:05
1158 跟贴 1158
“全面拟人”机器人来了！直膝行走，狂踹不倒，互动聊天超自然 “全面拟人”的机器人Orca Ⅰ来了！不

量子位 2024-10-30 08:21:34
6 跟贴 6
机器人身穿衣服做家务被质疑！来自OpenAI押注的独角兽因过于逼真被怀疑是真人套壳——人形机器人初

量子位 2024-09-04 18:16:57
14 跟贴 14
波士顿动力电驱机器人进厂打工，全程自主无遥控，50万人在线围观

量子位 2024-10-31 14:41:28
2 跟贴 2
大疆前高管带6人创业，做出了类目Top1的割草机器人

钛媒体APP 2024-05-30 14:49:18
0 跟贴 0
纯血鸿蒙，再造一个操作系统时代

36氪 2024-10-23 19:33:48
5 跟贴 5
大模型如何助力企业AI创新？阿里云AI专家为你解答哪些因素影响企业用户选择模型服务平台？检索增强R

量子位 2024-09-05 20:40:15
0 跟贴 0
机器人独立造车真的可行吗？网友脑洞大开试验，结果来了！

量子位 2024-09-03 10:49:25
0 跟贴 0
最有打工天赋的机器人出现了！一镜到底的连续大负载搬运，动态超稳，来自国产的逐际动力

量子位 2024-08-12 10:39:39
0 跟贴 0
国产最强语音大模型诞生，MaskGCT宣布开源，声音效果媲美人类

机器之心Pro 2024-10-30 18:27:25
2 跟贴 2
谷歌被俄罗斯罚款？

闪电制片厂 2024-10-31 19:48:02
1016 跟贴 1016
抢疯了，腾讯给大模型人才，定了一个前所未有的标准

机器之心Pro 2024-06-21 15:20:08
0 跟贴 0
年轻人抛弃搜索引擎

虎嗅APP 2024-10-09 16:10:30
888 跟贴 888
女子分享美国谷歌工作的一天，网友：这福利什么水平？

动态新闻 2024-10-31 16:00:03
4 跟贴 4
我，500元买了台谷歌版Mac mini，居然能畅玩LOL？

雷科技 2024-07-08 14:19:33
0 跟贴 0
俄罗斯法院对谷歌处以20000000000000000000000000000000000（35位数

江西都市现场 2024-10-31 23:42:41
0 跟贴 0
2024年10月31日信息差丨谷歌被俄罗斯罚款35位数

信息Summary 2024-10-31 22:55:41
0 跟贴 0
穿上感觉像轻了27斤！三万块一条的裤子，竟然卖爆了？谷歌孵化的公司Skip联手始祖鸟推出了全球首条

量子位 2024-08-17 13:10:59
0 跟贴 0
巨额罚单远超全球GDP总和，俄罗斯政府对谷歌的罚款公布，约2（后面34个0）美元

渝派生活帮 2024-10-31 13:15:46
0 跟贴 0
8年前阿法狗的一个“错误”，竟成大模型研究新方向！大模型之争进入新阶段，从拼“模仿”转向拼“推理”

量子位 2024-10-19 12:06:26
159 跟贴 159
微软是如何重新崛起的？

钛媒体APP 2024-06-20 08:40:14
0 跟贴 0
华为机器人郭德纲：听说机器人都能说相声了？

卢菁老师 2024-10-31 07:52:35
16 跟贴 16
俄罗斯向谷歌开出35位数罚单，这串数字怎么读？

现代快报 2024-10-31 18:56:03
0 跟贴 0
莫斯科给谷歌开了一个“天大”的玩笑

王朝风云 2024-10-31 22:02:03
60 跟贴 60
传《炉石传说》新扩展包的英雄皮肤利用AI生成，暴雪正在调查

后竹游戏 2024-10-30 09:56:20
18 跟贴 18
李子柒归来？花容月貌已成过去式，近照堪比毁容，网友：像AI合成

花花lo先森 2024-10-29 10:21:13
27 跟贴 27

陈戌源被判无期！姚明肯定安全落地：身家30亿曾拒天价代言合同

陈戌源被判无期！姚明肯定安全落地：身家30亿曾拒天价代言合同

念洲

2024-10-31 19:33:40

直播被封，好多人都买了！央视曝光：全是假的，专坑“家人们”

直播被封，好多人都买了！央视曝光：全是假的，专坑“家人们”

附允历史观

2024-10-26 17:10:07

最新战报！林诗栋首局6-11，连丢4分，陈颢桦开门红，爆冷NO.2？

最新战报！林诗栋首局6-11，连丢4分，陈颢桦开门红，爆冷NO.2？

刘姚尧的文字城堡

2024-10-31 18:50:18

外媒：中国U15队爆冷击败巴黎圣日耳曼U15队3-0

外媒：中国U15队爆冷击败巴黎圣日耳曼U15队3-0

星耀国际足坛

2024-10-31 19:41:23

比俄罗斯还厉害，朝鲜刚刚发射的洲际导弹，射程近16000公里！

比俄罗斯还厉害，朝鲜刚刚发射的洲际导弹，射程近16000公里！

头条爆料007

2024-10-31 11:39:58

如果消费者愿意支付30美元微软将为其延长Windows 10的使用寿命

如果消费者愿意支付30美元微软将为其延长Windows 10的使用寿命

cnBeta.COM

2024-11-01 02:48:08

停牌前逼近涨停！A股并购又来了

停牌前逼近涨停！A股并购又来了

中国基金报

2024-11-01 00:08:49

狗血！婚前几天新郎约人开房，超美新娘愤而拒婚！毁三观现场曝光

狗血！婚前几天新郎约人开房，超美新娘愤而拒婚！毁三观现场曝光

新动察plus

2024-10-31 13:51:25

曝73岁刘晓庆出轨小20多岁男子，语音曝光尺度大，头像引网友热议

曝73岁刘晓庆出轨小20多岁男子，语音曝光尺度大，头像引网友热议

180°视角

2024-10-29 14:05:58

张雪峰多次推荐：江苏的一所大学，就业率超95%，分数也不高

张雪峰多次推荐：江苏的一所大学，就业率超95%，分数也不高

解说阿洎

2024-11-01 00:57:59

命运多舛的纳瓦罗：先败给郑钦文，后败给新规则，最后败给病毒

命运多舛的纳瓦罗：先败给郑钦文，后败给新规则，最后败给病毒

网球之家

2024-10-31 13:24:16

外交部：中国三座城市进入最新全球城市指数报告前十

外交部：中国三座城市进入最新全球城市指数报告前十

人民资讯

2024-10-31 17:09:46

上海交大解剖300名肺癌死者，研究发现：易患肺癌的人，有5大恶习

上海交大解剖300名肺癌死者，研究发现：易患肺癌的人，有5大恶习

今日养生之道

2024-11-01 01:00:30

37岁大龄剩女相亲，被问“还能生吗”破防：结婚就为生孩子吗？

37岁大龄剩女相亲，被问“还能生吗”破防：结婚就为生孩子吗？

子芫伴你成长

2024-09-05 21:15:43

五十岁左右到底算不算老人？心理学家：50岁其实就该安享晚年了

五十岁左右到底算不算老人？心理学家：50岁其实就该安享晚年了

芊芊之言

2024-10-30 16:48:24

中国博主在叙利亚遭囚禁5天，惨遭非人虐待，大小便全拉在裤子里

中国博主在叙利亚遭囚禁5天，惨遭非人虐待，大小便全拉在裤子里

阿凫爱吐槽

2024-10-31 11:23:35

第四轮救市启幕，信号竟然是.........

第四轮救市启幕，信号竟然是.........

混知房产

2024-10-31 07:32:48

尾盘！惊险20分钟！

中国基金报

2024-10-31 15:39:12

台风“康妮”来势汹汹！这些安全提示请收好丨天气早知道

台风“康妮”来势汹汹！这些安全提示请收好丨天气早知道

上观新闻

2024-10-31 08:54:13

解决不了生育率，就只能被解决

求实处

2024-10-30 23:59:17

做内容从业者关心的AI研究

125文章数 6关注度

往期回顾全部

科技要闻

华为前三季利润下滑任正非：我们还在挣扎

头条要闻

耿爽：美代表或又要就乌问题甩锅中国我索性主动出击

头条要闻

耿爽：美代表或又要就乌问题甩锅中国我索性主动出击

体育要闻

中国篮球，告别姚明时代

娱乐要闻

黄圣依再次选择不离引发炒作质疑

财经要闻

阿斯利康骗保案余波未止多位药企高管被查

汽车要闻

腾势Z9 内饰官图首发怀档设计/广州车展亮相

态度原创

房产

亲子

本地

时尚

公开课

房产要闻

最新！销售额破千亿，面积激增22万㎡！海南楼市还是猛！

亲子要闻

吃得多却不长身体，这种占肚子的食物少给孩子吃

本地新闻

云游中国｜我与这座城市合得来不怕肥

清库存|| 久违的出游，拍到手机内存告急

公开课

AI如何揭开大自然和宇宙的奥秘

© 1997-2024 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版