网易首页 > 网易号 > 正文 申请入驻

谷歌I/O大会,眼花缭乱,但缺王炸

0
分享至



五月真热闹,OpenAI才开了春季发布会,谷歌I/O大会也如期召开了。

实话实说,观看主题演讲直播的过程中,脑海不禁会浮现曾被谷歌内部员工泄露的梗图——谷歌AI产品和项目一个又一个不同又相似的名字令人头大。



主题演讲的关键词仍旧是AI,谷歌还自己在现场给出了提到“AI”的次数,在120次以上。

在万众瞩目的AI领域,谷歌宣布了若干新消息。

AI大模型升级了两个,Gemini 1.5 Pro双下文窗口拓展到200万令牌、Gemini Nano增加多模态理解能力;新发布了三个,更轻更快的Gemini 1.5 Flash、新架下的Gemma 2.0,以及视觉语言模型PaliGemma。

另有文生图模型迭代至Imagen 3,还新发布了一个文生视频模型Veo。

AI的具体应用延展上,谷歌这次憋了不少招。

谷歌的核心产品搜索中,发布AI Overviews,加强版AI搜索摘要功能将率先上架美国。谷歌搜索中还将加入制定计划、视频搜索等多重AI驱动的功能。

此外,Gemini还被塞进谷歌照片以及即时通讯应用Google Messages等产品中。

让人联想到OpenAI才发布的GPT-4o的,是谷歌旨在打造未来通用AI助理的新项目Project Astra,以及Gemin的新功能Live。Gemini Live支持与AI语音聊天,年内预计加入相机功能,和AI实时“视频通话”。

有点尴尬的是,在第三方拉流的直播间里,观众直呼“无聊”,并对眼花缭乱的名字感到困惑。CNET的评论员指出,谷歌需要精进讲故事的能力,而不是一上来就将各个部分尽数展开。

A

OpenAI赶在谷歌I/O大会前一天开春季发布会,原本盛传的搜索产品没来,但“人类级别响应”的GPT-4o让人一窥新一代AI助理大战的轮廓。

难以想象要是没有OpenAI的狙击,谷歌会有多开朗。

本次谷歌I/O大会上,原本最具惊喜的也是AI助理方面的进展。

首先,谷歌公布了一个新项目,名为Project Astra。用谷歌Deepmind负责人哈萨比斯(Demis Hassabis)的话说,这是真正通向AGI的万能助手项目。

相比于谷歌上一代AI助手Google Assistant,Project Astra的AI助手模式多样,且能实时交互。没有烦人的唤醒词,也没有尴尬的延迟。看你所看,为你排忧解难。

演示视频中,用户打开手机摄像头,对准任意物品,AI可以准确说出物品的名称,如“这是一个音响”。用户可以实时视频的同时,在屏幕上涂画、进一步向AI提问,如画一个箭头指向音响的某个部分,询问是什么。当用户将镜头对准窗外时,AI则直接根据景色猜测出用户所在的地点。



在摄像头匆匆扫过场景的情况下,用户求助“眼镜放在哪儿”,助手准确识别并回答“你的眼镜在红苹果的旁边”。

去年12月,Gemini就曾发布通过视频和AI互动的视频,但事后承认视频经过剪辑,谷歌为此没少被戳脊梁骨。

有意思的是,这次在演示视频的一开头,谷歌就郑重承诺,视频是实时、一次性拍摄的。



不过,谷歌尚未针对Project Astra给出明确的时间线,只是含糊地表示今年晚些时候其中的一些功能将更新到Gemini及其他应用中。

谷歌在AI助手方面还有更看得见、摸得着的进展——Gemini Live,也就是对Gemini产品进行多模态功能拓展。Gemini Advanced用户将可以用语音和Gemini进行对话,对话更流畅自然,延迟更低,可以随时打断,预计夏天上线。谷歌还表示,今年年内将加入相机功能,实现实时视频。

可以说这一次,谷歌被OpenAI精准狙击——GPT-4o不仅早一天发布,而且现场演示,未来几周就会开放给全部用户。

B

近日外界都在盛传OpenAI将推出搜索类产品,与谷歌一战,但这样的情况并没有发生,而谷歌自己也已经马不停蹄地升级了谷歌搜索。

搜索作为谷歌的核心产品,即将迎来一次大升级——搜索摘要功能AI Overview,同时包含多步推理功能Multi-Step Reasoning、在搜索中做计划Planning in Search,以及用视频提问Ask With Video。



AI Overview,顾名思义,是指用户键入文本、点击搜索之后,出现在最上方的将是AI帮忙整理的信息摘要。其中包含用自然语言对搜索结果的总结和概括,以及推荐的链接。从前这被谷歌称为“搜索生成式体验(SGE)”。

多步推理Multi-step reasoning则可以用来做计划。当用户在搜索框键入“附近最好的瑜伽馆”时,AI摘要会将附近瑜伽馆依照评分、课程、距离等信息分类成块,更清晰地展示给用户。Planning in Search则允许用户直接用谷歌搜索做计划,如在搜索框中键入饮食计划的需求,搜索引擎会给你自动生成一份。





想要搜索商品的时候,AI同样会发挥作用,在搜索框键入“有上下坡的五英里通勤自行车”,搜索引擎会在上方给出选购自行车的思路建议,并给出若干商品推荐。



从一个又一个详尽的演示不难看出,谷歌已经下定决心重塑搜索体验。

不过,AI搜索在很多竞品中都已经被应用,更有专做AI搜索的Perplexity.AI。谷歌对搜索体验作出的重大升级,放在2024年的5月已经不大能带来新鲜感。

应用生态的其他新动作更像是补齐,如Gmail邮箱、Google Messages通讯、谷歌照片等,Gemini逐渐拓展到越来越多的谷歌应用中,大有“Gemini无处不在”的态势。

C

AI背后的模型,谷歌这次也是大手一挥,升级的升级,新发布的新发布,Gemini家族不断壮大。

三个月前发布的Gemini 1.5 Pro终于“发货”了,即日起正式开放给订阅了Gemini Advanced(类似ChatGPT Plus)的用户。

Gemini 1.5 Pro支持100万token的上下文窗口,今年晚些时候将会增加到200万token。更形象地说,升级后的Gemini 1.5 Pro能同时处理22小时音频、2小时视频、超过60000行代码或140万个单词。

新发布的模型中,Gemini 1.5 Flash原本有明星潜质,但被OpenAI狙击。GPT-4o驱动的ChatGPT狙击Project Astra和Gemini Live,GPT-4o狙击Gemini Flash。

Gemini 1.5 Flash主打更轻更快,反应速度和效率是其主打特色,拥有多模态推理能力,擅长总结、聊天、图像、文档数据提取、视频字幕等。但这些特点,显然和GPT-4o撞车了。

除此之外,谷歌的开源模型Gemma也发布了新版本,Gemma 2.0有270亿参数,并拓展出多模态版本PaliGemma。

多模态生成式模型,谷歌在I/O大会上公布了三个,涵盖图像、音乐和视频。

文生图模型谷歌此前就有,此次做了迭代,发布Imagen 3。Imagen 3对提示词的理解更加准确细致,可以生成更逼真的图像。在演示中,Imagen3从一长段提示词中提取了8个细节信息,并在生成的图像中一一体现。



音乐生成模型Music AI Sandbox是全新的,用户可以用小段Demo拓展延长,也可以按照文本提示对音乐进行再创作,改变和调整音乐风格等。鉴于谷歌旗下还有YouTube等UGC平台,此类模型将很好地服务于创作者。

更惹眼的其实是谷歌此次新发布的文生视频模型Veo。



谷歌Veo可接收文本、图像和视频提示,生成1080p规格、60s的高质量长视频。

年初OpenAI曾发布Sora,虽未正式对公众开放使用,但演示视频和小范围的测试已经让Sora获得了不小的追捧。从演示的效果来看,Veo可与Sora一战。

这届I/O大会,谷歌交出了诚意满满的“成就清单”,大模型仍在进步和创新中,AI应用生态也不断发展。

但新名词轰炸之后,能留给人深刻印象的东西并不多。比起前一天发布GPT-4o让外界感叹科幻电影照进现实的OpenAI,谷歌到底还是缺一个王炸。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
坎耶29岁娇妻现身日本东京,连体衣内搭空气,让店员看得目瞪口呆

坎耶29岁娇妻现身日本东京,连体衣内搭空气,让店员看得目瞪口呆

译言
2024-06-13 22:01:18
2011年妻子和情夫通奸时,丈夫也要来,妻子说住不下了被丈夫杀死

2011年妻子和情夫通奸时,丈夫也要来,妻子说住不下了被丈夫杀死

汉史趣闻
2024-06-12 07:29:30
王思聪黄一鸣牵手照曝光,黄一鸣挺着大孕肚,挑选母婴用品!

王思聪黄一鸣牵手照曝光,黄一鸣挺着大孕肚,挑选母婴用品!

柠檬有娱乐
2024-06-13 11:20:07
骆家辉:中国最好不要自主生产顶尖芯片,因为美国会看不到希望!

骆家辉:中国最好不要自主生产顶尖芯片,因为美国会看不到希望!

嘿哥哥科技
2024-06-13 21:05:47
很不幸,这次又谈崩了

很不幸,这次又谈崩了

西楼饮月
2024-06-13 22:05:35
“中国人在将屋顶涂成蓝色,以此屏蔽美军激光武器威力”?许多美国网民吓坏了!

“中国人在将屋顶涂成蓝色,以此屏蔽美军激光武器威力”?许多美国网民吓坏了!

环球网资讯
2024-06-13 22:25:42
27岁女子在家被捅死,保安被指“不作为”,众大V:保安没有执法权

27岁女子在家被捅死,保安被指“不作为”,众大V:保安没有执法权

可达鸭面面观
2024-06-13 09:18:50
问界M9翻滚下山崖全景图曝光之后,网友们对山崖又有了新的认识

问界M9翻滚下山崖全景图曝光之后,网友们对山崖又有了新的认识

映射生活的身影
2024-06-13 18:26:51
瓦屋山游客身亡后续:知情人曝猛料,女子身份复杂,景区恐摊大事

瓦屋山游客身亡后续:知情人曝猛料,女子身份复杂,景区恐摊大事

王小花谈历史
2024-06-13 18:30:38
王室公开重量级照片:威廉带着三个孩子正式出镜

王室公开重量级照片:威廉带着三个孩子正式出镜

金牌娱乐
2024-06-13 12:23:05
日本官方最新数据:人均海鲜年消费量暴跌50%!只因核污水排海?

日本官方最新数据:人均海鲜年消费量暴跌50%!只因核污水排海?

不掉线电波
2024-06-13 23:16:14
游客瓦屋山被砸身亡后续:女孩身份曝光,父母已知情,崩溃难接受

游客瓦屋山被砸身亡后续:女孩身份曝光,父母已知情,崩溃难接受

180°视角
2024-06-13 20:43:07
哪些国家参加瑞士和平峰会?巴西去了可以理解,连阿富汗都参加?

哪些国家参加瑞士和平峰会?巴西去了可以理解,连阿富汗都参加?

翻开历史和现实
2024-06-13 12:42:21
被倒查30年!知名上市公司:原子公司被追溯补税超8500万元!还不包括滞纳金

被倒查30年!知名上市公司:原子公司被追溯补税超8500万元!还不包括滞纳金

每日经济新闻
2024-06-13 21:13:51
张维为被殴打?是夜郎自大还是不懂“国情”?

张维为被殴打?是夜郎自大还是不懂“国情”?

兵叔评说
2024-06-13 13:02:56
中国足协发声:五年冷藏王大雷,失败才火线出战,疑云重重?

中国足协发声:五年冷藏王大雷,失败才火线出战,疑云重重?

人生趣事悟语
2024-06-14 01:19:36
怪不得哈尔科夫俄军偃旗息鼓了,原来乌军采取了这么一个动作

怪不得哈尔科夫俄军偃旗息鼓了,原来乌军采取了这么一个动作

听风听你
2024-06-13 11:16:52
区纪委原书记写60余封举报信诬告陷害多名干部!自己被查出搞钱色交易,官方披露详情

区纪委原书记写60余封举报信诬告陷害多名干部!自己被查出搞钱色交易,官方披露详情

鲁中晨报
2024-06-13 20:27:03
高考作文压根没出现ai,写成“爱”的山区孩子,该怪出题人吗

高考作文压根没出现ai,写成“爱”的山区孩子,该怪出题人吗

熙熙说教
2024-06-13 13:57:27
当叶童同框赵雅芝,终于见识了自然老与“医美老”的差距有多大了

当叶童同框赵雅芝,终于见识了自然老与“医美老”的差距有多大了

时髦范
2024-06-13 09:08:52
2024-06-14 09:04:50
字母榜
字母榜
让未来不止于大。
1496文章数 7892关注度
往期回顾 全部

科技要闻

马斯克:明年千台人形机器人在特斯拉上班

头条要闻

亲绿网红在大陆旅游称"真的很喜欢这里" 气得绿营跳脚

头条要闻

亲绿网红在大陆旅游称"真的很喜欢这里" 气得绿营跳脚

体育要闻

乔丹最想单挑的男人走了

娱乐要闻

森林北报案,称和汪峰的感情遭受压力

财经要闻

私募大佬孙强:中国为什么缺少耐心资本

汽车要闻

升级8155芯片 新款卡罗拉锐放售12.98-18.48万

态度原创

游戏
时尚
教育
家居
公开课

PSN曝光《超越善恶》20周年纪念版即将发布

夏季显瘦穿搭秘籍,让你轻松打造时髦好身材

教育要闻

中专女生爆冷拿下数学竞赛全球12名:数学就像我的朋友,对服装设计也很感兴趣

家居要闻

大城小室 质朴自然的心灵居所

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版