网易首页 > 网易号 > 正文 申请入驻

提及 121 次 AI 的谷歌 I/O,发布了哪些产品来应对 OpenAI?

0
分享至

北京时间 5 月 15 日凌晨,在 的第二天,2024 年谷歌 I/O 召开,这是一场充满了 AI 的发布会,谷歌对其旗下的多款 AI 产品发布了大更新,从基座模型 Gemini 到新的 AI 助手 Astra、新的文生视频模型 Veo,以及更强大的文生图模型 Imagen 3。

还有就是,谷歌终于决定对搜索进行 AI 改造了!重新设计了搜索的展示形态,并且很快将对美国用户推出 AI Overviews(AI 概览)功能。


在发布会结尾的总结演讲中,谷歌 CEO 皮查伊特别提到,今天谷歌提到了 121 次 AI。

内容编译自 The Verge、Wired、engadget 等媒体报道。

01

Gemini 更新:更长上下文、

轻量版本、个性化机器人

首先是 Gemini 1.5 Pro,100 万 tokens 的长文本能力,目前已登陆 AI Studio,向所有开发者开放使用。

Google Workspace 中也将可以使用 Gemini 1.5 Pro,用户可以使用 AI 进行邮件总结或者 PDF 文本分析,比如搜索用户的所有邮件并且显示摘要,加快用户的邮件处理速度。


最大的更新尚未到来——谷歌宣布今年晚些时候将模型的现有上下文窗口增加一倍,达到 200 万 tokens。这将使其能够处理 2 小时的视频、22 小时的音频、超过 60,000 行代码或超过 140 万个单词,是目前 Claude 3 上下文长度的两倍。

除了更长的上下文窗口,Google 表示,在过去的几个月里,通过算法改进,Gemini 1.5 Pro 已经得到了「增强」。在代码生成、逻辑推理和规划、多轮对话以及音频和图像理解方面更加出色。在 Gemini API 和 AI Studio 中,1.5 Pro 现在可以跨音频进行推理,除了图像和视频之外,还可以通过称为系统指令的功能进行「引导」。

对于 Gemini 的订阅用户,可以使用谷歌新推出的「Gems」功能,创建不同种类的 Chatbot,类似于在 Character.AI 中制作机器人,该服务允许用户与流行角色和名人的 AI 版本或甚至 AI 医生交谈。谷歌表示,用户可以将 Gemini 变成健身伙伴、厨师、编程伙伴、创意写作指南或能想到的任何东西。

Gems 有些类似于 OpenAI 的 GPT 商店。

轻量级的 Gemini:Gemini 1.5 Flash

可能是出于成本的考虑,在已有的 Nano、Pro 和 Ultra 之外,谷歌发布了新的轻量级模型:Gemini 1.5 Flash,为开发人员提供更多选择。


这是 Pro 版本的精简版,更便宜更轻量级,但功能同样强大,谷歌表示这是通过「蒸馏」的方式来实现的,将 Gemini 1.5 Pro 中最重要的知识和技能转移到较小的模型上。这意味着 Gemini 1.5 Flash 将获得与 Pro 相同的多模态功能(分析音频、视频和图像等),以及同样长度的上下文窗口。

官方声称,Flash 版本适合处理摘要、聊天、图片分析和视频字幕、以及从长文本和表格中提取数据等。目前开发者可以通过 API 的方式使用,Flash 模型并未向普通消费者提供。

工作人员详细介绍了 Gemini 1.5 Pro 和 Flash 的定价。Gemini 1.5 Flash 的价格定为每 100 万 tokens 35 美分,这比 GPT-4o 的每 100 万 tokens 5 美元的价格要便宜得多。


此外还有一些其他应用中加上了 AI 的能力:

  • Ask Photos with Gemini:谷歌 Photo 中,用户可以直接使用对话功能搜索图片,比如「我访问的每个国家公园的最佳图片」,目前优先向 One 订阅用户开放。

  • 桌面版 Chrome 中内置 Gemini Nano:从 Chrome 126 版本开始,Gemini Nano 将直接集成于 Chrome 的桌面版本中,后续会启用一系列的 API,提供诸如翻译、字幕和文本转录的功能。

  • 基于 Gemini 1.5 Pro 的 Gemini Advanced:升级后的 Gemini Advanced 可以处理「多个大型文档,总计最多 1,500 页,或汇总 100 封电子邮件」。支持 35 多种语言和 150 多个国家 / 地区。而其「即将」推出的功能是能够「处理一个小时的视频内容或超过 30,000 行的代码库」。

开源模型 Gamma 2 6 月推出

Gemma 是谷歌的开放模型系列,采用与 Gemini 模型相同的技术构建。此次谷歌在原来模型基础上宣布推出 Gemma 2,Gemma 2 采用全新架构,旨在实现突破性的性能和效率,并将提供 27B 大小的尺寸。


目前可用的是 PaliGemma,号称 Gemma 家族的第一个视觉 LLM,据悉,PaliGemma 是谷歌受 PaLI-3 启发,将用户图像字幕、图像标注和物体识别等。

02

终于对搜索下手了:AI Overviews

谷歌将在搜索中加入 AI 结果的呈现:AI Overviews(AI 概览),在用户进行提问时在页面顶部提供 AI 生成的答案。


官方人员表示,AI 概览不会出现在每个搜索结果中,目前主要针对于更复杂的问题。每次用户进行搜索时,谷歌会在后台进行算法价值判断,以决定是否提供由 AI 生成的答案还是直接提供传统的网页链接。

本周谷歌将向美国用户提供 AI 概览功能,该功能将在年底推广到更多国家。该功能面向全平台推出,从 Web 网页、App 到 Android 设备。

此外,即将发布的功能还有行程规划功能,你可以要求谷歌为你制定膳食计划,或者找到一个附近提供折扣的普拉提健身房。在谷歌的规划中,AI Agent 可以汇总附近的工作室和用户评论,并规划出步行时间,依赖于谷歌拥有的大量数据,这是其他 AI 搜索暂时无法做到的。

谷歌 Lens 也发布了新的更新:可以直接拍摄视频进行搜索,以前 Lens 只能捕捉图片,现在则可以使用视频和语音进行提问。


03

Astra:与 ChatGPT 殊途同归

谷歌的最新 AI 语音助手——Astra,能够通过摄像头识别物体、代码和各种东西。这个概念其实是 DeepMind 负责人 Dmis 在去年 12 月首次推出 Gemini 模型所承诺的功能。

Astra 能够通过设备的摄像头识别物体和场景,并用自然语言进行交互。官方介绍,Astra 使用了 Gemini Ultra 的高级版本。

在演示中,用户可以佩戴谷歌的智能眼镜可以与 Astra 进行交互,这也被视为一个重启谷歌智能眼镜的机会。

Demis 在此前的采访中表示,文本聊天只是通过更复杂的 AI 助手的过渡阶段,语音和视觉可能才是未来,这也是为什么 Gemini 是原生多模态的大模型。

04

挑战 Sora:Veo 视频生成模型

谷歌希望用 Veo 来挑战 OpenAI 的 Sora,Veo 能够根据提示词生成 60 秒时长的 1080P 的视频片段,可以捕捉不同的视觉和电影风格,包括风景镜头、延时摄影灯。

Veo 接受了大量的镜头训练。这也是当下大模型的训练方式:提供一个又一个的数据示例,模型就会在数据中找到模式,使它们能够生成新数据——对 Veo 来说数据就是视频。官方人员承认有些数据来自 YouTube。

像 Sora 一样,Veo 对物理有一定的理解——比如流体动力学和重力等,这些有助于它生成更具真实感的视频。

Veo 还支持对视频的特定区域进行遮罩编辑,并可以从静态图像生成视频,类似于 Stability AI 的 Stable Video 等生成模型。最引人注目的是,给定一系列共同讲述一个故事的提示,Veo 可以生成更长的视频——超过一分钟长度的视频。

Imagen 3 文生图模型

DeepMind 负责人 Demis 声称,与 Imagen 2 相比,Imagen 3 能够更准确理解图像的文本提示词,并且生成的图片更具创造性和细节。


「这是我们文本渲染的最好模型,这对于图像生成来说一直是个挑战。」Demis 补充道。

此外,谷歌宣称,Imagen 3 将使用由 DeepMind 开发的 SynthID 水印方法,对生成的图片应用不可见的、加密的水印。SynthID 将全面应用于 AI 生成的图片、视频和音乐作品中。

05

Android 15 深度集成 AI

在 I/O 大会上,谷歌提到了即将推出的安卓新版本,即以 AI 为核心的 Android,今年将实现三项突破:在 Android 上提供更好的搜索、Gemini 正在成为 AI 助手,以及设备上的 AI 将解锁新的体验。


与底层操作系统的集成后,就能实现一些更酷的功能。Android 上的 Gemini 具有更强的上下文感知能力,可以覆盖在正在使用的任何 app 之上,因此你无需来回切换。还有一个巧妙的功能,用户能够使用 Gemini 生成图像,并将它们拖放到像 Gmail 或 Google 消息这样的应用程序中。

谷歌将在手机上尝试搜索的新方式:Circle to Search,就像 Now on Tap 一样,这种方式更有互动性,非常直观。

谷歌还展示了直接通过 Pixel 8a 上的 Google Messages 应用程序使用 Gemini 的不同方式。它包括能够分析 PDF 或视频并向 Gemini 提出问题,获得清晰(并引用)的答复。这些功能将在「未来几个月」出现在更多设备上。

如果用户将 Gemini 设置 Android 手机的默认助手,它可以对网页或屏幕截图进行总结或回答问题。不久,它还将能够检测到屏幕上是否有视频,并可以跟用户进行互动。

可能,集成了 Gemini 的手机助手,才是多年前发布的 Google Now 的完全版。

如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
诺查丹玛斯2024预言:英王换人,日本大地震,一条龙带血飞到天际

诺查丹玛斯2024预言:英王换人,日本大地震,一条龙带血飞到天际

飞云如水
2024-06-11 18:45:26
媒体人谈杨泽翔:93一批有很多好球员,金元时代把他们很多人毁了

媒体人谈杨泽翔:93一批有很多好球员,金元时代把他们很多人毁了

直播吧
2024-06-12 19:45:12
“急救神药”突然大幅涨价,香港1粒3克卖到1189元!关键原料涨得更猛,1公斤165万元贵过黄金,公司最新回应→

“急救神药”突然大幅涨价,香港1粒3克卖到1189元!关键原料涨得更猛,1公斤165万元贵过黄金,公司最新回应→

每日经济新闻
2024-06-12 13:04:10
头顶上直接飞越,中方与荷兰爆发短兵相接,飞豹超低空掠飞护卫舰

头顶上直接飞越,中方与荷兰爆发短兵相接,飞豹超低空掠飞护卫舰

文雅笔墨
2024-06-12 12:29:56
硬!郑智更衣室捶桌:不管对手是谁,脑里有个概念,拿着分回去

硬!郑智更衣室捶桌:不管对手是谁,脑里有个概念,拿着分回去

直播吧
2024-06-12 09:48:30
足协已多次沟通奥斯卡归化问题:18强赛他将是防反头号杀器!

足协已多次沟通奥斯卡归化问题:18强赛他将是防反头号杀器!

中超球评
2024-06-12 12:49:39
上海高中生写下断绝父子关系的长信!“他们离婚约定房子给我,爸爸却反悔了...”

上海高中生写下断绝父子关系的长信!“他们离婚约定房子给我,爸爸却反悔了...”

上观新闻
2024-06-10 11:20:59
网传两大券商军工首席被带走,光大证券、长江证券双双否认:“人在岗”

网传两大券商军工首席被带走,光大证券、长江证券双双否认:“人在岗”

澎湃新闻
2024-06-12 19:00:26
马卡:哈维离队后遭到拉波尔塔、科曼、球员及经纪人的质疑和指责

马卡:哈维离队后遭到拉波尔塔、科曼、球员及经纪人的质疑和指责

直播吧
2024-06-12 11:45:07
男演员长相有多重要?《庆余年》五竹戴眼罩和不戴眼罩,差距明显

男演员长相有多重要?《庆余年》五竹戴眼罩和不戴眼罩,差距明显

综艺拼盘汇
2024-06-12 16:13:26
告别美加墨世界杯?巴西队创造尴尬纪录,网友:传奇时代结束了

告别美加墨世界杯?巴西队创造尴尬纪录,网友:传奇时代结束了

小鬼头体育
2024-06-13 01:00:10
实锤!美军方确认俄罗斯预警机被“爱国者”击落!

实锤!美军方确认俄罗斯预警机被“爱国者”击落!

凡事一定有办法13119
2024-06-11 08:45:42
美国顶级预言家再出手!直言2024美日中命运!这个岛最先出事!

美国顶级预言家再出手!直言2024美日中命运!这个岛最先出事!

飞云如水
2024-06-09 21:53:34
郭某某(女,34岁),被拘!

郭某某(女,34岁),被拘!

FM93浙江交通之声
2024-06-11 19:12:14
正式官宣!波神引爆联盟,凯尔特人恐变阵,独行侠喘息的机会到了

正式官宣!波神引爆联盟,凯尔特人恐变阵,独行侠喘息的机会到了

体育晓二
2024-06-12 14:09:04
果然来了?美联储掀桌子,美联储降息是一个大阴谋

果然来了?美联储掀桌子,美联储降息是一个大阴谋

老卢说科普
2024-06-12 17:57:40
离谱!撕裂+肌腱脱臼,刚复出就趴窝,6000万先生真是脆到家了

离谱!撕裂+肌腱脱臼,刚复出就趴窝,6000万先生真是脆到家了

球童无忌
2024-06-12 11:27:18
朱春保主动投案、刘俊福主动向组织交代问题,两种“主动”有何区别?

朱春保主动投案、刘俊福主动向组织交代问题,两种“主动”有何区别?

极目新闻
2024-06-12 13:33:17
国家大基金三期将要投向这些方向,未来也会是机构争抢方向

国家大基金三期将要投向这些方向,未来也会是机构争抢方向

股海风云大作手
2024-06-12 18:21:12
黄一鸣称怀孕生子全过程王思聪都知道,只想给孩子父爱不要抚养费

黄一鸣称怀孕生子全过程王思聪都知道,只想给孩子父爱不要抚养费

娱记掌门
2024-06-12 21:32:29
2024-06-13 06:26:44
FounderPark
FounderPark
关注AI创业,专注和创业者聊真问题
174文章数 10关注度
往期回顾 全部

科技要闻

谁是苹果AI的“中国合伙人”?

头条要闻

顶头上司落马3周后退休副省长被查 任内曾被环保问责

头条要闻

顶头上司落马3周后退休副省长被查 任内曾被环保问责

体育要闻

国足,别辜负这场奇迹!

娱乐要闻

黄一鸣再次录视频表态孩子是王思聪的

财经要闻

徽商银行的影子 借基金向地方城投放贷?

汽车要闻

理想汽车周销量突破1万辆 单周销量首超宝马奥迪

态度原创

健康
亲子
旅游
教育
游戏

晚餐不吃or吃七分饱,哪种更减肥?

亲子要闻

每个班都有一两个孩子患这种病,医生缺口却很大

旅游要闻

日本“黑道大哥”现街道 警察保持随时监控

教育要闻

求最小值经典题目,分子变一变,均值不等式轻松求解

钢岚:实测分析本月三大专武应该优先做?居然增伤最高的是它?

无障碍浏览 进入关怀版