网易首页 > 网易号 > 正文 申请入驻

谷歌硬刚GPT-4o!60秒视频生成模型虽迟但到,上下文窗口达200万

0
分享至

西风 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

OpenAI出手再次惊艳世界,谷歌果然坐不住了。

GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google DeepMind首席执行官哈萨比斯亲自携谷歌版《Her》登场。

同样能会还有,不仅能几乎没有延迟地和人类流畅交流,通过摄像头,这个名为Project Astra的AI助手甚至能直接帮忙读代码。



谷歌还祭出了自己的硬件优势,带来一波AR和大模型的梦幻联动。

一边撸狗一边玩转大模型已经成为现实(手动狗头)。



这一波操作下来,战果如何尚未可知,网友们反正是兴奋了起来:



而正面硬刚GPT-4o,还只是谷歌铆足了劲,在I/O大会上释出的冰山一角。

两个小时的主题演讲里,AI被提及了121次,CEO劈柴哥还犹嫌不足。



于是,对标Sora能生成一分钟长视频的视频生成模型Veo来了。



Gemini 1.5 Pro不仅面向所有人开放,上下文窗口还从100万token直接一步迈向200万,一口气能读1500页PDF。

连Android,现在也紧紧跟谷歌大模型Gemini绑定,摇身一变成为以AI为内核的操作系统。



总之,信息量多到爆炸,相比之下,OpenAI不到半个小时的发布真的很随性了。



谷歌版《Her》登场

第一时间引发最多讨论的,当然是谷歌版《Her》——Project Astra

Project Astra基于Gemini系列模型打造,谷歌表示,研究人员们希望这样的智能助手,能真正在人们的日常生活中提供帮助。

有意思的是,OpenAI总裁哥Brockman昨天在场外补充了有关GPT-4o多模态能力的更详细视频,而谷歌这边,哈萨比斯也是第一时间在X上更新了与这样一个智能助手的互动。



看样子,Ta不仅能完成帮忙找眼镜这样的基础工作。



帮忙搞点文艺创作,解答一下专业书上看不懂的内容,也都是信手拈来。

还有Google DeepMind的工作人员干脆和Project Astra一起看起了I/O大会直播。



不少网友都认为,这是谷歌对OpenAI的GPT-4o的正面回应。



不过嘛,网友们也关注到了不少问题,比如,Project Astra的延迟似乎还是比GPT-4o长,谷歌的演示中也没有体现是否能打断智能助手说话。



值得关注的是,Project Astra背后,是Gemini系列模型的进一步升级迭代。

比如,Gemini 1.5 Pro的上下文窗口来到了惊人的200万token。



谷歌还最新推出了Gemini 1.5 Flash这一轻量级模型,并开源了27B的Gemma 2和视觉语言模型PailGemma。

60秒长视频生成

你可能已经默默在心里比较了一番Project Astra和GPT-4o的高下。

但桥豆麻袋,说起来,谷歌被OpenAI突然狙击,可不止这一回。

还记得在春节期间抢尽谷歌风头的Sora吗?

谷歌的回应,虽迟但到——

谷歌最强视频生成模型Veo来了。



Veo可以生成1080p的高质量视频,生成视频的长度也看齐Sora:最长超过1分钟

谷歌还强调,Veo生成的画面一致性出色,并且可以hold住各种风格。比如“延时拍摄”和“航拍”这种术语,直接写在提示词里,Veo都能get。

目前,谷歌已经和电影制作者展开了合作,在电影项目中探索Veo的应用。



与此同时,谷歌的图片生成模型Imagen也迎来更新,Imagen 3发布。

官方提到,与此前的模型相比,Imagen 3的视觉伪影更少,生成的图像细节拉满,并且在生成文字方面效果也很好。



△提示词:一张庄严的图书馆入口的照片,刻有“中央图书馆”字样

另外,谷歌此次还推出了音乐生成模型Lyria

Gemini进入全线产品

在这些跟OpenAI叫板的“肌肉”展示之外,谷歌对大模型应用的看重,也在此次I/O大会中尽显。

英伟达科学家Jim Fan就他的I/O观后感中表示:

谷歌做对的一件事是:他们终于开始努力把AI集成到搜索框中。



还不止是搜索,这一次,谷歌可以说是把Gemini塞进了全线产品中,包括谷歌搜索、Android,以及谷歌邮箱、谷歌Photos等。下面我们划划重点。

1、谷歌搜索

基于Gemini,谷歌搜索推出AI概述(AI Overview)新功能,彻底化身AI搜索。

用户在搜索框输入问题,马上就能得到一个AI总结的答案,包括相关链接。

而且是超长问题都能处理的那种,比如:

查找波士顿最好的瑜伽或普拉提工作室,并提供他们的入门优惠详情以及从灯塔山步行所需时间。

AI Overview秒秒钟就会列出五星好评且距离灯塔山近的店,并附带课程标价,连店在地图上的位置都标记了出来:



对于这种复杂问题的搜索,谷歌表示采用了多步推理技术,可以将复杂问题拆解成一个个小问题,然后自动对问题进行排序回答。



多步推理加持下,AI overview已经脱离了纯粹的搜索——把制定计划一并搬进了搜索引擎里。

比如直接让它为一个团体制定一个为期三天的易于执行的餐饮计划。

AI overview一键给出了方案,每个方案都可以点击修改,下方还可以一键将食材加入购物车:



还没完,当你没有想法、问的问题比较笼统时,谷歌搜索还会AI自动将搜索结果整理成一个个“群组”,为你提供建议。

比如问:在达拉斯找一个餐厅庆祝周年纪念日。

搜索出的结果会按照音乐餐厅、具有历史魅力的餐厅等一键分组。再往下翻,页面会从餐饮逐渐扩展到电影、酒店、购物等。



此外,谷歌搜索还支持视频搜索了。

演示中,唱片机出故障,只需一边录制视频一边说出疑问,谷歌AI Overview就会立刻分析故障原因,并给出处理建议。



谷歌搜索AI Overview功能将在本周开始在美国推出,后面将陆续推至其他国家。

2、Android 15

谷歌把Gemini也带到了安卓系统中。

凭借直接内置的Circle to Search功能,用户使用简单的手势“圈”一下手机上看到的任何内容,就能进行搜索。

比如圈出练习题,就能一键获取答案。



目前这一功能,已在Pixel和三星的部分设备上使用。

此外,还可以在一个应用之上随时调出Gemini助手层,随时使用。你还可以将Gemini生成的图片直接拖到Gmail等应用中,直接询问某个视频中的具体信息,不用滑动翻文档询问某个PDF中的信息……



甚至连电话反诈,都用上Gemini了:听到关键字“把钱转到安全账号”,马上就能给出警报。



总之,官方强调,现在,Gemini在手机上现在不止是一个App,更是安卓体验的基础。

3、谷歌Photos

谷歌Photos基于Gemini也推出了新功能——Ask Photos,可以一键从图库中帮你找到想要的照片和视频。



比如你想知道自己的baby是什么时候学会游泳的,Ask Photos会从你在谷歌Photos中存储的成百上千张照片中查找出含游泳、游泳证书等相关图片,最后总结给出回复:



Ask Photos这一功能将在今年夏天推出。

4、谷歌Workspace

Gemini也接入到了谷歌Workspace提供的一套生产力和协作工具中,包括谷歌邮箱、谷歌Docs、谷歌Calendar等。

这使得在这些工具间进行跨应用工作变得更加容易。

例如在谷歌邮箱中自动分析邮件以及附件,识别整理好收据,然后一键在Drive和Sheets中处理。



5、NotebookLM

谷歌AI笔记应用NotebookLM也大升级。

如下图所示,当你提出一个问题后,背后的Gemini模型就会结合NotebookLM中的笔记内容,进行多模态的语音对话式回答。



也就是说,所有笔记都可以变成交互式教材。

第六代TPU

最后,在硬件部分,谷歌也带来了新消息:

第六代TPU Trillium将在今年向云客户提供。

与TPU v5e,Trillium的峰值计算性能提高4.7倍,HBM和带宽增加了1倍,芯片间互联(ICI)带宽也增加了1倍。另外,Trillium的能效比TPU v5e高出了67%以上。



有关谷歌I/O的更多细节,可以戳:

https://blog.google/technology/developers/google-io-2024-collection/

那么今日份的发布会笔记,就先做到这里了。

你觉得谷歌这波表现如何?

从美股盘后的情况来看,似乎有点emmm……



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
疑似碧梨背刺霉霉?碧梨经纪人指控霉霉经常抢榜打压其他女歌手

疑似碧梨背刺霉霉?碧梨经纪人指控霉霉经常抢榜打压其他女歌手

文艺圈娱乐号
2024-05-28 11:35:38
福建舰一路北上,居然和辽宁舰跑在一起,会不会一起测试舰载机

福建舰一路北上,居然和辽宁舰跑在一起,会不会一起测试舰载机

三叔的装备空间
2024-05-29 09:02:43
一箱牛奶700元!伊利向卡车司机索赔惹众怒,伊利已关闭评论区!

一箱牛奶700元!伊利向卡车司机索赔惹众怒,伊利已关闭评论区!

毒舌说历史1
2024-05-29 08:16:43
“憋了3个多小时我肾快没了”,新疆旅游上厕所让人崩溃?当地迅速回应

“憋了3个多小时我肾快没了”,新疆旅游上厕所让人崩溃?当地迅速回应

都市快报橙柿互动
2024-05-28 08:26:24
5月29日赛程:美国女排迎挑战,中国女排求赢球,日本女排很不利

5月29日赛程:美国女排迎挑战,中国女排求赢球,日本女排很不利

体育插班生
2024-05-29 07:38:27
汪峰新女友人设塌房,两人被曝2年前相识,身高年龄身份涉嫌作假

汪峰新女友人设塌房,两人被曝2年前相识,身高年龄身份涉嫌作假

辣条小剧场
2024-05-28 01:32:41
犯了嘴瘾?60岁男医师吸吮后续:吊销执照、停发养老金、行政拘留

犯了嘴瘾?60岁男医师吸吮后续:吊销执照、停发养老金、行政拘留

历史有些冷
2024-05-28 09:55:02
埃托奥怼喀麦隆主帅:你当教练是因我任命你,你以为自己在哪

埃托奥怼喀麦隆主帅:你当教练是因我任命你,你以为自己在哪

懂球帝
2024-05-29 03:06:10
事态升级!男子一脚踢晕女子离去,目击者还原现场,恐面巨额赔偿

事态升级!男子一脚踢晕女子离去,目击者还原现场,恐面巨额赔偿

水泥土的搞笑
2024-05-28 20:12:51
22岁拿2亿顶薪!24岁被换遍联盟,人生的大起大落,就是这么刺激

22岁拿2亿顶薪!24岁被换遍联盟,人生的大起大落,就是这么刺激

球毛鬼胎
2024-05-28 13:59:02
女市委书记高速路上被警车别停,两名便衣下车对其进行搜身揩油

女市委书记高速路上被警车别停,两名便衣下车对其进行搜身揩油

神奇的锤子
2024-05-19 14:16:07
20年前袁茵离开侯耀文嫁给戴志诚,如今惊人真相曝光!

20年前袁茵离开侯耀文嫁给戴志诚,如今惊人真相曝光!

陈天宇
2024-04-30 10:49:47
要崩!拒绝3年1.2亿,无顶薪不签,球队面临解体,快船B计划来了

要崩!拒绝3年1.2亿,无顶薪不签,球队面临解体,快船B计划来了

球童无忌
2024-05-29 10:24:54
我军军演后,台媒发布民调,称6成台湾民众支持“两岸互不隶属”

我军军演后,台媒发布民调,称6成台湾民众支持“两岸互不隶属”

说天说地说实事
2024-05-28 08:59:52
5月28日俄乌最新:乌克兰无人机“造访”普京官邸

5月28日俄乌最新:乌克兰无人机“造访”普京官邸

西楼饮月
2024-05-28 15:00:03
解放军总医院转隶联勤保障部队,规模明显扩大,降格为副军级

解放军总医院转隶联勤保障部队,规模明显扩大,降格为副军级

袁老师说历史
2024-05-28 16:16:42
WNBA:李月汝2分6篮板1帽火花复仇 女库里状元30分创纪录

WNBA:李月汝2分6篮板1帽火花复仇 女库里状元30分创纪录

醉卧浮生
2024-05-29 09:16:56
努尔基奇晒巴尔干九人合影 这阵容能夺冠吗?

努尔基奇晒巴尔干九人合影 这阵容能夺冠吗?

开心体育站
2024-05-29 06:13:18
张兰下午直播时候和儿子汪小菲连线,张嘴就说:咱那美媳妇呢?

张兰下午直播时候和儿子汪小菲连线,张嘴就说:咱那美媳妇呢?

李保军财经
2024-05-29 10:08:29
前京东副总裁、渐冻人蔡磊被传“装病”,好友晒图辟谣

前京东副总裁、渐冻人蔡磊被传“装病”,好友晒图辟谣

都市快报橙柿互动
2024-05-28 16:51:04
2024-05-29 12:02:44
量子位
量子位
追踪人工智能动态
9452文章数 175295关注度
往期回顾 全部

科技要闻

比亚迪重磅发布:最高续航2500KM

头条要闻

官员"信口开河"拿茅台比方污水 简历从官网撤下

头条要闻

官员"信口开河"拿茅台比方污水 简历从官网撤下

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

教育
时尚
本地
旅游
军事航空

教育要闻

有点烧脑的竞赛题,勇敢试一试,解题非常容易!

50岁女人的搭配技巧解析,配饰精致大方,穿浅色更年轻有活力

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

旅游要闻

希尔顿一会员退房时被罚3000元,理由令人震惊

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版