网易首页 > 网易号 > 正文 申请入驻

OpenAI全面更新大模型,科技巨头的生成式AI之战升级至第二轮

0
分享至


GPT-4o的发布掀起风暴。它在发布会上的流利表达和令人惊叹的交互性震撼到了每一个听众。人们惊奇地发现,不知不觉间,它已经偷偷绕过了图灵测试的厚重幕帘,将带领我们走向一个人人都有AI相伴的时代。


GPT-4o,未来人机交互新范式

OpenAI在春季新品发布会上再次引燃了人们对人工智能的期待。北京时间5月14日,OpenAI 首席技术官 Mira Murati作为主持人,重磅介绍了此次春季发布会推出的新一代旗舰生成模型GPT-4o,其中,“o”代表的是拉丁词根“Omni”,具有“所有的”、“全部的”或“全能”的含义。

在发布会中,GPT-4o展示了其强大的实时多模态交互性能:它可以接收文本、音频和图像的任意组合作为输入,并实时生成文本、音频和图像的任意组合输出。这意味着,GPT-4o可以直接理解、直接生成音频或者视频一切内容,而无需通过文字的转译。这一重大的模型更新,使得GPT-4o具有了令人惊叹的可交互性。


OpenAI 首席技术官 Mira Murati

图片来源:网易科技

在响应速度方面,GPT-4o的交互性相较前代模型也具有颠覆性改变,变得更为自然,更像是在和一个“真人”进行对话,而不是和一个AI进行模块式问答。发布会数据显示,GPT-4o语音能在232毫秒内回应音频输入,平均为320毫秒,大幅降低了延迟,使其与现实对话中人类的响应时间相似,因此,用户在跟GPT-4o进行语音交谈时,几乎不会感受到任何停顿。并且,GPT-4o的说话可以被随时打断,而不影响它对整段对话的理解。

在进行视频通话时,GPT-4o还可以捕捉理解用户的表情、神态,并判断用户的当下状态。它甚至可以根据用户的语气、语速作出相应反应。在发布会的现场演示中,工程师刻意表现得呼吸急促,GPT-4o敏锐地捕捉到了这一状态,并建议工程师不要紧张,最好能够深呼吸平复情绪。


图片来源:华尔街见闻

此外,GPT-4o还完成了切换语言实时翻译、引导人们解题等现场演示,同时,OpenAI还在官网上放出了更多更复杂场景的交互,展现出AI多模态模型的更多潜力,包括照片转漫画、3D物体合成、海报创作、角色设计等。

“这是我们第一次在易用性方面真正迈出一大步,”Mira Murati在发布会中说道,“这种互动变得更加自然,也更加容易。”值得注意的是,此次GPT-4o将免费提供给所有用户,Murati表示,该模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中GPT-4o将免费提供。

科幻电影《Her》走进现实

GPT-4o 的发布,让很多人联想到科幻爱情电影《Her》中的类似情景,影片讲述了主人公西奥多——一位信件撰写人与人工智能系统 OS1 萨曼莎的爱情故事。剧中给萨曼莎配音的著名影星斯嘉丽・约翰逊拥有迷人的声线,更是给萨曼莎增加了人类情感。此前,在春季发布会后,OpenAI首席执行官山姆·奥特曼(Sam Altman)在社交媒体上的评论只有一个词:Her,似乎也在暗示 ChatGPT 将科幻电影中的场景带进现实。

在GPT-4o发布之后,奥特曼还接受了硅谷著名风险投资公司Redpoint董事兼总经理Logan Bartlett的采访,在45分钟的对话中,他谈了谈对GPT-4o、GPT5、以及未来人工智能世界的看法。

“GPT-4o并不是突然解锁的一项疯狂的新技术,而是功能累积和整合的结果。”奥特曼表示,“在过去几年,OpenAI团队一直在研究音频模型、视觉模型,以及如何将它们结合起来,同时也在努力提高模型的训练效率。我们这次并不是突然解锁了一项从来没有的技术,而是将很多功能部分整合在了一起。”


OpenAI首席执行官山姆·奥特曼(Sam Altman)

图片来源:搜狐科技

很多人将GPT-4o看作是GPT-5重磅发布的预告,并一直对GPT-5的发布时间及功能升级保持高度期待。奥特曼坦言,人工智能和惊喜并不总是搭配着来的,未来可能不会有大规模的发布。也许我们仍然可以把它命名为GPT-5,但以不同的方式发布,或者换个名字。就目前来说,GPT-4还在不断改进中。谈及AI给世界带来的变革影响,奥特曼认为,目前为止,ChatGPT本身还没有改变世界,而是改变了人们对世界的期望。

“从现在的GDP等经济数据中还找不到GPT真正影响生产力的证据,但我认为,如果几十年后再去分析相应的经济图标走势,肯定能察觉到背后的变革。”奥特曼预测,在未来12个月内,编程会是受其影响的一个重要领域。

谷歌与微软的战书

就在OpenAI发布会的一天之后,谷歌发布一系列多模态更新,进一步说明了AI多模态能带来的颠覆性潜力。与OpenAI的发布会相比,谷歌的发布会时长更长,约有两小时,在各个生态方向用AI发力。CEO Sundar Picha在整场的演讲稿中总共提了120次“AI”,表明谷歌目前所有的工作都围绕多模态AI模型Gemini来展开

谷歌DeepMind负责人Demis Hassabis在发布会上介绍了Project Astra,与OpenAI的GPT4o“宣战”。Project Astra基于Gemini多模态大模型,是一个实时、多模态的人工智能助手,可以通过硬件设备“看到”世界,知道东西是什么以及你把它们放在哪里,并且可以回答问题或帮助你做几乎任何事情。

在谷歌的demo视频中,谷歌伦敦办事处的一名工作人员用Astra识别自己的地理位置,找到丢失的眼镜,检查代码等。Hassabis表示,“展望未来,人工智能的故事将不再是关于模型本身,而是关于它们能为你做什么”。


图片来源:Google

接棒OpenAI 和谷歌掀起的 AI 科技月,5月22日,微软在新品发布会上也带来了一系列重磅产品,发布了 50 多项更新,其中,Copilot也迎来了全新升级,微软CEO Satya Nadella在发布会上介绍了“Copilot+PCs”的概念,它是指 Windows 笔记本电脑配置内置 AI 硬件并支持整个操作系统的 AI 功能,被描述为“新一类 Windows PC”。

Copilot开始具备“透视”屏幕能力,能真正理解屏幕上显示的内容,甚至给出相对应的建议。比如,在用户玩《我的世界》游戏时,它能化身游戏大师,不仅能用纯自然语言教你怎么打造一把剑,还可以通过“看到”玩家库存里的具体物资,给出精准的制作建议。

此外,新增的Recall功能使电脑拥有了过目不忘的记忆,这无异于一场效率革命。它能够帮助用户记忆海量的文件和网页,如果用户在浏览过程中点击的文件忘记存储在哪了,只需向其描述合适的词汇,就能第一时间找到文件。值得一提的是,这一切智能操作均在本地端侧完成,无需云端介入,对于隐私安全有着极大的保障。


Copilot 新增Recall 功能

从 2023 年到 2024 年,无论是否身处科技行业,或许都会感受到这一趋势:人工智能正在重塑我们的生活。而每一次技术的突破,总是会带来生产力变革。AI多模态之战打响之后,随着越来越多的科技巨头入局,在更多更广的应用上,我们看到了更落地更切实的可用性,这将重塑人类和AI以及电子设备的交互方式。

资料来源:搜狐科技、机器之心、硅谷101、知社学术圈等

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
小里弗斯:格威不应该去更衣室和凯尔特人庆祝

小里弗斯:格威不应该去更衣室和凯尔特人庆祝

北青网-北京青年报
2024-06-20 07:25:06
正式离队,国足离队3人曝光,两人摊牌发声,郑智看懂了

正式离队,国足离队3人曝光,两人摊牌发声,郑智看懂了

东球弟
2024-06-19 15:14:56
河南一女子在墓地被男子强奸,哀求:你们人太多了能不能放过我

河南一女子在墓地被男子强奸,哀求:你们人太多了能不能放过我

娱乐圈的笔娱君
2024-06-20 07:35:18
黄圣依回娘家探望父亲!父女同框长相相似,家住徐家汇顶楼风景好

黄圣依回娘家探望父亲!父女同框长相相似,家住徐家汇顶楼风景好

快乐娱文
2024-06-19 09:53:28
宋祖儿,被彻底封杀!

宋祖儿,被彻底封杀!

听风听你
2024-06-18 18:37:24
不是郭士强也不是巩晓彬!CBA山东男篮疑似敲定主帅是杨文海?

不是郭士强也不是巩晓彬!CBA山东男篮疑似敲定主帅是杨文海?

小鬼头体育
2024-06-20 11:09:21
阿森纳8折购意甲金靴,补强全队最大短板,挑战曼城英超霸主地位

阿森纳8折购意甲金靴,补强全队最大短板,挑战曼城英超霸主地位

宝哥爱足球
2024-06-20 00:45:30
茅台价格崩盘:大基建时代落幕的失意者

茅台价格崩盘:大基建时代落幕的失意者

读懂财经研究所
2024-06-20 11:08:37
4冠+2MVP+FMVP,库里在勇士15年留下5个纪录,破一个就是巨星

4冠+2MVP+FMVP,库里在勇士15年留下5个纪录,破一个就是巨星

篮球圈里的那些事
2024-06-20 12:47:46
中菲摩擦后杜特尔特女儿、现任菲律宾副总统提交辞呈,马科斯秒批

中菲摩擦后杜特尔特女儿、现任菲律宾副总统提交辞呈,马科斯秒批

说天说地说实事
2024-06-19 18:32:45
一颗子弹别想运进台湾!美国军火马上就到,大陆早已准备海上拦截

一颗子弹别想运进台湾!美国军火马上就到,大陆早已准备海上拦截

小阿文热点军
2024-06-15 19:13:11
哈恐肉喇叭还在嘚瑟

哈恐肉喇叭还在嘚瑟

凡事一定有办法13119
2024-06-15 15:14:59
张艺谋首部电视剧《主角》3选1:赵丽颖刘亦菲孙俪,5方面考察?

张艺谋首部电视剧《主角》3选1:赵丽颖刘亦菲孙俪,5方面考察?

小路杂谈
2024-06-18 16:27:54
此沙版郭靖有望成经典,抛开美瞳歪嘴黄滤镜,新《射雕》选角惊喜

此沙版郭靖有望成经典,抛开美瞳歪嘴黄滤镜,新《射雕》选角惊喜

米椒娱乐
2024-06-20 09:41:01
董文华当初为何悄然退圈?多年后赖昌星公开说出了两人的关系

董文华当初为何悄然退圈?多年后赖昌星公开说出了两人的关系

星辰故事屋
2024-06-18 18:37:04
29岁女排王梦洁:场下是女神,1米73,父母都是高个头篮球运动员

29岁女排王梦洁:场下是女神,1米73,父母都是高个头篮球运动员

兰子记
2024-06-19 20:36:07
内塔尼亚胡“激怒拜登顾问”!白宫决定取消原定今日举行的美以高级别会议

内塔尼亚胡“激怒拜登顾问”!白宫决定取消原定今日举行的美以高级别会议

环球网资讯
2024-06-20 06:21:17
单位里退休的风向变了

单位里退休的风向变了

悠闲葡萄
2024-06-19 12:37:47
如今的世界,没有谁能将中国拖入战争

如今的世界,没有谁能将中国拖入战争

鸢飞九天
2024-06-19 21:50:13
以色列发出了严正警告,明确要求黎巴嫩不得在夜晚发起袭击!

以色列发出了严正警告,明确要求黎巴嫩不得在夜晚发起袭击!

林林爱天堂
2024-06-19 18:52:04
2024-06-20 13:06:44
胡润百富
胡润百富
胡润百富官方账号
3391文章数 11402关注度
往期回顾 全部

科技要闻

苹果回应AI仅限iPhone15Pro:不是为卖新机

头条要闻

乌媒:乌军遭受一系列惨痛失败 乌军总司令或将被解职

头条要闻

乌媒:乌军遭受一系列惨痛失败 乌军总司令或将被解职

体育要闻

绿军的真老大,开始备战下赛季了

娱乐要闻

离谱!24岁女偶像参加涉毒男星生日聚会,坐在桌边陪赌

财经要闻

茅台大跌,谁的锅?

汽车要闻

售价11.79-14.39万元 新一代哈弗H6正式上市

态度原创

亲子
健康
教育
家居
军事航空

亲子要闻

女儿生妈妈气坐路边戳手指,被妈妈问到生谁气时,孩子低头指认,小手一指,委屈巴巴太可爱了

晚餐不吃or吃七分饱,哪种更减肥?

教育要闻

重庆中考题“给校长写信”怎么写出花来

家居要闻

自然开放 实现灵动可变空间

军事要闻

以色列涉嫌在加沙使用重型炸弹 或多次违反战争法

无障碍浏览 进入关怀版