网易首页 > 网易号 > 正文 申请入驻

GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了

0
分享至



作者|梦晨 克雷西

来源|量子位

不开玩笑,电影《她》真的来了。

OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。

现场直播的效果更是炸裂:

它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。

GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出。

它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。

这还是一份给所有人的大礼,GPT4-o与ChatGPT Plus会员版所有的能力,包括视觉、联网、记忆、执行代码、GPT Store……

将对所有用户免费开放!


(新语音模式几周内先对Plus用户开放)

在直播现场,CTO Murati穆姐说:这是把GPT-4级别的模型开放出去,其实她还谦虚了。

在场外,研究员William Fedus揭秘,GPT-4o就是之前在大模型竞技场搞A/B测试的模型之一,im-also-a-good-gpt2-chatbot。

无论从网友上手体验还是竞技场排位来看,都是高于GPT-4-Turbo级别的模型了,ELO分数一骑绝尘。


而这样的超强模型也将提供API,价格打5折,速度提高一倍,单位时间调用次数足足是原来的5倍!


追直播的网友已经在设想可能的应用,可以替代盲人看世界了。以及确实感觉比之前的语音模式体验上强上不少。


鉴于之前不少人就已经和ChatGPT语音模式“谈恋爱”了,有大胆想法的朋友,可以把你们的想法发在评论区了。



总裁Brockman在线演示

知道OpenAI发布会为什么定在谷歌I/O前一天了——打脸,狠狠打脸。

谷歌Gemini发布会需要靠剪辑视频和切换提示词达成的伪实时对话效果,OpenAI现场全都直播演示了。

比如让ChatGPT在语言不通的两个人之间充当翻译机,听到英语就翻译成意大利语,听到意大利语就翻译成英语。

发布会直播之外,总裁哥Brockman还发布了额外的5分钟详细演示。

而且是让两个ChatGPT互相对话,最后还唱起来了,戏剧感直接拉满。

这两个ChatGPT,一个是旧版APP,只知道对话,另一个则是新版网页,具备视觉等新能力。(我们不妨取Old和New的首字母,分别叫TA们小O和小N)


Brockman首先向小O介绍了大致情况,告诉她要和一个拥有视觉能力的AI对话,她表示很酷并欣然接受。

接着,Brockman让她稍作休息,并向小N也介绍情况,还顺带展示了小N的视觉能力。

只见打完招呼后,小N准确地说出了Brockman的衣着打扮和房间环境。而对于要和小O对话这件事,小N也感到很有趣。

接下来就是小O和小N相互对白的时间了,TA们依然是从Brockman的衣着开始聊起,小O不断提出新的问题,小N都一一解答。

接着,他们又谈论了房间的风格、布置和光线,甚至小N还意识到了Brockman正站在上帝视角凝视着TA们。

如果你看了这段视频就会发现,画面中出现了一个女人在Brockman身后做了些恶搞的手势。

这可不是乱入,是Brockman和女人串通好,专门给小N设计的一道“考题”。


就在小O和小N聊的正开心的时候,Brockman选择加入,直接问有没有看到什么不正常的地方。

结果是小N直接识破了Brockman的小伎俩,直接复述出了女人在他身后做小动作的场景,小O听了之后直接感叹原来在这里享受乐趣的不只有我们两个。

Brockman把这句话当成了夸赞,并对小O表示了感谢,还愉快地加入了TA们的对话。

之后是最后也是最精彩的部分,在Brockman的指挥下,小O和小N根据刚才聊天的内容,直接开启了对唱模式。

只过了简单几轮,衔接地就十分密切,而且旋律悠扬,音色也是和真人毫无二致。

最后视频以Brockman唱出的一句Thank you结束,在视频外的推文中他还透露新的语音对话功能将在数周内向Plus用户开放。



端到端训练,一个神经网络搞定语音文本图像

正如奥特曼在发布会前所说,GPT-4o让人感觉像魔法一样,那么它是如何做到的呢?

非常抱歉,这次非但没有论文,连技术报告也不发了,只在官网Blog里有一段简短的说明。

在GPT-4o之前,ChatGPT语音模式由三个独立模型组成,语音转文本→GPT3.5/GPT-4→文本转语音。

我们也可以让旧版ChatGPT语音模式自己讲一下具体是怎么个流程。


这样一来,整个系统的延迟足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丢失了大量的信息,它无法直接感受音调、多个说话者或背景噪音,也无法输出笑声、唱歌声,或表达情感。


GPT-4o则是跨文本、视觉和音频端到端训练的新模型,这意味着所有输入和输出都由同一个神经网络处理。

在语音翻译任务上,强于OpenAI专门的语音模型Whisper-V3以及谷歌和Meta的语音模型。


在视觉理解上,也再次反超Gemini 1.0 Ultra与对家Claude Opus


虽然技术方面这次透露的消息就这么多了,不过也有学者评价。

一个成功的演示相当于1000篇论文。



One More Thing

除了OpenAI带来的精彩内容之外,也别忘了北京时间5月15日凌晨,谷歌将召开I/O大会。

到时量子位将继续第一时间带来最新消息。

另外根据网友推测,GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~


鉴于OpenAI春节期间在谷歌发布Gemini 1.5 Pro后半小时左右用Sora狙击了一把,明天OpenAI还有新活也说不定呢?

AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian ,注明真实身份。

数据支持天眼查,大模型独家合作账号

监制 / 刘老师

编辑 / AIGCCCCC

视觉 / 大模型

微博 / @AI大模型工场

TG/AI Marketing Field


大模型应用创业者,你怎么看?

■ 百度文心一言,阿里通义千问 ▍通用大模型案例

■ 科大讯飞星火 京东 ▍产业大模型案例

■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例

■ 盘古大模型,中国电信,医联 ▍医疗大模型案例

■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例

■知乎,360大模型,火山引擎 ▍ 教育大模型案例

■ 网易,金山办公大模型 ▍ 更多行业大模型案例

上次介绍OpenAI将再次迎来新升级!将升级哪些?下一代iPhone是否有望使用ChatGPT


本文由大模型领域垂直媒体「AI大模型工场」

原创出品,未经许可,请勿转载。

欢迎提供新的大模型商业化落地思路

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大陆划出红线不到48小时,66架美国军机奔赴台湾,誓死保卫赖清德

大陆划出红线不到48小时,66架美国军机奔赴台湾,誓死保卫赖清德

葛剑生
2024-06-11 10:35:06
5年3.04亿贵吗?杰伦-布朗冲向FMVP 还有望缔造一项历史纪录

5年3.04亿贵吗?杰伦-布朗冲向FMVP 还有望缔造一项历史纪录

直播吧
2024-06-13 12:17:27
继续降价!北京一四环新房单价直降超1万开盘

继续降价!北京一四环新房单价直降超1万开盘

36氪
2024-06-13 09:56:35
(6月13日)今晚女排中央5直播吗?附中央5台女排直播时间表预告!

(6月13日)今晚女排中央5直播吗?附中央5台女排直播时间表预告!

刺头体育
2024-06-13 12:02:56
柳州18路公交车发生意外事故,一老人救治无效身亡

柳州18路公交车发生意外事故,一老人救治无效身亡

环球网资讯
2024-06-13 13:42:28
两性知识:房事中谨记这五个数字,让你有始有终驰骋沙场

两性知识:房事中谨记这五个数字,让你有始有终驰骋沙场

坟头长草
2024-06-05 10:10:01
00后女子嫁给80后引起热议,网友:姐妹是一天班都不想上啊!

00后女子嫁给80后引起热议,网友:姐妹是一天班都不想上啊!

滑稽斑马呀
2024-06-12 22:09:33
客场挑战津门虎,上海海港发布赛前海报:远道启津门

客场挑战津门虎,上海海港发布赛前海报:远道启津门

懂球帝
2024-06-13 13:53:34
中国女排总决赛分析:还赢1场3分不够,世界女排联赛积分榜

中国女排总决赛分析:还赢1场3分不够,世界女排联赛积分榜

乒烧足篮排
2024-06-12 22:35:37
6月12日,这应该是今天娱乐圈最“劲爆”的瓜了!

6月12日,这应该是今天娱乐圈最“劲爆”的瓜了!

仙人掌说娱乐
2024-06-12 16:20:49
定了!武汉将有八大火车站

定了!武汉将有八大火车站

极目新闻
2024-06-13 11:45:31
河南最美女警花被局长霸占,丈夫一招反击,亲手把局长送进监狱!

河南最美女警花被局长霸占,丈夫一招反击,亲手把局长送进监狱!

古今档案
2023-12-24 22:37:30
人神共愤!女孩喊爸爸被踹飞后续:疑似妈妈发声,警方评论区沦陷

人神共愤!女孩喊爸爸被踹飞后续:疑似妈妈发声,警方评论区沦陷

王小花谈历史
2024-06-12 16:56:56
可惜没如果?快船记者:若冲出西部的是掘金 那总决赛形势如何?

可惜没如果?快船记者:若冲出西部的是掘金 那总决赛形势如何?

直播吧
2024-06-13 13:53:23
还剩3天!马科斯下了死命令,要和中国磕到底,打响南海第一枪?

还剩3天!马科斯下了死命令,要和中国磕到底,打响南海第一枪?

林子说事
2024-06-13 13:16:56
独行侠再败凯尔特人!季后赛史上第157次0-3,此前落后方从未翻盘

独行侠再败凯尔特人!季后赛史上第157次0-3,此前落后方从未翻盘

体坛扒客
2024-06-13 11:20:19
高考出现“神仙卷面”,字迹工整漂亮,阅卷老师:看到就想打满分

高考出现“神仙卷面”,字迹工整漂亮,阅卷老师:看到就想打满分

文文爸育儿
2024-06-10 16:33:25
大陆男子驾艇成功登台湾细节曝光:突破5亿监控系统后,自己报警

大陆男子驾艇成功登台湾细节曝光:突破5亿监控系统后,自己报警

消失的电波
2024-06-13 10:01:58
增幅257%!华为首度登顶!

增幅257%!华为首度登顶!

EETOP半导体社区
2024-06-13 11:34:00
河南此轮高温还有多久结束?省气象局:将持续到19日前后

河南此轮高温还有多久结束?省气象局:将持续到19日前后

大象新闻
2024-06-13 09:03:01
2024-06-13 14:28:49
AI大模型工场
AI大模型工场
专注AI大模型行业媒体,深度解读公司大模型行业动态,且提供一手的AIGC,行业大模型内容。
61文章数 13关注度
往期回顾 全部

科技要闻

"在小红书,员工是实验品,不好用就扔掉"

头条要闻

中央召开重要会议 鼓励有条件的民企建立现代企业制度

头条要闻

中央召开重要会议 鼓励有条件的民企建立现代企业制度

体育要闻

国足,别辜负这场奇迹!

娱乐要闻

森林北报案,称和汪峰的感情遭受压力

财经要闻

徽商银行的影子 借基金向地方城投放贷?

汽车要闻

升级8155芯片 新款卡罗拉锐放将于今日上市

态度原创

健康
本地
旅游
手机
公开课

晚餐不吃or吃七分饱,哪种更减肥?

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

旅游要闻

山西文旅厅厅长与董宇辉拉家常:中午回家吃了饭

手机要闻

继欧盟之后日本也要强制iOS开放侧载:对苹果垄断说不

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版