网易首页 > 网易号 > 正文 申请入驻

GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费开放

0
分享至

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

不开玩笑,电影《她》真的来了。

OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。

现场直播的效果更是炸裂:

它能感受到你的呼吸节奏,也能用比以前更丰富的语气实时回复,甚至可以做到随时打断。

00:00/01:25

GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出

它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致

00:00/01:22

这还是一份给所有人的大礼,GPTo与ChatGPT Plus会员版所有的能力,包括视觉、联网、记忆、执行代码、GPT Store……

将对所有用户免费开放!



(新语音模式几周内先对Plus用户开放)

在直播现场,CTO Murati穆姐说:这是把GPT-4级别的模型开放出去,其实她还谦虚了。

在场外,研究员William Fedus揭秘,GPT-4o就是之前在大模型竞技场搞A/B测试的模型之一,im-also-a-good-gpt2-chatbot

无论从网友上手体验还是竞技场排位来看,都是高于GPT-4-Turbo级别的模型了,ELO分数一骑绝尘。



而这样的超强模型也将提供API,价格打5折,速度提高一倍,单位时间调用次数足足三原来的5倍!



追直播的网友已经在设想可能的应用,可以替代盲人看世界了。以及确实感觉比之前的语音模式体验上强上不少。



鉴于之前不少人就已经和ChatGPT语音模式“谈恋爱”了,有大胆想法的朋友,可以把你们的想法发在评论区了。



总裁Brockman在线演示

知道OpenAI发布会为什么定在谷歌I/O前一天了——打脸,狠狠打脸。

谷歌Gemini发布会需要靠剪辑视频和切换提示词达成的实时对话效果,OpenAI现场全都直播演示了。

比如让ChatGPT在语言不通的两个人之间充当翻译机,听到英语就翻译成意大利语,听到意大利语就翻译成英语。

00:00/00:00

发布会直播之外,总裁哥Brockman还发布了额外的5分钟详细演示。

而且是让两个ChatGPT互相对话,最后还唱起来了,戏剧感直接拉满。

这两个ChatGPT,一个是旧版APP,只知道对话,另一个则是新版网页,具备视觉等新能力。(我们不妨取Old和New的首字母,分别叫TA们小O和小N)



Brockman首先向小O介绍了大致情况,告诉她要和一个拥有视觉能力的AI对话,她表示很酷并欣然接受。

接着,Brockman让她稍作休息,并向小N也介绍情况,还顺带展示了小N的视觉能力。

只见打完招呼后,小N准确地说出了Brockman的衣着打扮和房间环境。而对于要和小O对话这件事,小N也感到很有趣。

00:00/01:32

接下来就是小O和小N相互对白的时间了,TA们依然是从Brockman的衣着开始聊起,小O不断提出新的问题,小N都一一解答。

接着,他们又谈论了房间的风格、布置和光线,甚至小N还意识到了Brockman正站在上帝视角凝视着TA们。

00:00/00:00

如果你看了这段视频就会发现,画面中出现了一个女人在Brockman身后做了些恶搞的手势。

这可不是乱入,是Brockman和女人串通好,专门给小N设计的一道“考题”。



就在小O和小N聊的正开心的时候,Brockman选择加入,直接问有没有看到什么不正常的地方。

结果是小N直接识破了Brockman的小伎俩,直接复述出了女人在他身后做小动作的场景,小O听了之后直接感叹原来在这里享受乐趣的不只有我们两个。

Brockman把这句话当成了夸赞,并对小O表示了感谢,还愉快地加入了TA们的对话。

之后是最后也是最精彩的部分,在Brockman的指挥下,小O和小N根据刚才聊天的内容,直接开启了对唱模式。

只过了简单几轮,衔接地就十分密切,而且旋律悠扬,音色也是和真人毫无二致。

00:00/02:18

最后视频以Brockman唱出的一句Thank you结束,在视频外的推文中他还透露新的语音对话功能将在数周内向Plus用户开放。



端到端训练,一个神经网络搞定语音文本图像

正如奥特曼在发布会前所说,GPT-4o让人感觉像魔法一样,那么它是如何做到的呢?

非常抱歉,这次非但没有论文,连技术报告也不发了,只在官网Blog里有一段简短的说明。

在GPT-4o之前,ChatGPT语音模式由三个独立模型组成,语音转文本→GPT3.5/GPT-4→文本转语音

我们也可以让旧版ChatGPT语音模式自己讲一下具体是怎么个流程。



这样一来,整个系统的延迟足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丢失了大量的信息,它无法直接感受音调、多个说话者或背景噪音,也无法输出笑声、唱歌声,或表达情感。



GPT-4o则是跨文本、视觉和音频端到端训练的新模型,这意味着所有输入和输出都由同一个神经网络处理

在语音翻译任务上,强于OpenAI专门的语音模型Whisper-V3以及谷歌和Meta的语音模型。



在视觉理解上,也再次反超Gemini 1.0 Ultra与对家Claude Opus



虽然技术方面这次透露的消息就这么多了,不过也有学者评价。

一个成功的演示相当于1000篇论文。



One More Thing

除了OpenAI带来的精彩内容之外,也别忘了北京时间5月15日凌晨,谷歌将召开I/O大会。

到时量子位将继续第一时间带来最新消息。

另外根据网友推测,GPT-4o这么强,全都免费开放了,这是劝大家不续订ChatGPT Plus了的意思吗?

那肯定不是啊~



鉴于OpenAI春节期间在谷歌发布Gemini 1.5 Pro后半小时左右用Sora狙击了一把,明天OpenAI还有新活也说不定呢?

直播回放
https://www.youtube.com/watch?v=DQacCB9tDaw

参考链接:
[1]https://openai.com/index/hello-gpt-4o/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
真情流露!纳达尔一轮游后接受场上采访!德约科维奇现场送别!

真情流露!纳达尔一轮游后接受场上采访!德约科维奇现场送别!

元爸体育
2024-05-28 11:09:24
再发声鲁尼:我认为梅西是史上最佳,但我为此遭受了很多批评

再发声鲁尼:我认为梅西是史上最佳,但我为此遭受了很多批评

直播吧
2024-05-28 17:52:14
老公技校毕业,1981年参加工作,分到国企,今天得知退休金有6900

老公技校毕业,1981年参加工作,分到国企,今天得知退休金有6900

知秋侃史
2024-05-25 02:20:06
客流强度仅262人/公里,广肇城际、广惠城际全线开通首日成绩堪忧

客流强度仅262人/公里,广肇城际、广惠城际全线开通首日成绩堪忧

校长侃财
2024-05-28 23:53:56
这是周冬雨?完全不敢相信 ,太漂亮了

这是周冬雨?完全不敢相信 ,太漂亮了

娱乐八卦木木子
2024-05-27 10:07:56
美航天局局长:对中国登月行动发出严厉警告,中国先到达就会占领

美航天局局长:对中国登月行动发出严厉警告,中国先到达就会占领

番茄说史聊
2024-05-27 21:52:14
有女人说我爸性侵她,我妈哈哈大笑:“他那两下子我还不知道?”

有女人说我爸性侵她,我妈哈哈大笑:“他那两下子我还不知道?”

让风替我保密
2024-05-27 23:48:28
外籍夫妻在卧室里裸睡,做爱不关门,保姆围观:你做得,我看得

外籍夫妻在卧室里裸睡,做爱不关门,保姆围观:你做得,我看得

小保姆大世界
2022-05-20 12:14:04
做“情人”的中年女人,大多有这三个特征,一看便知

做“情人”的中年女人,大多有这三个特征,一看便知

莲子说情感
2024-05-09 11:29:53
吴蔚:美国只有在昏了头的情况下才会邀请台军参加“环太”军演

吴蔚:美国只有在昏了头的情况下才会邀请台军参加“环太”军演

直新闻
2024-05-26 22:58:20
吃火锅时,服务员问“要不要加汤”,其实在暗示你,不懂就尴尬了

吃火锅时,服务员问“要不要加汤”,其实在暗示你,不懂就尴尬了

心灵古迹
2024-05-29 00:26:52
扒叔大爆料:李佳琦要被搞黄了?老燕子和王菲的瓜?马思纯张哲轩隐婚?张若昀被父亲连累?

扒叔大爆料:李佳琦要被搞黄了?老燕子和王菲的瓜?马思纯张哲轩隐婚?张若昀被父亲连累?

房产衫哥
2024-05-28 23:28:49
1983年,朱德的孙子被执行死刑,康克清说:王子犯法,与庶民同罪

1983年,朱德的孙子被执行死刑,康克清说:王子犯法,与庶民同罪

帝哥说史
2024-05-27 07:28:08
许妈姚爸直播带货业绩揭晓。杜粉说三道四,宽哥吟诗一首

许妈姚爸直播带货业绩揭晓。杜粉说三道四,宽哥吟诗一首

渤海草堂2
2024-05-28 05:10:03
兰州马拉松“飞天女”作秀?本人回应,过往曝光,网友:太牛了!

兰州马拉松“飞天女”作秀?本人回应,过往曝光,网友:太牛了!

邮轮摄影师阿嗵
2024-05-28 20:44:18
冲上热搜!央视:夜查电动车查什么?看完网友还是一头雾水

冲上热搜!央视:夜查电动车查什么?看完网友还是一头雾水

苗苗情感说
2024-05-29 02:46:14
王树国教授已从福耀科技大学离任?该校宣布全新管理团队没有他!

王树国教授已从福耀科技大学离任?该校宣布全新管理团队没有他!

火山诗话
2024-05-27 15:59:42
姑娘被换脸成色X片主角,删了1个还有800多个,两年后她开始反击

姑娘被换脸成色X片主角,删了1个还有800多个,两年后她开始反击

听风听你
2024-05-28 01:09:11
太阳、火箭、灰熊三方交易曝光,再见杜兰特!莫兰特迎来好大哥

太阳、火箭、灰熊三方交易曝光,再见杜兰特!莫兰特迎来好大哥

球坛殿堂
2024-05-28 17:13:49
美国防部分析师:中国高超音速武器已经超越俄罗斯,位居全球第一

美国防部分析师:中国高超音速武器已经超越俄罗斯,位居全球第一

笑语娱乐
2024-05-26 00:20:17
2024-05-29 04:20:49
量子位
量子位
追踪人工智能动态
9451文章数 175295关注度
往期回顾 全部

科技要闻

4月中国手机需求回升 iPhone出货量增长52%

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

体育要闻

官方:曼城当选环足奖欧洲年度最佳俱乐部,击败皇马、药厂等队

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

亲子
艺术
游戏
数码
公开课

亲子要闻

妈妈记录下爸爸带娃的时候,趁宝宝睡着用他屁股当手机支架

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

支持试玩 像素剧情《Until Then》6月25日发售

数码要闻

极空间发布企业级私有云设备P8:全新专属解决方案 售价8999元

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版