网易首页 > 网易号 > 正文 申请入驻

视觉语音交互毫无延迟,都成精了居然还不是GPT-5?

0
分享至


作者|王兆洋
邮箱|zywang@pingwest.com

OpenaAI 给 2024 年 5 月 14 日的这场发布会取名 “ 春季功能更新 ” ,就像它们形容当初 ChatGPT 的发布是一次 “ 低调的研究预览 ” 一样。


而就像那次一样,一切也都回不去了。

OpenAI发布了一个叫做GPT-4o的新模型,它的确不是GPT-5,但看了它能做的事情,再想到它甚至不是OpenAI正在砸更多的钱和智慧在做的GPT-5,你只会感觉更“可怕”。

发布会一开始, OpenAI 的 CTO Mira Murati 介绍了新模型 GPT-4o(是的,Sam Altman全程没有现身)。 她强调这个模型是要给所有人使用,并且通过交互的更新让人们忘了 UI 的存在。因为 OpenAI 的愿景正是如此。

而到此这似乎还很正常。

“ 不过是新模型而已嘛。 ”


但直到 demo 环节开始,一切越来越离谱。

首先是一个实时对话的展示。

“ 我正在做 demo ,我有点紧张。 ”Mark 说。然后他开始故意喘息的非常快。而 GPT 识别出了他的呼吸。

“ 哦,哦,哦,别紧张,慢下来。你不是个吸尘器。 ”ChatGPT 的女人声音抑扬顿挫,没有任何延迟。

是没有任何延迟。你不需要等她,她也不会让你等,当你直接开始说接下来的话,她会立刻停下来听,并立刻做出调整。

而且在这些回答中,它甚至有喘息和犹豫的声音。

另一个很可怕的细节是,这些demo全程不需要任何多余的按键操作。

对,声音的对话就像是在 “ 打电话 ” 。

另一个 demo 是假设要给朋友讲一个关于机器人的睡前故事。

提出需求后, ChatGPT 开始正常的讲故事。

但听的人并不喜欢,于是直接打断说,能不能讲的更有感情更 drama 一点。

ChatGPT 立刻调整,增加了一些悬疑感。

“ 不不不,我希望把感情和 drama 感拉满。 ” 听者再次直接打断。 —— 也就是说 ChatGPT 在实时听着你的声音。

然后 ChatGPT 变成了一个非常浮夸的故事讲述者。

“你能不能用机器人的声音给我讲故事。”Mira又直接插话。

而 ChatGPT 立刻开始模仿机器人。注意,是模仿,也就是它的声音一直是那个女声,一切听起来就像家长在讲睡前故事时候会做的那样。

“ 你能最后唱一首歌把这个故事结束么。 ” 听者又提了要求。

然后 ChatGPT 立刻唱了一首歌。根据刚才的故事,实时,改编,并直接唱出来的一首歌。

“如果你之前使用过我们的语音模式,你会注意到几个关键的区别。首先,你现在可以打断模型了。你不需要等它结束你的回合,你可以随时开始说话,随时插话。其次,模型的响应是实时的。这意味着你不需要再经历那种尴尬的两到三秒的延迟,等待模型回应。最后,当我刚才呼吸非常急促时,模型能够感知到情绪。它会提醒你,或许你需要放松一下,你的节奏快得有点过头了。所以你知道,它确实具有全面感知情绪的能力。不仅如此,这个模型还能以各种不同的情感风格生成声音,它真的具有非常广泛的动态范围。”

如果你是个创业者,或者熟悉大模型应用创业环境的人,你会立刻意识到。

又有一批创业公司死了。

之后是视觉能力的展示。

对,在同一个产品上。一个据说要免费提供给全世界所有人的产品上。

他先是展示了一个通过摄像头获得视觉能力,然后实时指导你的数学解题的 demo 。

甚至因为 “ 幻觉 ” 问题, ChatGPT 在还没打开摄像头时候就自信满满的说理解了。当展示者提示后,她说 “oops ,我太兴奋了。 ”

然后展示者打开摄像头,实时写了一个数学方程题,然后让 ChatGPT 一步一步的提醒和讲解他在做的解题思路。 ChatGPT 很好的做到了。

像一个很有经验有耐心的数学老师那样。

这还没完。

似乎是为了打脸那些录制好加速后的demo,他们还实时收集了X上的反馈。其中一个挑战是:打开摄像头让ChatGPT实时分析你的情绪。

展示者开始摄像头自拍,而 ChatGPT 立刻分析道:

“ 你看起来是个桌子。 ”—— 因为打开摄像头时,最先打开的是前置的摄像头,对准的是桌子。

“ 不不不,那是之前的,你不用担心,我不是个桌子。 ” 分享者说到。

“哈哈,那就合理了。”Chat GPT说到。

这里看的时候,估计很多人跟我一样惊了一下。

然后 ChatGPT 立刻分析: “ 你看起来非常开心。大大的笑容,甚至有一点兴奋。你想分享一下让你这么开心的原因么? ” 语气里甚至能听到好奇,以及斟酌语句的感觉。

“ 因为我在做实时展示,让大家看看你有多出色。 ” 讲者说。

“哦,拜托,别让我脸红了。”ChatGPT带着笑声说到。

瞬间,《Her》降临。科幻成了现实。

看到这,所有人估计都明白了 Sam Altman 此前卖关子时候说的 “magic” 是什么。

在惊叹之余,还是再总结一下:

  • 1 这些操作全程没有多余的点击操作的交互。

  • 2 没有丝毫延迟的视觉和声音反馈。

  • 3 不仅能感受到你的情感,ChatGPT也自带情绪和情感。

  • 4 能对桌面等更数字化的世界有更全面的信息感知。

  • 5 全部集成在一个产品里,而且可能是对所有人免费的。

哦对,以及,这还不是GPT-5。

发布会后, OpenAI 也在官网更新了这次发布的模型的具体信息:

https://openai.com/index/hello-gpt-4o/

还记得 ChatGPT 第一次出来时,有人形容跟它第一次亲密接触的感受:

当你通过打字跟它交互的时候,等待它回答的过程仿佛能想象到对面坐着一个人,正在转笔,思考如何回答你的问题。

而今天,不只是你的叹气,情感和喘息能被 AI 感受到,你也能直接感受到对面的 “ 人 ” 的叹气,情感,和喘息。

在电影《 Her》 里,主人公最终爱上了这个 AI 助手。我们不知道 GPT-4o 加持下的新 ChatGPT 会带来什么。更不知道 GPT-5 出现后会发生什么。

一切都太快了,都回不去了。

最后,对所有开发者和创业者,这次发布又意味着什么?

也许这句当时有些被人不以为意甚至觉得冒犯的话值得再看一遍,它可能说明了一切:

目前有两种构建人工智能的策略:一种是假设模型不会改进,然后在现有的能力上建设一堆小东西;另一种是假设 OpenAI 将保持相同的增长轨迹(继续疯狂迭代)。我认为,95% 的人应该押注在第二种策略上。我们有改进模型的使命,不是我不喜欢你们,但我们将碾压你。 ‍ ——Sam Altman,2023年4月17日


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
媒体人:当年韦世豪更衣室和李铁吵架,说阿兰费南多凭什么不首发

媒体人:当年韦世豪更衣室和李铁吵架,说阿兰费南多凭什么不首发

直播吧
2024-05-23 21:25:04
亲美辱华,背刺祖国,吃中国饭却长美国心的吕丽萍,现在自食恶果

亲美辱华,背刺祖国,吃中国饭却长美国心的吕丽萍,现在自食恶果

番茄说史聊
2024-05-16 17:41:40
女子出轨遭男友捉奸暴打,对方一丝不挂,现场画面曝光太辣眼

女子出轨遭男友捉奸暴打,对方一丝不挂,现场画面曝光太辣眼

180°视角
2024-05-23 15:42:47
5月23俄乌:俄罗斯试探西方底线,俄军Su-25战机被击落,攻势停滞

5月23俄乌:俄罗斯试探西方底线,俄军Su-25战机被击落,攻势停滞

山河路口
2024-05-23 15:35:08
打脸来的太快!郭有才昨天还是文旅推荐官,今天“底裤”都被掀开

打脸来的太快!郭有才昨天还是文旅推荐官,今天“底裤”都被掀开

娱乐八卦木木子
2024-05-23 20:08:41
随时参战!解放军“联合利剑-2024A”突然展开,直击赖清德命门

随时参战!解放军“联合利剑-2024A”突然展开,直击赖清德命门

王子看台海
2024-05-23 16:42:15
许家印的保护伞,终于被查了!

许家印的保护伞,终于被查了!

华人星光
2024-05-23 15:35:13
上交大应届生转正12天因言论不当被辞退,网友:不冤,为幼稚买单

上交大应届生转正12天因言论不当被辞退,网友:不冤,为幼稚买单

东东趣谈
2024-05-23 18:14:32
到台湾我才知道,普通百姓生活和内地相比,区别很大

到台湾我才知道,普通百姓生活和内地相比,区别很大

兰子记
2024-05-23 22:05:56
曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

曝45岁伏明霞离婚,净身出户原因揭晓,71岁百亿丈夫只说6个字

深度知局
2024-05-20 19:25:53
乌精确斩首,俄上将司令被炸死,美防长拉姆施泰因会议上慷慨激昂

乌精确斩首,俄上将司令被炸死,美防长拉姆施泰因会议上慷慨激昂

史政先锋
2024-05-22 19:30:31
太原赛爆大冷!国乒男单惨败,4人出局,17岁新星3-1日本奥运主力

太原赛爆大冷!国乒男单惨败,4人出局,17岁新星3-1日本奥运主力

知轩体育
2024-05-23 15:46:42
一个县城的供热“争夺战”:投资过亿,30年特许经营权5年被收回,非法抢夺还是合法接管

一个县城的供热“争夺战”:投资过亿,30年特许经营权5年被收回,非法抢夺还是合法接管

红星新闻
2024-05-23 20:45:41
离谱!老人未消费在星巴克休息,嫌吵闹怒砸星巴克,商家回应

离谱!老人未消费在星巴克休息,嫌吵闹怒砸星巴克,商家回应

看晓天下事
2024-05-23 15:41:14
“奇技淫巧”四个字又出来了

“奇技淫巧”四个字又出来了

报人刘亚东
2024-05-23 16:29:02
剑指欧洲杯冠军!意大利30人大名单出炉,球迷:出线有点悬

剑指欧洲杯冠军!意大利30人大名单出炉,球迷:出线有点悬

侧身凌空斩
2024-05-23 22:16:32
爆料辽宁队夺冠奖金分配曝光,杨鸣和韩德君最多,郭艾伦躺赢百万

爆料辽宁队夺冠奖金分配曝光,杨鸣和韩德君最多,郭艾伦躺赢百万

宗介说体育
2024-05-23 18:14:07
没想到,这8件东西正在悄悄上涨生活成本,看看你家里有没有?

没想到,这8件东西正在悄悄上涨生活成本,看看你家里有没有?

家物JIAWU
2024-05-17 19:48:18
强大到没有对手!2024年美国经济再创新高,相当于8大强国之和

强大到没有对手!2024年美国经济再创新高,相当于8大强国之和

娱乐圈的大爆炸
2024-05-23 17:35:37
美军官员称中方围绕台湾地区军演“令人担忧”,外交部回应

美军官员称中方围绕台湾地区军演“令人担忧”,外交部回应

澎湃新闻
2024-05-23 15:38:27
2024-05-24 05:32:49
硅星人
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
1266文章数 10250关注度
往期回顾 全部

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

体育要闻

欧文,三十二而立

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

九鼎金租减值罗生门:郑州银行藏雷?

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

健康
教育
时尚
房产
手机

在中国,到底哪些人在吃“伟哥”?

教育要闻

2024年高考招生,为何这么多专项招生计划?

抗老靠基因?快50岁的舒淇连头发丝都在发光

房产要闻

信号!海南这个区域开始鼓励企业购买安居房!

手机要闻

vivo S19系列再次被确认:三款版本,能打过OPPO Reno12系列吗?

无障碍浏览 进入关怀版