网易首页 > 网易号 > 正文 申请入驻

OpenAI推出GPT-4o原生多模态大模型,实现零延迟、多情感语音交互,且完全免费

0
分享至

OpenAI 比苹果提前展示了什么是真正的语音助手。

北京时间 5 月 14 日 凌晨 1 点, OpenAI 的春季更新活动如期而至。

此次活动中,OpenAI 宣布推出了一个名为“GPT-4o”的新旗舰生成式 AI 模型,以及桌面版 ChatGPT全新的用户界面

重点当然是GPT-4o,单看命名方式似乎这只是“GPT-4”的一个小迭代版本,但它展现出的原生多模态能力可能改变诸多领域,并影响不少初创公司。“o”代表“omni”(全能),从该词可见一斑。

GPT-4o 拥有“GPT-4 级”智能,在其基础上升级了文本、图像功能,并增加了实时语音功能,可提供文本和语音的输入和输出。“GPT-4o 可以综合利用语音、文本和图像信息进行推理。”OpenAI 首席技术官 Mira Murati 在直播中介绍道。

此次春季更新活动,OpenAI 首席执行官 Sam Altman 并未亮相现场,但他在“幕后”发帖力挺新推出的 GPT-4o,并将其称为“智能、快速、原生多模态,是有史以来最优秀的模型”。


(来源:X)

显然,Sam Altman 所说的“原生多模态”指的是融合了文本、图像和语音功能。他还发帖称,希望尝试使用 GPT-4o 的开发者将可以获得 API,从周一开始就可以使用该新模型构建应用,其价格为 GPT-4 Turbo的一半,但速度可以达到后者的两倍。

此外,GPT-4o 在处理英语文本和编程代码方面达到了 GPT-4 Turbo 的性能水平,对非英语文本的处理能力也有显著提升,特别是在视觉和音频理解方面,GPT-4o 显示出了卓越的性能,显著优于以往的模型。

GPT-4o 的真正亮点在于几乎实时、情感丰富、自然的语音交互上,可以成为一个真正的“个人助理”。它能够处理文本、音频和图像的任意组合输入,并生成相应的多模态输出。其响应速度极快,可以在短短 232 毫秒内响应音频输入,平均反应时间仅为 320 毫秒,与人类在对话中的反应时间相当。

视频 | 与GPT-4o打招呼(来源:YouTube)

在 GPT-4o 引入之前,ChatGPT 的语音模式平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4),且该模式由三个独立模型组合实现。首先,一个专门模型会将用户的语音转录成文本;接着,GPT-3.5 或 GPT-4 根据这些文本生成回复;最后,第三个模型将生成的文本回复转换成语音输出。

这种处理方式,使信息在转换过程中,如音调、不同说话者的声音或背景噪音等重要语音特征无法被直接处理。此外,GPT 模型在输出时也不能模拟笑声、歌声或其他情感表达,这限制了交流的自然性和表现力。

而 GPT-4o 解决或优化了以上问题,该模型通过端到端的方式同时处理文本、视觉和音频输入和输出,这一切都由一个统一的神经网络完成,这种集成化的方法使得模型在处理多模态任务时更为高效和协调,让人机对话更有“沉浸感”。

GPT-4o 的交互不仅是实时的,它还可以识别用户的情绪状态,例如用户呼吸急促,GPT-4o能检测到这种紧张情绪,并给予相应的放松提示。同时,GPT-4o能够根据不同情境生成相应的语音风格,这在讲述故事时表现尤为突出,可以模拟各种人物情感。

GPT-4o 可以看作是人机交互自然化的重要进步,它的应用潜力及其操作界限仍处于初步阶段,还有待进一步探索和实验。

OpenAI 还展示了 GPT-4o 在日常场景中的一些应用,从娱乐到教育,从社交到专业辅助,表明它能够在多个方面辅助人类。比如,提高视障人士的生活质量、实时翻译、帮助学习新语言、在线会议或面试中的辅助交流、与宠物互动、玩游戏等。


图 | GPT-4o的能力展示(来源:YouTube)

我们可以从一个视频中实际看到 GPT-4o 的具体能力。

视频 | 用 GPT-4o 指点和学习西班牙语(来源:YouTube)

此外,OpenAI 也意识到 GPT-4o 的音频模式可能带来的新风险,在发布时,将仅限于选择预设语音,并严格遵循现有的安全政策。接下来的几周和几个月内,OpenAI 将专注于完善技术基础设施、增强模型的训练后可用性,并确保各种输出模式的安全性。

未来数周内,GPT-4o 将分阶段逐步整合到 OpenAI 旗下的产品中,首先向 ChatGPT Plus 和 Team 用户推出,然后是企业版用户,并逐步向 ChatGPT 免费用户推出,而付费用户将继续“拥有五倍于免费用户的容量限制”。


图 | 现在一些用户已经可以使用 GPT-4o(来源:ChatGPT)

除了浓墨重彩地介绍 GPT-4o,OpenAI 此次还推出了 macOS 桌面版 ChatGPT(用户可以通过快捷键对桌面进行截屏并向 ChatGP 提问,而 Windows 版本预计将于今年晚些时候推出),以及新版用户界面,旨在让人机交互变得更友好、更具对话性。

在 Mira Murati 看来,如今的 AI 模型变得越来越复杂,但我们希望人机交互体验能够变得更自然、更简单,让用户完全不用关注界面,而只关注与模型的协作。“这一点非常重要,因为我们正在展望人机交互的未来。”她表示。

参考资料:

1.https://openai.com/

2.https://openai.com/index/hello-gpt-4o/

3.https://openai.com/index/gpt-4o-and-more-tools-to-chatgpt-free/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
东部战区,直接开干了!

东部战区,直接开干了!

燕梳楼频道
2024-05-23 20:00:09
一下子败光了这几年对刘畊宏的所有好感

一下子败光了这几年对刘畊宏的所有好感

圈里的甜橙子
2024-05-23 21:53:23
太戏谑!菲律宾空运榴莲试水北京,上海等地,遭吐槽,原因令人偷笑

太戏谑!菲律宾空运榴莲试水北京,上海等地,遭吐槽,原因令人偷笑

夏知观史
2024-05-23 21:25:57
凉了!央媒发声,连云港海鲜市场空无一人,市场管理方大横幅亮眼

凉了!央媒发声,连云港海鲜市场空无一人,市场管理方大横幅亮眼

校长侃财
2024-05-23 12:33:17
我的天啊!这居然是森林北!乍一看,还以为是俞飞鸿呢!

我的天啊!这居然是森林北!乍一看,还以为是俞飞鸿呢!

小米虫侃人物
2024-05-23 16:20:56
直播被叫停 ,中央台的焦点访谈发出了明确的声音,网友:双手赞同

直播被叫停 ,中央台的焦点访谈发出了明确的声音,网友:双手赞同

圈里的甜橙子
2024-05-23 22:14:15
没错,当时没有ps技术,所以这张照片是真的!

没错,当时没有ps技术,所以这张照片是真的!

小影的娱乐
2024-05-23 19:36:11
赖清德用这种方式回应解放军演习

赖清德用这种方式回应解放军演习

煮酒杂谈
2024-05-23 22:58:17
外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

庞明说财经
2024-05-22 22:15:23
到台湾我才知道,普通百姓生活和内地相比,区别很大

到台湾我才知道,普通百姓生活和内地相比,区别很大

兰子记
2024-05-23 22:05:56
于北辰:统一不能喊口号,而是要让两岸所有中国人都过上好日子

于北辰:统一不能喊口号,而是要让两岸所有中国人都过上好日子

李博世财经
2024-05-23 20:21:39
明明早被查出致癌,美国、加拿大已经下架,却仍在中国市场销售!

明明早被查出致癌,美国、加拿大已经下架,却仍在中国市场销售!

南风西洲
2024-05-22 22:01:20
省委书记首次以新身份主持重要会议

省委书记首次以新身份主持重要会议

政知新媒体
2024-05-23 22:23:01
消费者曝15克卫龙魔芋爽称重仅8.9克,卫龙客服:你不是普通的消费者吧!卫龙官方致歉

消费者曝15克卫龙魔芋爽称重仅8.9克,卫龙客服:你不是普通的消费者吧!卫龙官方致歉

和讯网
2024-05-23 15:02:11
5位炫富网红被封禁!圈内人揭秘他们真实身份,面具终于被撕开了

5位炫富网红被封禁!圈内人揭秘他们真实身份,面具终于被撕开了

古希腊掌管月桂的神
2024-05-23 10:28:10
赖清德捅了大娄子,岛内舆论:我们从未如此惶恐丨湾区望海峡

赖清德捅了大娄子,岛内舆论:我们从未如此惶恐丨湾区望海峡

直新闻
2024-05-22 22:18:35
马斯克被曝与谷歌创始人前妻嗑药?女方或成美国首位华裔副总统参选人

马斯克被曝与谷歌创始人前妻嗑药?女方或成美国首位华裔副总统参选人

新民周刊
2024-05-23 19:55:44
京东应届生内网说了一句“什么时候被pdd收购”,结果惨遭辞退

京东应届生内网说了一句“什么时候被pdd收购”,结果惨遭辞退

映射生活的身影
2024-05-23 23:20:00
闹大了!官方失业率公布!中国香港失业率也公布了

闹大了!官方失业率公布!中国香港失业率也公布了

小蜜情感说
2024-05-23 20:18:57
李再勇被控25年敛财超4.32亿,曾致六盘水3年新增1500亿债务

李再勇被控25年敛财超4.32亿,曾致六盘水3年新增1500亿债务

界面新闻
2024-05-23 18:07:59
2024-05-24 07:22:44
问芯
问芯
访遍天下芯事,聆听大时代人物芯声
48文章数 19关注度
往期回顾 全部

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

头条要闻

西班牙一餐厅屋顶倒塌 已致4死27伤

头条要闻

西班牙一餐厅屋顶倒塌 已致4死27伤

体育要闻

欧文,三十二而立

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

九鼎金租减值罗生门:郑州银行藏雷?

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

时尚
游戏
教育
本地
艺术

抗老靠基因?快50岁的舒淇连头发丝都在发光

Xbox提醒不要错过6月发布会:有《使命召唤21》

教育要闻

2024年高考招生,为何这么多专项招生计划?

本地新闻

强制措施展铁腕 “交叉执行”勇亮剑

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

无障碍浏览 进入关怀版