网易首页 > 网易号 > 正文 申请入驻

电影中的人工智能来了!OpenAI发布全能大模型:文图音任意组合输出,可实现人类级别响应

0
分享至

OpenAI的新品终于官宣,是一个“全能助手”。

北京时间5月14日凌晨,OpenAI发布最新多模态大模型 GPT-4o(o代表omini,全能),支持文本、音频和图像的任意组合输入,并生成文本、音频和图像的任意组合输出。文本、推理和编码智能方面性能达到了GPT-4 Turbo水平,同时在多语言、音频和视觉能力方面也达到新高。据介绍,GPT-4o的速度比GPT-4 Turbo快2倍,速率限制提高5倍,最高可达每分钟1000万token,而价格则便宜了一半。

OpenAI首席技术官米拉·穆拉蒂(Muri Murati)在发布会上表示:“通过语音、文本和视觉进行推理非常重要,因为我们正在研究与机器交互的未来。”

官网显示,GPT-4o的文本和图像功能将在ChatGPT更新后提供给所有用户,Plus用户的消息数量使用上限是免费版的5倍(使用上限后会切换回GPT-3.5版本)。而新版语音模式将在未来几周向Plus用户推出,同时也将会在API(应用接口)中向小范围推出对GPT-4o的新音频和视频功能的支持。


穆拉蒂在OpenAI春季更新发布会上介绍GPT-4o

在发布会现场演示中,GPT-4o可以像人工智能助手一样,实现用户与ChatGPT的实时交互,不再是一问一答,也不需要其他按键操作。

比如,用户可以说“Hi,ChatGPT”并提出问题,也可以在ChatGPT回答时打断它,它还可以识别用户声音中展现的情感,甚至实时根据用户的需求来使用不同情感风格的声音。

据介绍,GPT-4o的音频输入平均反应时间为0.32秒,与人类对话中的反应时间相似。

OpenAI表示,在GPT-4o之前,使用语音模式与ChatGPT对话的平均延迟时间为2.8秒(GPT-3.5)和5.4秒(GPT-4)。此前的语音模式由三个独立模型组成:一个简单模型将音频转为文本,GPT-4接收文本并输出文本,第三个简单模型将文本转回音频。这个过程也让主要的智能源GPT-4丢失了很多信息,比如不能直接观察音调、多人讲话或背景噪音,也不能输出笑声、歌声或表达情感。而GPT-4o通过在文本、视觉和音频方面训练了一个端到端新模型,所有输入和输出都由同一个神经网络处理。

不过,OpenAI也坦言,由于GPT-4o是公司首个结合了所有前述模式的模型,因此在探索模型功能及其局限性方面仍处于起步阶段,GPT-4o也开始扩大红队(测试)的访问权限。

此外,GPT-4o还提高了ChatGPT的视觉能力。在现场演示中,通过手机实时拍摄的视频或电脑桌面屏幕上的截图,ChatGPT可以快速回答相关问题,帮助解决计算、编程等问题。

演示中还出现了一段小插曲。因为“幻觉”问题,ChatGPT在还没打开摄像头看到画面时就表示理解了,在演示者提示后,她说“哎呀,我太兴奋了”,随后实时指导完成了一道数学题。

同时,OpenAI还在X(推特)上实时搜集到网友的反馈,进行了ChatGPT的情绪分析演示。通过演示者的实时摄像头画面,对表情中的开心、兴奋等情绪做出了分析。

GPT-4o的英语和代码文本性能与GPT-4 Turbo相当,在非英语语言文本方面也有显著提高,能支持50种语言。发布会上,穆拉蒂演示了让全新ChatGPT充当只会意大利语与只会英语的两人的翻译,实现了跨语种交流的无缝衔接。


GPT-4o速度比GPT-4 Turbo快2倍,价格则便宜了一半

发布会上,ChatGPT还发布了电脑桌面版和新UI界面。根据官方公告,目前仅适用于macOS,Windows版将在今年晚些时候推出。

“我们知道这些模型越来越复杂,但我们希望交互体验变得更加自然、轻松,并且让你根本不关注用户界面,而是专注于与GPT(交互)。”穆拉蒂表示。

OpenAI CEO山姆·奥特曼(Sam Altman)也表示:“对我来说,与电脑交谈从来没有真正自然过,而现在却很自然……我真的看到了一个令人兴奋的未来,我们可以用电脑做比以往更多的事情。”

“AI达到人类级别的响应时间和表现力是一个很大的改变,给人的感觉就像电影中的人工智能,而它的真实性仍然让我感到有些惊讶。”他表示,“最初的ChatGPT展示了语言界面的雏形,而这款新模型给人的感觉却截然不同,它快速、智能、有趣、自然而且乐于助人。”

奥特曼还发文“her”,或许也表达了他对GPT-4o的评价以及对未来的畅想(在电影《Her》中,人工智能助手Samantha主动给男主人公打了电话,告知他一些事情)。


山姆·奥特曼的推文

奥特曼表示,OpenAI的一项重要使命就是免费(或以优惠价格)向人们提供功能强大的人工智能工具,“我感到非常自豪的是,我们在ChatGPT中免费提供了世界上最好的模型,并且没有广告或类似的东西”。

他表示:“我们是一家企业,会找到很多可以收费的东西,这将帮助我们为数十亿人提供免费、出色的人工智能服务(希望如此)。”

此前,据外媒报道,苹果公司已接近与OpenAI达成协议,今年将后者的部分技术引入iPhone,提供由ChatGPT支持的“聊天机器人”作为iOS 18中人工智能功能的一部分。

不过,苹果同时还与谷歌就授权Gemini聊天机器人进行了谈判。而谷歌将在OpenAI此次春季更新发布会之后一天举行I/O开发者大会,谷歌在大会的官方博文中曾提到“Gemini 时代”,预计将会发布Gemini大模型的最新动态。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友:某985院校研究生60人,31个没找到工作!不少公司还毁约…

网友:某985院校研究生60人,31个没找到工作!不少公司还毁约…

火山诗话
2024-05-23 11:43:58
王室又发布凯特新照片了,凯特身穿红色上衣,白色打底,有点累

王室又发布凯特新照片了,凯特身穿红色上衣,白色打底,有点累

亦纯杂谈
2024-05-23 18:03:22
突然官宣!女神终于要嫁人了!

突然官宣!女神终于要嫁人了!

圈里的甜橙子
2024-05-23 21:03:17
许家印的保护伞,终于被查了!

许家印的保护伞,终于被查了!

华人星光
2024-05-23 15:35:13
我们台湾人不怕军演!台媒大V在大陆炫耀被群嘲:到时候别哭

我们台湾人不怕军演!台媒大V在大陆炫耀被群嘲:到时候别哭

全球吃瓜局
2024-05-23 19:43:04
520当天结婚1.4万对,比去年1.6万激增13.4%?四川民政闹出个数学笑话

520当天结婚1.4万对,比去年1.6万激增13.4%?四川民政闹出个数学笑话

可达鸭面面观
2024-05-23 16:35:02
上交大应届生转正12天因言论不当被辞退,网友:不冤,为幼稚买单

上交大应届生转正12天因言论不当被辞退,网友:不冤,为幼稚买单

东东趣谈
2024-05-23 18:14:32
一位老师无奈表示:每个班都有西方伪史论者,发现西方历史有比中国好的,就认为是编的

一位老师无奈表示:每个班都有西方伪史论者,发现西方历史有比中国好的,就认为是编的

可达鸭面面观
2024-05-23 23:35:07
外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

庞明说财经
2024-05-22 22:15:23
仁至义尽!只要巴萨承诺教练组成员的薪资,哈维愿放弃大部分薪水

仁至义尽!只要巴萨承诺教练组成员的薪资,哈维愿放弃大部分薪水

直播吧
2024-05-23 16:14:14
美英德等十国发布声明,将中国排除在外,人民日报说得很对

美英德等十国发布声明,将中国排除在外,人民日报说得很对

智观科技
2024-05-22 11:39:34
建湖一男子送父亲异地治病被抢走手机车票!派出所长:领导命令!

建湖一男子送父亲异地治病被抢走手机车票!派出所长:领导命令!

兵叔评说
2024-05-23 08:21:06
使劲折腾:多地出现俄文路牌

使劲折腾:多地出现俄文路牌

据说说娱乐
2024-05-23 22:43:05
满脸褶子就别演校草了,一脸“社会气”的高中生,看着真让人难受

满脸褶子就别演校草了,一脸“社会气”的高中生,看着真让人难受

娱乐圈笔娱君
2024-05-23 14:13:22
纽约时报爆猛料:马斯克与谷歌创始人前妻一起吸毒并发生性关系

纽约时报爆猛料:马斯克与谷歌创始人前妻一起吸毒并发生性关系

手机中国
2024-05-23 10:02:11
刘和平:解放军“围台”展现主导权 赖清德会悔改吗?

刘和平:解放军“围台”展现主导权 赖清德会悔改吗?

直新闻
2024-05-23 17:42:30
赖清德就职演讲口出狂言,大陆围台军演,怕不怕?

赖清德就职演讲口出狂言,大陆围台军演,怕不怕?

雨秋闲话
2024-05-23 16:10:28
有高人预测,到2025年,我国或可能会出现以下“六大变化”?

有高人预测,到2025年,我国或可能会出现以下“六大变化”?

山丘楼评
2024-05-23 20:33:13
男生常见体型的9种标准,你属于哪一种?兄弟!

男生常见体型的9种标准,你属于哪一种?兄弟!

四象八卦
2024-05-23 16:47:31
一个县城的供热“争夺战”:投资过亿,30年特许经营权5年被收回,非法抢夺还是合法接管

一个县城的供热“争夺战”:投资过亿,30年特许经营权5年被收回,非法抢夺还是合法接管

红星新闻
2024-05-23 20:45:41
2024-05-24 06:18:44
澎湃新闻
澎湃新闻
专注时政与思想的新闻平台。
687833文章数 5031263关注度
往期回顾 全部

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

头条要闻

奥迪车主称每次启动车辆就会显示"续费弹窗" 客服回应

体育要闻

欧文,三十二而立

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

九鼎金租减值罗生门:郑州银行藏雷?

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

手机
房产
游戏
亲子
公开课

手机要闻

vivo S19系列再次被确认:三款版本,能打过OPPO Reno12系列吗?

房产要闻

信号!海南这个区域开始鼓励企业购买安居房!

官方确认:《使命召唤21》是T组、乌鸦合作开发

亲子要闻

这一瞬间,她又变成了小时候的模样

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版