网易首页 > 网易号 > 正文 申请入驻

OpenAI新模型GPT-4o“炸裂登场”,响应速度堪比真人,关键还免费!网友评论褒贬不一,有人称苹果Siri现在应是“满头大汗”

0
分享至

每经记者:蔡鼎 每经编辑:兰素英

美西时间5月13日(周一),OpenAI首席技术官Mira Murati在备受期待的直播演示中宣布,推出名为GPT-4o的新旗舰AI模型,这是其已经问世一年多的GPT-4模型的更新版本。同时,OpenAI还推出了台式机版本的ChatGPT以及新的用户界面(UI)

GPT-4o模型基于来自互联网的大量数据进行训练,更擅长处理文本和音频,并且支持50种语言。更值得一提的是,GPT-4o最快可以在232毫秒的时间内响应音频输入,几乎达到了人类的响应水平。

Murati称新模型面向所有人,而不仅仅是付费用户,为“我们的免费用户带来GPT-4级别的智能水平”。不过,GPT-4o的应用程序接口中尚未为所有客户提供语音功能。鉴于滥用风险,OpenAI计划在未来几周内首先向“一小部分可信赖的合作伙伴”推出对GPT-4o新音频功能的支持。

而ChatGPT-4o发布后,网友对其的评价也是褒贬不一。英伟达科学家Jim Fan评论称,“从技术角度来看,总体来说是一个数据和系统优化问题。”有网友也称,感觉到目前为止,OpenAI没有那么开创性,不过也有网友认为,OpenAI进一步拉开了和苹果的差距,现在该轮到苹果的Siri“满头大汗”了。


GPT-4o有多“炸裂”?核心能力有三

GPT-4o中的“o”代表“omni”,意为“全能”。OpenAI官网介绍称,GPT-4o向更自然的人机交互迈进了一步,因为它接受文本、音频和图像的任意组合作为输入内容,并生成文本、音频和图像的任意组合输出内容。

那GPT-4o到底有多强,有哪些核心能力呢?


图片来源:OpenAI官网截图

能力一:“实时”互动,表达富有情感,视觉功能更强

OpenAI表示,GPT-4o显著提升了AI聊天机器人ChatGPT的使用体验。虽然ChatGPT长期支持语音模式,可将ChatGPT的文本转为语音,但GPT-4o在此基础上进行了优化,使用户能够像与助手互动一样自然地使用ChatGPT。

例如,用户现在可以在ChatGPT回答问题时中断它。而且,新模型能够提供“实时”响应,甚至能够捕捉到用户声音中的情感,并以不同的情感风格生成语音,如同真人一般。此外,GPT-4o还增强了ChatGPT的视觉功能。通过照片或屏幕截图,ChatGPT现在可以迅速回答相关问题,从“这段代码是做什么用的”到“这个人穿的是什么品牌的衬衫”。

美国科技媒体Quartz报道称,OpenAI新发布的ChatGPT-4o的技术让人印象深刻。OpenAI的演示表明,机器人现在可以与人类进行实时对话,与真人水平几乎没有区别。如果最终版本像OpenAI官方的演示一样,那么OpenAI似乎已经从某种程度上验证AI将在多大程度上改变我们的世界。

能力二:多语言表现出色,响应速度几乎与真人无异

GPT-4o的多语言功能得到了增强,在50种不同的语言中表现更佳。在OpenAI的API中,GPT-4o的处理速度是GPT-4(特别是 GPT-4 Turbo)的两倍,价格则是GPT-4 Turbo的一半,同时拥有更高的速率限制。

OpenAI官网介绍称,GPT-4o最快可以在232毫秒的时间内响应音频输入,平均响应时间为320毫秒,这与人类在对话中的响应时间相似。它在英语文本和代码方面的性能与GPT-4 Turbo的性能一致,并且在非英语文本方面的性能有了显著提高。

用户只需发出简单的“嘿,ChatGPT”语音提示,即可获得代理的口语回应。然后,用户可以用口语提交查询,并在必要时附上文字、音频或视觉效果——后者可包括照片、手机摄像头的实时画面或代理能“看到”的任何其他内容。

能力三:在推理及音频翻译方面树立新标杆

据OpenAI研究人员William Fedus透露,GPT-4o实际上就是上周在LMSYS模型竞技场上引起整个AI圈疯狂试用的GPT-2模型的另一版本,并附上了GPT-4o的基准测试评分对比图,相比GPT-4 Turbo提升了超过100个单位

推理能力方面,GPT-4o在MMLU、GPQA、MATH、HumanEval等测试基准上均超越GPT-4 Turbo、Claude 3 Opusn、Gemini Pro 1.5等前沿模型,取得最高分。


图片来源:OpenAI

音频ASR(智能语音识别)性能方面,GPT-4o相比Whisper-v3,在所有语言的语音识别性能上均大幅提高,尤其是资源较少的语言。


图片来源:OpenAI

音频翻译方面,GPT-4o也树立了新的标杆,在MLS基准测试中优于Whisper-v3以及Meta、谷歌的语音模型。


图片来源:OpenAI


评价褒贬不一,有网友认为压力给到Siri了

虽然并未在OpenAI周一的重磅直播演示中现身,但OpenAI的CEO阿尔特曼对这次演示进行了重要的总结。阿尔特曼称,OpenAI在ChatGPT中免费提供了世界上最好的模型,新的语音和视频模式是他用过的最好的计算交互界面,感觉就像电影里的人工智能一样,达到与人类相似的响应速度和表达能力。

目前,GPT-4o的文本和图像功能开始在ChatGPT中免费推出,Plus用户可以享受到5倍的调用额度。在接下来的几周内,OpenAI将在ChatGPT Plus中推出Voice Mode新版本,该版本带有GPT-4o。

而在社交媒体平台X(原推特)上,网友对ChatGPT-4o的评价却褒贬不一。

英伟达科学家Jim Fan评论称,“从技术角度来看,OpenAI已经找到了一种方法,可以将音频直接映射到音频作为一级模态,并将视频实时传输到transformer。这些需要对token化和架构进行一些新的研究,但总体来说是一个数据和系统优化问题(大多数事情都是如此)。”


图片来源:X

对于OpenAI推出的新模型和UI更新,有网友称,感觉到目前为止OpenAI没有那么开创性。


图片来源:X

也有网友指出,GPT-4o不仅可以将语音转换为文本,还可以理解和标记音频的其他特征,例如呼吸和情感,但不确定这在模型响应中是如何表达的。


图片来源:X

但大部分网友还是给出了非常积极的看法。

对于阿尔特曼在X上留下的一句“her”,这似乎是暗示ChatGPT实现了经典电影《她》(Her)中像人类一样“有血有肉”的AI,有网友对此评论:“你终于做到了。”并配了一张将电影《她》剧照中的AI“换头”成OpenAI的梗图。


图片来源:X


图片来源:X

另有网友评价称,“这太疯狂了。OpenAI刚刚推出了ChatGPT- 4o,它将彻底改变人工智能助手的竞赛,”该网友还列举了10个ChatGPT- 4o“疯狂”的案例,例如实时视觉辅助等等。


图片来源:X

还有网友以可汗学院的可汗和他儿子一起使用 GPT-4o 辅导孩子在可汗学院上做数学题的示例点评称,“学生将他们的iPad屏幕与新的ChatGPT-4+GPT-4o共享,AI与他们交谈并帮助他们‘实时’学习。想象一下,如果世界上每一个学生都能这样学习,未来是如此光明。


图片来源:X

也有网友觉得OpenAI进一步拉开了和苹果的差距,还发了一张人满头大汗的动图,称现在苹果的语音助手Siri现在应该就是这个样子。


图片来源:X

对于这点,Quartz报道称,GPT-4o的情感属性使AI聊天机器人比苹果的Siri更加个性化。Siri给人的感觉就像在和一个机器人对话,但OpenAI的演示清楚地表明,GPT-4o具有“人工情感智能”,能够识别用户的情感并与你的情绪相匹配。这让GPT-4o感觉就像一个真正的伴侣,为用户的智能手机操作系统增添了一丝人性。

实际上,为了应对技术威胁,苹果也在与OpenAI进行合作洽谈。Wedbush分析师Dan Ives在一份报告中预计,苹果将在6月10日的WWDC大会上官宣和OpenAI的合作伙伴关系,并推出基于苹果LLM的AI聊天机器人。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北约秘书长闯祸了!俄话音刚落,西方彻底乱了,全面战争或将打响

北约秘书长闯祸了!俄话音刚落,西方彻底乱了,全面战争或将打响

谈与讨
2024-05-29 01:02:05
3比2险被爆大冷!法网男单8号种子低迷,网友:张之臻迎好机会

3比2险被爆大冷!法网男单8号种子低迷,网友:张之臻迎好机会

体坛知识分子
2024-05-28 07:17:17
已经准备统台?美国搅动台海之际,中国在福建成立了一个神秘机构

已经准备统台?美国搅动台海之际,中国在福建成立了一个神秘机构

影孖看世界
2024-05-28 17:23:31
330天研发疫苗盈利7000亿!杨晓明被查:打3针北京生物者说感恩

330天研发疫苗盈利7000亿!杨晓明被查:打3针北京生物者说感恩

大风文字
2024-04-28 08:15:57
网友称31克黄金回收变15克 官方通报:已立案 律师:老板的行为构成欺诈

网友称31克黄金回收变15克 官方通报:已立案 律师:老板的行为构成欺诈

科学发掘
2024-05-27 16:18:13
哥,你喜欢我吗?

哥,你喜欢我吗?

户外阿崭
2024-05-28 15:02:34
封神之夜!阿隆索缔造120年神迹:1年夺2冠,冠军数追平119年总和

封神之夜!阿隆索缔造120年神迹:1年夺2冠,冠军数追平119年总和

侃球熊弟
2024-05-26 04:07:20
2024已上映好莱坞大片名单来袭

2024已上映好莱坞大片名单来袭

娱乐八卦木木子
2024-05-28 01:12:17
101岁杨振宁月工资惊人!凭什么?回国养老,却把青春奉献给别国

101岁杨振宁月工资惊人!凭什么?回国养老,却把青春奉献给别国

华人星光
2024-05-26 17:24:36
突发!京东某核心部门被整体裁撤!

突发!京东某核心部门被整体裁撤!

i黑马
2024-05-28 17:31:32
大利好全数捞不到,广州楼市趋势难改

大利好全数捞不到,广州楼市趋势难改

邓浩志教买房
2024-05-27 18:21:55
朝导演翻白眼,缠胶带走红毯,章子怡没事吧?

朝导演翻白眼,缠胶带走红毯,章子怡没事吧?

gogoboi
2024-05-27 23:34:58
对话“割肝救妻”男子:瞒着妻子做配型,把我最好的一半肝给她

对话“割肝救妻”男子:瞒着妻子做配型,把我最好的一半肝给她

鲁中晨报
2024-05-28 14:48:46
辽篮休赛期首签曝光!2米13黑又硬大外援对抗周琦,全力冲击4连冠

辽篮休赛期首签曝光!2米13黑又硬大外援对抗周琦,全力冲击4连冠

体坛纪录片
2024-05-28 17:57:19
“毛孩”于震寰:47年前因一身黑毛轰动全国,如今他怎么样了?

“毛孩”于震寰:47年前因一身黑毛轰动全国,如今他怎么样了?

历史有些冷
2024-01-10 18:55:03
罗德里戈亲自转发!记者:罗德里戈想在皇马创造历史 不会离开!

罗德里戈亲自转发!记者:罗德里戈想在皇马创造历史 不会离开!

直播吧
2024-05-28 22:18:06
重磅!合肥出台学区新政,哪些人受影响?

重磅!合肥出台学区新政,哪些人受影响?

俺家住楼房
2024-05-28 15:44:50
笑不活了,中央美院造价两万的毕业设计冲上热搜,设计者出面道歉

笑不活了,中央美院造价两万的毕业设计冲上热搜,设计者出面道歉

鬼谷子思维
2024-05-25 16:45:18
不要高估三星堆!三星堆根本就不是夏都,与夏朝毫无关系

不要高估三星堆!三星堆根本就不是夏都,与夏朝毫无关系

作家李楠枫
2024-05-26 10:37:03
《庆余年2》大结局:这才是五竹把大狙送给范若若的真相

《庆余年2》大结局:这才是五竹把大狙送给范若若的真相

感影的世界
2024-05-28 19:17:22
2024-05-29 02:22:44
每日经济新闻
每日经济新闻
中国主流财经全媒体平台。
921658文章数 2697321关注度
往期回顾 全部

科技要闻

4月中国手机需求回升 iPhone出货量增长52%

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

头条要闻

安徽坍塌居民楼结构脆弱 专家称其"像积木搭在墙上"

体育要闻

克莱伯:我希望能够出战G4 我的状态将在热身后决定

娱乐要闻

昆凌晒三胎正面照,2岁妹妹超像周杰伦

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

三联屏/纯电续航318km 岚图FREE 318官图发布

态度原创

教育
家居
房产
公开课
军事航空

教育要闻

【中招咨询】一文看懂北京八中教育集团招生政策!

家居要闻

圆的世界 流动的曲线与自如的空间

房产要闻

有点猛!最新房价:海南每㎡跌了2000多!

公开课

近视只是视力差?小心并发症

军事要闻

以军装甲部队进入加沙地带南部城市拉法市中心

无障碍浏览 进入关怀版