网易首页 > 网易号 > 正文 申请入驻

Hello GPT-4o

0
分享至

作者 | 张潇雪
邮箱 | JessicaZhang@pingwest.com

今天,OpenAI正式推出最新旗舰模型GPT-4o,能够跨音频、视觉和文本进行实时推理。

GPT-4o("o" 即 "omni 全能")标志着实现更自然人机交互的zhong'da进步。它能够接收文本、音频和图像的任意组合作为输入,并输出同样多样化的组合。在最短232毫秒内响应音频输入,平均响应时间320毫秒,与人类在对话中的反应时间类似。在处理英语和编程方面与GPT-4 Turbo表现相当,非英语文本处理上则有显著提升。此外,GPT-4o在API中的运行速度更快,成本也降低了50%。在视觉和音频理解能力上,GPT-4o明显优于现有模型。

在GPT-4o之前,人们可以使用语音模式与ChatGPT交谈,平均延迟时间为2.8秒(GPT-3.5)和5.4秒(GPT-4)。为此语音模式集成了三个独立模型:一个简单模型将音频转录为文本,GPT-3.5或GPT-4接收文本并输出文本,第三个简单模型再将文本转换回音频。这一过程意味着GPT-4可能丢失大量信息——它无法直接理解语调、多个说话者的声音或背景噪音,也无法输出笑声、歌唱或表达情感。

现在,OpenAI端到端训练的新模型GPT-4o覆盖了文本、视觉和音频,这意味着所有输入和输出都由同一个神经网络处理。由于GPT-4o是第一个结合所有这些模态的模型,所以团队对模型能力和局限性仍在探索中。

1

模型评估

根据传统基准测试,GPT-4o在文本、推理和编程智能方面达到了GPT-4 Turbo级别的表现,同时在多语言、音频和视觉能力方面设立了新的高标准。

改进的推理能力 - GPT-4o在5次尝试的MMLU(多项选择通用知识问题测试)中创下了87.2%的新高分。

音频ASR性能 - GPT-4o在所有语言上显著提升了语音识别性能,相较于Whisper-v3尤其在资源较少的语言上有显著改进。

音频翻译性能 - GPT-4o在语音翻译方面设立了新的行业标准,并在MLS基准测试中表现优于Whisper-v3。

M3Exam评测 - M3Exam基准测试同时涵盖多语言和视觉评估,包括来自其他国家标准化测试的多项选择题,有时会包含图表和示意图。在所有语言上,GPT-4o在这一基准测试上比GPT-4表现更强。

视觉理解评估 - GPT-4o在视觉感知基准测试上达到了行业领先的表现。

1

语言分词

20种语言被选为新分词器在不同语言家族中压缩改进的代表。(以下含中文压缩表现)

1

模型安全性和局限性

GPT-4o在各种模态中通过设计内置了安全性,采用了如过滤训练数据和通过后训练改善模型行为的技术。OpenAI还创建了新的安全系统,为语音输出提供保护措施。

OpenAI根据“准备框架”和自愿承诺对GPT-4o进行了评估。对网络安全、化学生物辐射核(CBRN)、说服力和模型自主性的评估显示,GPT-4o在这些类别中的风险等级没有超过中等。这一评估包括在模型训练过程中进行一系列自动化和人工评估。同时团队测试了模型安全措施前后的版本,使用自定义的微调和提示来更好地诱导模型的能力。

GPT-4o还经历了由70多名外部专家在社会心理学、偏见与公正以及错误信息等领域进行的广泛外部红队测试,以识别由新加入的模态引入或放大的风险。并利用这些学习成果来建立安全干预措施,以提高与GPT-4o互动的安全性。

团队也认识到GPT-4o的音频模态可能会呈现出多种新的风险。今天,OpenAI公开发布文本和图像输入及文本输出。在接下来的几周和几个月内,将致力于技术基础设施、通过后训练提高可用性和必要的安全性,以发布其他模态。例如,在发布时,音频输出将限于一组预设的声音,并将遵守现有安全政策。OpenAI将在即将发布的系统卡中分享更多关于GPT-4o各种模态的详细信息。

通过对模型的测试和迭代,我们观察到存在于模型所有模态中的几个局限性。

OpenAI欢迎用户反馈,帮助识别GPT-4 Turbo仍然优于GPT-4o的任务,以便继续改进模型。

1

模型可用性

GPT-4o是OpenAI在深度学习领域推动实用性方向界限的最新步骤。在过去的两年中,团队在整个技术栈的每一层都进行了大量的效率改进工作。作为这项研究的首个成果,能够更广泛地提供GPT-4级别的模型。GPT-4o的能力将逐步推出(从今天开始提供扩展的红队访问)。

GPT-4o的文本和图像功能从今天开始在ChatGPT中推出。GPT-4o将提供给所有免费用户,并为Plus用户提供高达5倍的消息限制。未来几周内在ChatGPT Plus中将以alpha版本推出新版语音模式。开发者现在也可以在API中访问GPT-4o作为文本和视觉模型。

GPT-4o比GPT-4 Turbo快2倍,价格减半,速率限制提高了5倍。OpenAI计划在未来几周内向API中的一小群受信任的合作伙伴推出GPT-4o的新音频和视频功能。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
林依晨出发去录制《花少8》,纯素颜背个双肩包就现身了,当天的衣品实在有点一言难尽

林依晨出发去录制《花少8》,纯素颜背个双肩包就现身了,当天的衣品实在有点一言难尽

陈意小可爱
2026-07-05 16:45:38
难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

难以置信,北京协和证实:40岁后男性最优运动,并非跑步撸铁

华庭讲美食
2026-06-21 15:26:10
特斯拉新品突然发布,但这价格太夸张了吧!

特斯拉新品突然发布,但这价格太夸张了吧!

XCiOS俱乐部
2026-07-04 14:08:55
全世界都没想到,伊朗没打赢翻身仗,却替中国废掉美国最狠王牌

全世界都没想到,伊朗没打赢翻身仗,却替中国废掉美国最狠王牌

陈莓特色体育解说
2026-06-30 13:30:31
1937 年残害两千余名红军战俘,十二年后被幸存老兵当场认出

1937 年残害两千余名红军战俘,十二年后被幸存老兵当场认出

磊子讲史
2026-07-02 11:15:19
哈佛大学惊人发现:寿命长的人,从来不是靠多运动,而是靠这3点

哈佛大学惊人发现:寿命长的人,从来不是靠多运动,而是靠这3点

千秋文化
2026-06-21 19:47:58
北京博主评韩红基金会不救助个人:敢救助立马就会崩掉

北京博主评韩红基金会不救助个人:敢救助立马就会崩掉

映射生活的身影
2026-07-03 19:31:16
台海一战不可避免?美军公开作战计划,5国预参战,就在这个时间

台海一战不可避免?美军公开作战计划,5国预参战,就在这个时间

论事的老枢
2026-07-01 05:09:11
儿子给哈佛捐20多亿,母亲给麻省捐11亿,家族在中国年收租百亿?

儿子给哈佛捐20多亿,母亲给麻省捐11亿,家族在中国年收租百亿?

生活新鲜市
2026-06-18 20:08:24
腾讯押注,深圳超级IPO要来了

腾讯押注,深圳超级IPO要来了

新浪财经
2026-07-05 16:08:42
嫁法国老头真相大白后,41岁李宇春近况曝光,一点都不感到意外

嫁法国老头真相大白后,41岁李宇春近况曝光,一点都不感到意外

李侽在北漂
2026-06-28 18:23:13
我刚调任县长,中午在食堂吃饭,一个老同志拍桌子怒吼:瞎了眼吗

我刚调任县长,中午在食堂吃饭,一个老同志拍桌子怒吼:瞎了眼吗

千秋文化
2026-07-01 20:34:45
复旦毕业、投行出身,她靠一瓶卸妆油年入10亿

复旦毕业、投行出身,她靠一瓶卸妆油年入10亿

中国企业家杂志
2026-07-04 18:30:44
后周世宗——柴荣:在位仅五年半,为何是历史上最意难平的帝王?

后周世宗——柴荣:在位仅五年半,为何是历史上最意难平的帝王?

河山历史
2026-07-05 12:08:34
真解气?姆巴佩拒握手遭球砸,霸气回应:我们不是穿燕尾服比赛的

真解气?姆巴佩拒握手遭球砸,霸气回应:我们不是穿燕尾服比赛的

林轻吟
2026-07-05 16:37:38
“有你这样的妈,真丢人”,毕业典礼母亲出洋相,儿子一脸无奈

“有你这样的妈,真丢人”,毕业典礼母亲出洋相,儿子一脸无奈

熙熙说教
2026-07-01 19:29:52
麒麟9030官宣性能:能效进步明显,游戏性能直接超过高通4nm芯片

麒麟9030官宣性能:能效进步明显,游戏性能直接超过高通4nm芯片

逍遥漠
2026-07-04 15:05:14
突然昏迷、下病危通知?91岁游本昌紧急入院,儿子却拒绝过度治疗

突然昏迷、下病危通知?91岁游本昌紧急入院,儿子却拒绝过度治疗

秋姐居
2026-07-02 11:37:35
韩红被质疑为国拒绝哈佛真相如何,十六年未晒录取通知书,网友:别把情绪当履历

韩红被质疑为国拒绝哈佛真相如何,十六年未晒录取通知书,网友:别把情绪当履历

情感大头说说
2026-07-05 10:18:00
人到中年 开始步入颜值巅峰。。。

人到中年 开始步入颜值巅峰。。。

倪一宁cookies
2026-06-30 02:26:15
2026-07-05 21:31:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
3217文章数 10510关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

头条要闻

世界杯带火岛国佛得角 当地中国人:最近国人多了起来

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

房产
健康
旅游
亲子
军事航空

房产要闻

总裁空缺17个月、现金缺口超1000亿:金融局“局外人”入局万科

听说少吃点能抗衰老?专家讲解!

旅游要闻

不必远赴江南,滇中这片湖泊自带星河意境,看完人人都想去打卡!

亲子要闻

奉劝大家:超市里这5种食物少给孩子吃,看似有营养,实则没好处

军事要闻

普京与特朗普通话85分钟 细节公布

无障碍浏览 进入关怀版