网易首页 > 网易号 > 正文 申请入驻

GPT-4o发力端侧应用,OpenAI更在乎情绪价值

0
分享至

5月13日,OpenAI春季发布会上,CTO Mira Murati代表公司向世界发布了ChatGPT旗舰版本GPT-4o。整场发布会上OpenAI运用了大量的篇幅,去介绍GPT-4o在移动端段与人类交互的先进程度,通过现场与GPT-4o交流、歌唱、实时解题等形式,强调了新模型多模态场景下的应用。

官方表示,在GPT-4o推出之前,用户使用语音模式与ChatGPT进行对话时,延迟时间分别为GPT-3.5的2.8秒和GPT-4的5.4秒,GPT-4o将这一延迟被大幅缩短为320毫秒。

这是因为传统语音模式通过三模型实现:音频转文本,GPT-3.5/GPT-4处理文本,再文本转音频。但GPT-4会丢失信息,因其无法直接处理语调、多说话者、背景噪音,且不能输出笑声、歌唱或情感。而GPT-4o通过端到端训练了一个全新的模型,能够同时处理文本、视觉和音频输入输出。这意味着所有的输入和输出都由同一个神经网络处理。

多模态升级,GPT要做人类知音?

GPT-4o在性能和效率方面进行了显著优化。得益于改进的模型架构和训练方法,GPT-4o在处理复杂任务时展现出更高的准确性和更快的响应速度。OpenAI表示,GPT-4o的推出将为用户带来前所未有的体验,显著提升自然语言处理、对话系统、数据分析和编程辅助等领域的应用效果。

根据官网信息,GPT-4o在文本、推理和编码智能方面达到了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉功能上也达到了新高水位线。

  • 文本评价:


在文本处理方面,GPT-4o在0-shot CoT(Chain of Thought) MMLU(常识问题)等测试中,取得了88.7%的高分,刷新了纪录。这种表现表明GPT-4o在无提示情况下依然能够进行复杂的推理和回答问题。此外,在传统的5-shot no-CoT MMLU测试中,GPT-4o也创下了87.2%的新高分。这些评估结果均通过新的评估库进行,确保了测试的可靠性和权威性。这些改进不仅提升了模型的推理能力,还增加了其在广泛任务中的适用性。

  • 音频ASR性能:


在音频处理方面,相比Whisper-v3,GPT-4o在自动语音识别(ASR)性能上实现了大幅提升,特别是在资源匮乏的语言中,其表现尤为突出。这意味着GPT-4o不仅能够处理主流语言,还能在更多语言环境下提供高质量的语音识别服务。

  • 音频翻译性能:


同时,在语音翻译方面,GPT-4o也树立了新的行业标准,在MLS基准测试中表现优于Whisper-v3,展示了其在跨语言沟通和翻译方面的卓越能力。

  • M3Exam零样本结果:


在多语言和视觉评估方面,GPT-4o在M3Exam基准测试中,在所有语言的测试中均表现优异。这表明GPT-4o不仅在单一语言环境下表现出色,还能够处理多语言环境下的复杂任务,充分展示了其强大的跨语言理解和处理能力。

  • 视频理解评估:


在视觉理解方面,GPT-4o在多个视觉感知基准上实现了最先进的性能。这些基准测试包括0-shot的MMMU、MathVista和ChartQA等,这意味着GPT-4o在无样本学习的情况下依然能够保持高水平的视觉理解和推理能力。这种能力使GPT-4o在处理图像、图表和复杂视觉信息时表现出色,进一步拓展了其在实际应用中的潜力。

GPT-4o在多个技术领域实现了显著的性能提升。多模态能力让GPT-4o在更多的应用场景中具有更高的实用性。此外,OpenAI提供了便捷的API接口,使得开发者可以轻松将GPT-4o集成到自己的应用中。此外,GPT-4o支持多种平台和编程语言,进一步提升了其使用的灵活性和便利性。

发力端侧应用,OpenAI更在乎情绪价值

纵观整场发布会,OpenAI的表现并想要非突出技术带来行业变革,而是让人工智能技术除了在商业领域为企业带来的提质增效,也更能够服务好人们日常的生活。

或许这也是Sam Altman选择更有亲和力的女性CTO Mira Murati来主持本次发布会的原因之一。


除了实时语音对话功能,研发负责人Barret还带来了GPT-4o在实时处理数学问题的高光表现。Barret手写了一个方程,并通过摄像头将其拍给GPT-4o,并让其进行在线指导。在语音助手的一步步指引下,Barret也是非常轻松的解决了该问题。

此外,OpenAI还展示了GPT-4o在代码、实时翻译等多种问题,尽管还是在有些测试是出现了错误,但整个发布会都在一个非常轻松的环境下进行。不仅让企业或研究团队有了新的研究方向和参考,也让更多C端用户感受到AI赋予的全新产品体验。


在PC端,OpenAI 推出了一款新的 macOS 应用,旨在简化工作流程。该应用适用于免费和付费用户,可无缝集成到用户在计算机上的操作中。通过简单的键盘快捷键,用户可以立即向 ChatGPT 提问,并在应用程序中截取屏幕截图进行讨论。

对于 Plus 用户来说,这款 macOS 应用将提供更多的功能和服务。而未来几周内,OpenAI 还计划将该应用推广到更广泛的用户群体,并计划在今年晚些时候推出适用于 Windows 平台的版本,以满足不同用户的需求。

大模型之家认为,在人工智能领域的商业化进程中,C端市场占据了至关重要的地位。OpenAI作为一家领先的AI公司,对C端市场的用户体验给予了高度的重视,这种重视不仅是为了满足用户需求,更是为其在C端市场的进一步商业化探索铺平了道路。

在C端市场,用户需求多样化且变化迅速,因此也更佳需要智能、人性化的用户体验,不仅要优化模型算法,也要提升交互界面的友好性和易用性,确保用户在使用其产品时能够享受到流畅、自然的交互体验。

值得注意的是,OpenAI在2024年谷歌I/O大会前一天选择“截胡”,不仅体现了OpenAI对于C端多模态大模型市场的重视,也透露出OpenAI在大模型商业竞争格局中的积极态度和战略眼光。

这一行动无疑为OpenAI赢得了更多的行业声量。在科技行业中,声量往往与影响力、市场份额和商业化潜力紧密相连。OpenAI通过这一策略,成功吸引了大量用户和媒体的关注,进一步巩固了其在AI技术领域的领先地位。

更重要的是,OpenAI的这一行动也直接指向了C端多模态大模型的入口。随着技术的不断进步和应用场景的不断扩展,多模态大模型已经成为AI领域的重要发展方向。它不仅能够处理文本、图像、音频等多种信息形式,还能够实现更加智能、自然的人机交互,为用户带来更加便捷、丰富的体验。因此,谁能够抢占多模态大模型的入口,谁就有可能在未来的市场竞争中占据先机。

从大模型商业竞争格局来看,GPT-4o的免费开放无疑加剧了行业内的竞争,也展示出了其对于商业扩张的“野心”。显然,谷歌、Meta等科技巨头不会坐以待毙,在这场“全面升级”的大模型商战中,谷歌如何还击?相信很快就会揭晓。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南省十四届人大常委会第九次会议举行

河南省十四届人大常委会第九次会议举行

影视解说阿相
2024-05-29 09:26:32
欧文谈自己和东契奇投篮手感不佳:对手可不会主动给你好机会

欧文谈自己和东契奇投篮手感不佳:对手可不会主动给你好机会

直播吧
2024-05-29 13:45:11
央视一幕“泄露天机”,轰-20的最终答案,可能远超外界的预料

央视一幕“泄露天机”,轰-20的最终答案,可能远超外界的预料

说天说地说实事
2024-05-28 20:39:56
IPhone“备忘录”是生活工作必备神器,让它吃灰是你最大的损失!

IPhone“备忘录”是生活工作必备神器,让它吃灰是你最大的损失!

天边的孤雁
2024-05-16 15:20:03
糖尿病,是有灵性的

糖尿病,是有灵性的

今日养生之道
2024-05-28 07:15:14
自逼为王,他逼为臣,不逼为奴

自逼为王,他逼为臣,不逼为奴

撇捺人生
2024-05-29 05:23:29
鲁尼:C罗去沙特破100个纪录都没用!梅西是历史最佳,原因仅1个

鲁尼:C罗去沙特破100个纪录都没用!梅西是历史最佳,原因仅1个

贝塔说体育
2024-05-29 11:18:01
张若昀4部剧霸榜腾讯视频前四,分别为《庆余年》系列和《雪中悍刀行》,腾讯官博:还得是鹅家的张若昀!

张若昀4部剧霸榜腾讯视频前四,分别为《庆余年》系列和《雪中悍刀行》,腾讯官博:还得是鹅家的张若昀!

鲁中晨报
2024-05-28 09:30:06
安徽一居民楼坍塌背后:老旧的小区和脆弱的结构,住户称“连物业都没有”

安徽一居民楼坍塌背后:老旧的小区和脆弱的结构,住户称“连物业都没有”

时代周报
2024-05-28 20:32:29
粪坑藏百万现金,选妃146位,母女通吃,酒桌上比较母女“功夫”

粪坑藏百万现金,选妃146位,母女通吃,酒桌上比较母女“功夫”

古今档案
2023-09-18 14:52:10
talkSPORT:利雅得胜利希望再续约C罗一年,C罗想参加2026世界杯

talkSPORT:利雅得胜利希望再续约C罗一年,C罗想参加2026世界杯

直播吧
2024-05-28 22:50:12
贫穷限制了我的想象,看到网友的公积金,我有点自卑了。

贫穷限制了我的想象,看到网友的公积金,我有点自卑了。

知秋侃史
2024-05-26 02:39:15
生物医学专家刘秀云已经出任天津大学药物科学与技术学院院长

生物医学专家刘秀云已经出任天津大学药物科学与技术学院院长

澎湃新闻
2024-05-29 10:20:29
5月29日 今晚【油价调整】,油价大逆转,下次油价或“重新上涨”

5月29日 今晚【油价调整】,油价大逆转,下次油价或“重新上涨”

油价早知道
2024-05-29 09:10:12
新加坡赛爆大冷!国羽10胜4负,29日赛程石宇奇、陈雨菲出战

新加坡赛爆大冷!国羽10胜4负,29日赛程石宇奇、陈雨菲出战

小马哥谈体育
2024-05-29 14:23:02
本赛季广东队的10大典故和经典语录,看完乐的肚子疼

本赛季广东队的10大典故和经典语录,看完乐的肚子疼

刺头体育
2024-05-29 13:25:28
弃妇逆袭!梁洛施挑战李泽楷,再创豪门传奇!

弃妇逆袭!梁洛施挑战李泽楷,再创豪门传奇!

客馆游国
2024-05-29 12:38:57
马夏尔自宣离队!最理想下家出炉:免签意甲豪门,冲击欧冠冠军

马夏尔自宣离队!最理想下家出炉:免签意甲豪门,冲击欧冠冠军

球场没跑道
2024-05-28 13:35:33
政治局集体学习首提构建就业友好型发展方式,专家这样解读

政治局集体学习首提构建就业友好型发展方式,专家这样解读

第一财经资讯
2024-05-28 21:34:08
河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

河北新娘抛下丈夫喝药自尽,12年后丈夫不顾一切给妻子开棺

青丝人生
2024-05-20 17:32:41
2024-05-29 15:18:44
钛媒体APP
钛媒体APP
独立财经科技媒体
101972文章数 858505关注度
往期回顾 全部

科技要闻

王传福再放狠话,燃油车要成“非主流”

头条要闻

白天辉4年受贿11亿元获死刑 曾在反腐片里揭露赖小民

头条要闻

白天辉4年受贿11亿元获死刑 曾在反腐片里揭露赖小民

体育要闻

阿根廷一代神锋,击碎了沙特的金元足球梦

娱乐要闻

张若昀怎么剧外比剧内更惨兮兮…

财经要闻

东方通收购藏雷 花6亿买来"业绩变脸"

汽车要闻

新哈弗H6苦练内功 向燃油车绝缘智能SAY NO

态度原创

房产
游戏
健康
艺术
军事航空

房产要闻

有点猛!最新房价:海南每㎡跌了2000多!

初来乍到的《世界启元》 为何能打破SLG游戏“非肝即氪”的铁律?

晚餐不吃or吃七分饱,哪种更减肥?

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

军事要闻

美国一架F-35坠毁 飞行员弹射逃生被送医

无障碍浏览 进入关怀版