网易首页 > 网易号 > 正文 申请入驻

GPT-5,重磅来袭!

0
分享至

在频频“跳票”和多次“剧透”之后,万众期待的GPT-5终于发布了。

北京时间8月8日凌晨1时,OpenAI举行了长达1个多小时的线上发布会,正式推出了GPT-5。与此前的模型更新直播时间短且主要由研发人员发布相比,GPT-5的发布明显规格更高,不仅发布时间长、细节多,而且OpenAI首席执行官山姆·奥特曼也现身发布会现场。

经证券时报记者梳理,发布会的主要亮点如下:

  • 集成模型:GPT-5是一个集成模型(integrated model),融合了大语言模型GPT系列和推理模型o系列,这意味着用户在使用时不再需要手动切换各类不同的模型。

  • 能力提升:据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康等领域,都表现出了顶尖性能,全部大幅度超越前代,成为目前最强大模型。

  • 幻觉降低:与GPT-4o相比,GPT-5的事实错误率降低了45%;深度思考模式下,事实错误率则比o3降低80%,变得更加准确和可靠。

“专家级别”的大模型,智能且融合水平高

在发布会上,奥特曼对 GPT-5 给出了极高评价,称其是“此前所有模型的巨大飞跃”。他还表示,如果说GPT-4是一个大学生,那么GPT-5就是“真正的专家”。

GPT-5最核心的亮点是,它并非单一的语言或者推理模型,而是整合了GPT系列(大语言模型)和o系列(推理模型),具备调度子模型的能力。奥特曼在其个人社交平台上连发十余条推文介绍GPT-5,其中首条就强调“GPT-5是一个集成模型,这意味着不再需要模型切换器,它将自行决定何时需要更深入地思考”。

据介绍,GPT-5首次使用了内嵌式三位一体集成架构,系统由三部分组成,分别是处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking 深度思考模型、以及实时决策的路由机制,还有一个是额度使用完后启动的mini版本。其中,实时决策的路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自主决定是否进入深度思考模式,自动匹配最适合的模型。

根据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康领域表现均大幅超越前代模型,展现了顶尖的性能。例如在数学领域,GPT-5在2025年AIME测试中无工具辅助达到94.6%,大幅超过了o3模型;在健康领域,GPT-5的表现大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。

值得注意的是,在大模型竞技场LMArena上,刚刚上线的GPT-5凭借着极强的性能在所有细分类目中都位列第一。

应用场景方面,据现场展示的多个案例,GPT-5编码能力突出,只需要几句话就可以创建一个名为 “Jumping Ball Runner” 的游戏。该游戏界面色彩丰富,游戏角色采用卡通风格设计,且具备最高分记录功能、重试按钮、趣味音效等多种特色功能。此外,GPT-5还可以用几分钟就开发一个学习法语的网络应用、一个复杂的财务分析模版等等。

作为长期被用户吐槽的重灾区,“AI幻觉”一直是所有大模型难以克服的痛点。GPT在减少AI幻觉方面,展现了行业领先的水平。据介绍,与GPT-4o相比,GPT-5的事实错误率降低了45%;在深度思考模式下,事实错误率更是比o3大幅下降80%,变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中,GPT-5的幻觉率比o3减少大约六倍,长篇内容生成的准确性显著提升。

GPT-5拥有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本,免费用户的GPT-5用量有限,超过限额后将自动转至GPT-5-mini,GPT-5-pro仅供Pro订阅用户使用。

定价方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向开发者提供API服务,三款模型的输入、输出价格分别为每百万token 1.25美元/10美元、每百万token 0.5美元/5美元、每百万token 0.15美元/1.5美元。与主要竞争对手Anthropic和谷歌相比,OpenAI的GPT-5模型对于开发人员来说成本相当甚至更低。

此前差点“难产”,被质疑进步不够惊艳

GPT-5一直是OpenAI最受外界关注和期待的产品。但在过去的一年多时间里,尽管频频有GPT-5即将发布的消息传出,但也屡屡“跳票”,始终未能如约而至。

在此期间,OpenAI发布了许多复杂的模型产品与功能更新。总体来看,OpenAI模型有GPT(大语言模型)和o(推理模型)两大核心系列,同时还通过Turbo、mini、high等后缀或内部代号来区分模型的版本与特性。据统计,OpenAI对外提供服务的模型数量已超过了40个,尺寸、上下文窗口、价格各异。大量的模型让用户面临“选择困难症“。

在今年6月的一场播客节目中,奥特曼也提到,产品发布节奏失控是复杂化的主因,他表示希望未来不会出现更复杂的命名方式,尽快走出当前o4-mini、o3、4o等略显混乱的命名局面。“我期待着GPT-5和GPT-6的到来,这样人们使用起来会更简单,不用再纠结于o4-mini-high或o3这样的版本。”奥特曼说。

之所以衍生出这么多模型产品并且再三推迟GPT-5的发布时间,原因是GPT-5的研发一直不顺利,没有达到期待。纵观OpenAI在推出GPT-4以后的大多数模型,都属于"渐进式优化",没有复刻像GPT-4那样巨大的性能飞跃。

值得注意的是,在GPT-5发布前夕,多个信源爆料称,GPT-5并未取得明显技术突破,依然没有像GPT-4那种级别的进步。此外,由于Meta前段时间疯狂“挖人”,一大批核心研究者被高薪挖走,导致内部组织结构陷入混乱,让GPT-5的研发进一步陷入困境。据知情人士爆料,直到今年6月,OpenAI开发的模型中没有一个能配得上GPT-5的名号,内部也无法确认哪个模型版本足以称之为GPT-5。

一名人工智能资深研究员告诉证券时报记者,虽然GPT-5 在编程、数学推理、智能体等方面表现有所进步,但仍然只是“渐进式优化”,而非颠覆性、跨越式的提升。GPT-5表现不够惊艳的核心原因在于,大模型训练遵循Scaling Laws(缩放定律),即模型性能随着参数规模、训练数据量、计算资源的增加而提升。如今这一定律正在放缓,预训练带来的边际收益在减弱,而且全球高质量数据已经枯竭,这也使得OpenAI的训练资源面临瓶颈,模型性能提升十分有限。

正以5000亿美元估值进行员工股份出售

此次推出GPT-5,除了回应市场长期以来的期待,或许还与OpenAI近期正在进行的资本运作有关。据外媒8月6日报道,知情人士透露,OpenAI正以约5000亿美元的估值对现任和前任员工潜在的股票二次出售展开初步谈判。

值得注意的是,就在一周以前,OpenAI才成功融资83亿美元,投资者包括黑石集团、TPG、T.Rowe等,估值达到3000亿美元。若股票二次出售的交易成功,OpenAI的账面估值将较此前估值增长约三分之二,并将一举超越SpaceX,成为全球最具价值的独角兽。

GPT-5的发布,将进一步巩固OpenAI在大模型技术领域的领先优势,提振投资者信心,有助于公司估值的增长及股票二次出售计划的实施。

业内人士分析,最近一段时间,硅谷的“抢人大战”趋于白热化,OpenAI多名核心研发人员的离职给公司带来重创。OpenAI此举旨在为员工提供兑现机会,同时作为人才激励工具,在不稀释公司控制权的情况下,增强员工忠诚度。

除此以外,为了增强对人才的吸引力,Hyperbolic AI首席执行官Yuchen Jin在社交平台上表示,他在OpenAI任职的朋友透露,奥特曼近日宣布将在两年内为每名员工提供150万美元奖金。

责编:李丹

校对:彭其华

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京一35岁程序员辞职摆摊卖肉蛋堡月入5万,当事人:单价5元,日均销量超1000个,食材来自胖东来、山姆

北京一35岁程序员辞职摆摊卖肉蛋堡月入5万,当事人:单价5元,日均销量超1000个,食材来自胖东来、山姆

大象新闻
2026-04-09 23:45:01
尴尬!42岁女士许愿征婚,一男子上台想要配对,被王婆当场拦下

尴尬!42岁女士许愿征婚,一男子上台想要配对,被王婆当场拦下

火山詩话
2026-04-11 07:11:00
突发!特斯拉新款 Model Y 发布,有点离谱

突发!特斯拉新款 Model Y 发布,有点离谱

新浪财经
2026-04-11 04:45:06
以军在教室开枪,打死正在上课的9岁加沙女孩

以军在教室开枪,打死正在上课的9岁加沙女孩

潇湘晨报
2026-04-10 14:59:14
停火两周的生存挑战:革命卫队如何保障伊朗九千万人的吃喝?

停火两周的生存挑战:革命卫队如何保障伊朗九千万人的吃喝?

高博新视野
2026-04-10 06:30:09
关于两岸和平统一,郑丽文正式表态,国民党三人罕见支持,不简单

关于两岸和平统一,郑丽文正式表态,国民党三人罕见支持,不简单

DS北风
2026-04-10 17:16:33
又有官二代要坑爹?找茬刁难服务人员,并威胁:你知道我爹是咱们区的谁吗?

又有官二代要坑爹?找茬刁难服务人员,并威胁:你知道我爹是咱们区的谁吗?

小萝卜丝
2026-04-10 18:37:25
黄景瑜王玉雯恋情被曝光?两人被拍到进入饭局,随后一起到酒店,直到天亮了也没离开。

黄景瑜王玉雯恋情被曝光?两人被拍到进入饭局,随后一起到酒店,直到天亮了也没离开。

贴小君
2026-04-10 13:26:42
白色路虎车加油后逃单,江西高速交警通报

白色路虎车加油后逃单,江西高速交警通报

环球网资讯
2026-04-11 07:53:11
皮蓬前妻曝猛料:结婚23年每晚四次,我几乎一天假都没休过!

皮蓬前妻曝猛料:结婚23年每晚四次,我几乎一天假都没休过!

仰卧撑FTUer
2026-04-11 07:40:08
全红婵后续:陈若琳被曝光,更多细节浮现,队友开始慌乱,求放过

全红婵后续:陈若琳被曝光,更多细节浮现,队友开始慌乱,求放过

眼光很亮
2026-04-10 14:04:08
6月1日起,包工头彻底告别舞台!建筑圈大洗牌,5000万工人迎巨变

6月1日起,包工头彻底告别舞台!建筑圈大洗牌,5000万工人迎巨变

普陀动物世界
2026-04-10 21:35:49
1-1!姆巴佩遭点球争议,巴尔韦德难救主,皇马连续3场不胜

1-1!姆巴佩遭点球争议,巴尔韦德难救主,皇马连续3场不胜

我的护球最独特
2026-04-11 05:04:38
锁定季后赛!老鹰大胜送骑士锁定第四 哈登10000罚球里程碑

锁定季后赛!老鹰大胜送骑士锁定第四 哈登10000罚球里程碑

醉卧浮生
2026-04-11 09:30:56
江苏一商场女厕360°无遮挡引热议,商场回应:正在施工改造,新隔断到货后会安装

江苏一商场女厕360°无遮挡引热议,商场回应:正在施工改造,新隔断到货后会安装

大象新闻
2026-04-10 21:44:09
辽阳奔驰陪葬后续:多部门介入,豪车当天被挖出!当事人背景流出

辽阳奔驰陪葬后续:多部门介入,豪车当天被挖出!当事人背景流出

火山詩话
2026-04-11 08:39:41
郑丽文女保镖火了!她的眼神让全场震惊。

郑丽文女保镖火了!她的眼神让全场震惊。

小猫娱乐叭叭
2026-04-09 21:03:31
赛力斯新专利:汽车座便器!

赛力斯新专利:汽车座便器!

新浪财经
2026-04-10 19:33:14
这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

这张照片是2014年张雪峰和他的妻子李丽婧,在清华大学拍的结婚照

喜欢历史的阿繁
2026-04-11 06:47:10
阿耳忒弥斯2号最终一搏:13分钟穿越2760℃,时隔53年月球归来大考

阿耳忒弥斯2号最终一搏:13分钟穿越2760℃,时隔53年月球归来大考

三体引力波
2026-04-11 01:02:06
2026-04-11 10:32:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
893983文章数 238977关注度
往期回顾 全部

科技要闻

三星中国被曝大调整:黑白电、显示器淡出市场

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

头条要闻

牛弹琴:伊朗很悲壮 向美国提高了"要价"

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

从日本翻身看:这次谁能扛住高油价?

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

健康
手机
游戏
教育
艺术

干细胞抗衰4大误区,90%的人都中招

手机要闻

Omdia报告2026Q1全球手机出货量:三星市占22%、苹果20%

大话西游手游男人燃灯套装!2026大话男人最值得投资的佩饰

教育要闻

“穷到吃豆豉,还生呢?”农村家长晒5儿3女,大儿子眼神好可怕

艺术要闻

你绝对想不到,毛主席的书法珍品竟然被遗弃过!

无障碍浏览 进入关怀版