网易首页 > 网易号 > 正文 申请入驻

GPT-5,重磅来袭!

0
分享至

在频频“跳票”和多次“剧透”之后,万众期待的GPT-5终于发布了。

北京时间8月8日凌晨1时,OpenAI举行了长达1个多小时的线上发布会,正式推出了GPT-5。与此前的模型更新直播时间短且主要由研发人员发布相比,GPT-5的发布明显规格更高,不仅发布时间长、细节多,而且OpenAI首席执行官山姆·奥特曼也现身发布会现场。

经证券时报记者梳理,发布会的主要亮点如下:

  • 集成模型:GPT-5是一个集成模型(integrated model),融合了大语言模型GPT系列和推理模型o系列,这意味着用户在使用时不再需要手动切换各类不同的模型。

  • 能力提升:据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康等领域,都表现出了顶尖性能,全部大幅度超越前代,成为目前最强大模型。

  • 幻觉降低:与GPT-4o相比,GPT-5的事实错误率降低了45%;深度思考模式下,事实错误率则比o3降低80%,变得更加准确和可靠。

“专家级别”的大模型,智能且融合水平高

在发布会上,奥特曼对 GPT-5 给出了极高评价,称其是“此前所有模型的巨大飞跃”。他还表示,如果说GPT-4是一个大学生,那么GPT-5就是“真正的专家”。

GPT-5最核心的亮点是,它并非单一的语言或者推理模型,而是整合了GPT系列(大语言模型)和o系列(推理模型),具备调度子模型的能力。奥特曼在其个人社交平台上连发十余条推文介绍GPT-5,其中首条就强调“GPT-5是一个集成模型,这意味着不再需要模型切换器,它将自行决定何时需要更深入地思考”。

据介绍,GPT-5首次使用了内嵌式三位一体集成架构,系统由三部分组成,分别是处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking 深度思考模型、以及实时决策的路由机制,还有一个是额度使用完后启动的mini版本。其中,实时决策的路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自主决定是否进入深度思考模式,自动匹配最适合的模型。

根据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康领域表现均大幅超越前代模型,展现了顶尖的性能。例如在数学领域,GPT-5在2025年AIME测试中无工具辅助达到94.6%,大幅超过了o3模型;在健康领域,GPT-5的表现大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。

值得注意的是,在大模型竞技场LMArena上,刚刚上线的GPT-5凭借着极强的性能在所有细分类目中都位列第一。

应用场景方面,据现场展示的多个案例,GPT-5编码能力突出,只需要几句话就可以创建一个名为 “Jumping Ball Runner” 的游戏。该游戏界面色彩丰富,游戏角色采用卡通风格设计,且具备最高分记录功能、重试按钮、趣味音效等多种特色功能。此外,GPT-5还可以用几分钟就开发一个学习法语的网络应用、一个复杂的财务分析模版等等。

作为长期被用户吐槽的重灾区,“AI幻觉”一直是所有大模型难以克服的痛点。GPT在减少AI幻觉方面,展现了行业领先的水平。据介绍,与GPT-4o相比,GPT-5的事实错误率降低了45%;在深度思考模式下,事实错误率更是比o3大幅下降80%,变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中,GPT-5的幻觉率比o3减少大约六倍,长篇内容生成的准确性显著提升。

GPT-5拥有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本,免费用户的GPT-5用量有限,超过限额后将自动转至GPT-5-mini,GPT-5-pro仅供Pro订阅用户使用。

定价方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向开发者提供API服务,三款模型的输入、输出价格分别为每百万token 1.25美元/10美元、每百万token 0.5美元/5美元、每百万token 0.15美元/1.5美元。与主要竞争对手Anthropic和谷歌相比,OpenAI的GPT-5模型对于开发人员来说成本相当甚至更低。

此前差点“难产”,被质疑进步不够惊艳

GPT-5一直是OpenAI最受外界关注和期待的产品。但在过去的一年多时间里,尽管频频有GPT-5即将发布的消息传出,但也屡屡“跳票”,始终未能如约而至。

在此期间,OpenAI发布了许多复杂的模型产品与功能更新。总体来看,OpenAI模型有GPT(大语言模型)和o(推理模型)两大核心系列,同时还通过Turbo、mini、high等后缀或内部代号来区分模型的版本与特性。据统计,OpenAI对外提供服务的模型数量已超过了40个,尺寸、上下文窗口、价格各异。大量的模型让用户面临“选择困难症“。

在今年6月的一场播客节目中,奥特曼也提到,产品发布节奏失控是复杂化的主因,他表示希望未来不会出现更复杂的命名方式,尽快走出当前o4-mini、o3、4o等略显混乱的命名局面。“我期待着GPT-5和GPT-6的到来,这样人们使用起来会更简单,不用再纠结于o4-mini-high或o3这样的版本。”奥特曼说。

之所以衍生出这么多模型产品并且再三推迟GPT-5的发布时间,原因是GPT-5的研发一直不顺利,没有达到期待。纵观OpenAI在推出GPT-4以后的大多数模型,都属于"渐进式优化",没有复刻像GPT-4那样巨大的性能飞跃。

值得注意的是,在GPT-5发布前夕,多个信源爆料称,GPT-5并未取得明显技术突破,依然没有像GPT-4那种级别的进步。此外,由于Meta前段时间疯狂“挖人”,一大批核心研究者被高薪挖走,导致内部组织结构陷入混乱,让GPT-5的研发进一步陷入困境。据知情人士爆料,直到今年6月,OpenAI开发的模型中没有一个能配得上GPT-5的名号,内部也无法确认哪个模型版本足以称之为GPT-5。

一名人工智能资深研究员告诉证券时报记者,虽然GPT-5 在编程、数学推理、智能体等方面表现有所进步,但仍然只是“渐进式优化”,而非颠覆性、跨越式的提升。GPT-5表现不够惊艳的核心原因在于,大模型训练遵循Scaling Laws(缩放定律),即模型性能随着参数规模、训练数据量、计算资源的增加而提升。如今这一定律正在放缓,预训练带来的边际收益在减弱,而且全球高质量数据已经枯竭,这也使得OpenAI的训练资源面临瓶颈,模型性能提升十分有限。

正以5000亿美元估值进行员工股份出售

此次推出GPT-5,除了回应市场长期以来的期待,或许还与OpenAI近期正在进行的资本运作有关。据外媒8月6日报道,知情人士透露,OpenAI正以约5000亿美元的估值对现任和前任员工潜在的股票二次出售展开初步谈判。

值得注意的是,就在一周以前,OpenAI才成功融资83亿美元,投资者包括黑石集团、TPG、T.Rowe等,估值达到3000亿美元。若股票二次出售的交易成功,OpenAI的账面估值将较此前估值增长约三分之二,并将一举超越SpaceX,成为全球最具价值的独角兽。

GPT-5的发布,将进一步巩固OpenAI在大模型技术领域的领先优势,提振投资者信心,有助于公司估值的增长及股票二次出售计划的实施。

业内人士分析,最近一段时间,硅谷的“抢人大战”趋于白热化,OpenAI多名核心研发人员的离职给公司带来重创。OpenAI此举旨在为员工提供兑现机会,同时作为人才激励工具,在不稀释公司控制权的情况下,增强员工忠诚度。

除此以外,为了增强对人才的吸引力,Hyperbolic AI首席执行官Yuchen Jin在社交平台上表示,他在OpenAI任职的朋友透露,奥特曼近日宣布将在两年内为每名员工提供150万美元奖金。

责编:李丹

校对:彭其华

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果官方确认:iPhone关掉这3个设置,电池续航翻倍!老机型必关

苹果官方确认:iPhone关掉这3个设置,电池续航翻倍!老机型必关

小柱解说游戏
2026-07-01 11:19:07
221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

221名女囚漂洋过海,下船时全员怀孕,这批女囚竟生出了一个国家

抽象派大师
2026-07-01 01:39:46
含泪告别世界杯!40岁莫德里奇将宣布退役,或返回皇马任职!

含泪告别世界杯!40岁莫德里奇将宣布退役,或返回皇马任职!

海浪星体育
2026-07-03 09:43:34
上千人被骗,比亚迪经销商爆雷,20家店人去楼空,曾是第一旗舰

上千人被骗,比亚迪经销商爆雷,20家店人去楼空,曾是第一旗舰

刘哥谈体育
2026-07-02 14:57:41
西安赛格事件发酵!今年5月集团董事长赵贵,还在营商座谈会发言

西安赛格事件发酵!今年5月集团董事长赵贵,还在营商座谈会发言

火山詩话
2026-07-02 17:12:32
江苏省委书记信长星、省长刘小涛,看望赵亚夫

江苏省委书记信长星、省长刘小涛,看望赵亚夫

政知新媒体
2026-07-03 09:45:56
伊最高领袖没料到,老哈梅灵车还没到圣城,以色列先准备斩首行动

伊最高领袖没料到,老哈梅灵车还没到圣城,以色列先准备斩首行动

时光流转追梦人
2026-07-03 02:03:12
14岁除夕丧父、18岁与母决裂:谭维维用半生治愈了童年的所有伤口

14岁除夕丧父、18岁与母决裂:谭维维用半生治愈了童年的所有伤口

飘飘然的娱乐汇
2026-07-02 18:50:04
马刺迎史诗级补强!两大短板全解决了,锋线得强援,名帅辅佐米奇

马刺迎史诗级补强!两大短板全解决了,锋线得强援,名帅辅佐米奇

你的篮球频道
2026-07-03 08:23:04
美网战报:女双决赛确定,日本锁定奖牌,女单爆冷

美网战报:女双决赛确定,日本锁定奖牌,女单爆冷

萧壛记录风土人情
2026-07-03 08:43:18
国台办释放统一明确信号,郑丽文亮明立场:台湾未来离不开大陆

国台办释放统一明确信号,郑丽文亮明立场:台湾未来离不开大陆

共工之锚
2026-07-03 00:08:11
C罗复制博格坎普史诗进球却被吹越位,巨大压力点球彰显钢铁心脏

C罗复制博格坎普史诗进球却被吹越位,巨大压力点球彰显钢铁心脏

杨华评论
2026-07-03 10:07:46
奥利塞为什么选了法国?答案藏在亨利的眼光里!

奥利塞为什么选了法国?答案藏在亨利的眼光里!

曹老师评球
2026-07-02 22:31:06
里子面子都丢了!管不住下半身的任素汐,一场演唱会撕下她的体面

里子面子都丢了!管不住下半身的任素汐,一场演唱会撕下她的体面

悦君兮君不知
2026-07-02 11:57:00
不踩一捧一!莫德里奇客观谈梅罗:梅西天赋无双,C罗更全能

不踩一捧一!莫德里奇客观谈梅罗:梅西天赋无双,C罗更全能

体育闲话说
2026-07-03 05:47:32
1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

1983年,陈云亲自批示:立即枪毙广东县委书记王仲,原因为何?

大运河时空
2026-07-03 08:50:03
突发!韩国股市,盘中跳水!

突发!韩国股市,盘中跳水!

证券时报
2026-07-03 09:21:26
太阳报:荷兰队内部对阿森纳安排廷贝尔出战欧冠决赛感到不满

太阳报:荷兰队内部对阿森纳安排廷贝尔出战欧冠决赛感到不满

懂球帝
2026-07-03 09:46:27
Shams:安芬尼-西蒙斯2年1230万美元签约76人,第二年为球员选项

Shams:安芬尼-西蒙斯2年1230万美元签约76人,第二年为球员选项

懂球帝
2026-07-03 02:49:13
有没有手撕绿茶的超爽经历?网友:我必须给她上一课

有没有手撕绿茶的超爽经历?网友:我必须给她上一课

另子维爱读史
2026-07-02 21:02:00
2026-07-03 13:08:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
937252文章数 239322关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

围绕霍尔木兹海峡等问题 美伊在安理会激烈交锋

头条要闻

围绕霍尔木兹海峡等问题 美伊在安理会激烈交锋

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

黄晓明深夜约会美女,分手原因曝光

财经要闻

AI“鬼故事”不断,市场开始重估?

汽车要闻

极氪9X五座版官宣,如图!

态度原创

家居
房产
亲子
旅游
教育

家居要闻

传奇筑 日常诗

房产要闻

独家猛料!融创海南大变天,项目重启,大量招人!

亲子要闻

家庭氛围好不好,直接决定孩子的性格底色

旅游要闻

长城闯关、村咖品“法” 怀柔探索法旅融合沉浸式普法新路径

教育要闻

教育部:不得以“夏令营”等名义变相组织考试

无障碍浏览 进入关怀版