网易首页 > 网易号 > 正文 申请入驻

GPT-5,重磅来袭!

0
分享至

在频频“跳票”和多次“剧透”之后,万众期待的GPT-5终于发布了。

北京时间8月8日凌晨1时,OpenAI举行了长达1个多小时的线上发布会,正式推出了GPT-5。与此前的模型更新直播时间短且主要由研发人员发布相比,GPT-5的发布明显规格更高,不仅发布时间长、细节多,而且OpenAI首席执行官山姆·奥特曼也现身发布会现场。

经证券时报记者梳理,发布会的主要亮点如下:

  • 集成模型:GPT-5是一个集成模型(integrated model),融合了大语言模型GPT系列和推理模型o系列,这意味着用户在使用时不再需要手动切换各类不同的模型。

  • 能力提升:据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康等领域,都表现出了顶尖性能,全部大幅度超越前代,成为目前最强大模型。

  • 幻觉降低:与GPT-4o相比,GPT-5的事实错误率降低了45%;深度思考模式下,事实错误率则比o3降低80%,变得更加准确和可靠。

“专家级别”的大模型,智能且融合水平高

在发布会上,奥特曼对 GPT-5 给出了极高评价,称其是“此前所有模型的巨大飞跃”。他还表示,如果说GPT-4是一个大学生,那么GPT-5就是“真正的专家”。

GPT-5最核心的亮点是,它并非单一的语言或者推理模型,而是整合了GPT系列(大语言模型)和o系列(推理模型),具备调度子模型的能力。奥特曼在其个人社交平台上连发十余条推文介绍GPT-5,其中首条就强调“GPT-5是一个集成模型,这意味着不再需要模型切换器,它将自行决定何时需要更深入地思考”。

据介绍,GPT-5首次使用了内嵌式三位一体集成架构,系统由三部分组成,分别是处理常规问题的GPT-5-main模型、解决复杂任务的GPT-5-thinking 深度思考模型、以及实时决策的路由机制,还有一个是额度使用完后启动的mini版本。其中,实时决策的路由机制会根据对话类型、复杂程度、工具需求以及用户的明确意图,快速决定使用哪个模型,自主决定是否进入深度思考模式,自动匹配最适合的模型。

根据OpenAI公开的测试数据,GPT-5在数学、编程、视觉感知和健康领域表现均大幅超越前代模型,展现了顶尖的性能。例如在数学领域,GPT-5在2025年AIME测试中无工具辅助达到94.6%,大幅超过了o3模型;在健康领域,GPT-5的表现大幅超越包括GPT-4o、o1、o3和o4-mini在内的所有前代模型。

值得注意的是,在大模型竞技场LMArena上,刚刚上线的GPT-5凭借着极强的性能在所有细分类目中都位列第一。

应用场景方面,据现场展示的多个案例,GPT-5编码能力突出,只需要几句话就可以创建一个名为 “Jumping Ball Runner” 的游戏。该游戏界面色彩丰富,游戏角色采用卡通风格设计,且具备最高分记录功能、重试按钮、趣味音效等多种特色功能。此外,GPT-5还可以用几分钟就开发一个学习法语的网络应用、一个复杂的财务分析模版等等。

作为长期被用户吐槽的重灾区,“AI幻觉”一直是所有大模型难以克服的痛点。GPT在减少AI幻觉方面,展现了行业领先的水平。据介绍,与GPT-4o相比,GPT-5的事实错误率降低了45%;在深度思考模式下,事实错误率更是比o3大幅下降80%,变得更加准确可靠。在开放性事实准确性基准LongFact和FActScore测试中,GPT-5的幻觉率比o3减少大约六倍,长篇内容生成的准确性显著提升。

GPT-5拥有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四个版本,免费用户的GPT-5用量有限,超过限额后将自动转至GPT-5-mini,GPT-5-pro仅供Pro订阅用户使用。

定价方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向开发者提供API服务,三款模型的输入、输出价格分别为每百万token 1.25美元/10美元、每百万token 0.5美元/5美元、每百万token 0.15美元/1.5美元。与主要竞争对手Anthropic和谷歌相比,OpenAI的GPT-5模型对于开发人员来说成本相当甚至更低。

此前差点“难产”,被质疑进步不够惊艳

GPT-5一直是OpenAI最受外界关注和期待的产品。但在过去的一年多时间里,尽管频频有GPT-5即将发布的消息传出,但也屡屡“跳票”,始终未能如约而至。

在此期间,OpenAI发布了许多复杂的模型产品与功能更新。总体来看,OpenAI模型有GPT(大语言模型)和o(推理模型)两大核心系列,同时还通过Turbo、mini、high等后缀或内部代号来区分模型的版本与特性。据统计,OpenAI对外提供服务的模型数量已超过了40个,尺寸、上下文窗口、价格各异。大量的模型让用户面临“选择困难症“。

在今年6月的一场播客节目中,奥特曼也提到,产品发布节奏失控是复杂化的主因,他表示希望未来不会出现更复杂的命名方式,尽快走出当前o4-mini、o3、4o等略显混乱的命名局面。“我期待着GPT-5和GPT-6的到来,这样人们使用起来会更简单,不用再纠结于o4-mini-high或o3这样的版本。”奥特曼说。

之所以衍生出这么多模型产品并且再三推迟GPT-5的发布时间,原因是GPT-5的研发一直不顺利,没有达到期待。纵观OpenAI在推出GPT-4以后的大多数模型,都属于"渐进式优化",没有复刻像GPT-4那样巨大的性能飞跃。

值得注意的是,在GPT-5发布前夕,多个信源爆料称,GPT-5并未取得明显技术突破,依然没有像GPT-4那种级别的进步。此外,由于Meta前段时间疯狂“挖人”,一大批核心研究者被高薪挖走,导致内部组织结构陷入混乱,让GPT-5的研发进一步陷入困境。据知情人士爆料,直到今年6月,OpenAI开发的模型中没有一个能配得上GPT-5的名号,内部也无法确认哪个模型版本足以称之为GPT-5。

一名人工智能资深研究员告诉证券时报记者,虽然GPT-5 在编程、数学推理、智能体等方面表现有所进步,但仍然只是“渐进式优化”,而非颠覆性、跨越式的提升。GPT-5表现不够惊艳的核心原因在于,大模型训练遵循Scaling Laws(缩放定律),即模型性能随着参数规模、训练数据量、计算资源的增加而提升。如今这一定律正在放缓,预训练带来的边际收益在减弱,而且全球高质量数据已经枯竭,这也使得OpenAI的训练资源面临瓶颈,模型性能提升十分有限。

正以5000亿美元估值进行员工股份出售

此次推出GPT-5,除了回应市场长期以来的期待,或许还与OpenAI近期正在进行的资本运作有关。据外媒8月6日报道,知情人士透露,OpenAI正以约5000亿美元的估值对现任和前任员工潜在的股票二次出售展开初步谈判。

值得注意的是,就在一周以前,OpenAI才成功融资83亿美元,投资者包括黑石集团、TPG、T.Rowe等,估值达到3000亿美元。若股票二次出售的交易成功,OpenAI的账面估值将较此前估值增长约三分之二,并将一举超越SpaceX,成为全球最具价值的独角兽。

GPT-5的发布,将进一步巩固OpenAI在大模型技术领域的领先优势,提振投资者信心,有助于公司估值的增长及股票二次出售计划的实施。

业内人士分析,最近一段时间,硅谷的“抢人大战”趋于白热化,OpenAI多名核心研发人员的离职给公司带来重创。OpenAI此举旨在为员工提供兑现机会,同时作为人才激励工具,在不稀释公司控制权的情况下,增强员工忠诚度。

除此以外,为了增强对人才的吸引力,Hyperbolic AI首席执行官Yuchen Jin在社交平台上表示,他在OpenAI任职的朋友透露,奥特曼近日宣布将在两年内为每名员工提供150万美元奖金。

责编:李丹

校对:彭其华

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes

" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黄金、白银,直线跳水!特朗普,大消息!

黄金、白银,直线跳水!特朗普,大消息!

证券时报e公司
2026-03-26 14:47:48
跟着黄仁勋下注:如今的token可能就是20年的房子

跟着黄仁勋下注:如今的token可能就是20年的房子

梦大明白
2026-03-24 11:05:49
重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

萌兰聊个球
2026-03-26 13:02:53
江苏省盐城市政协原副主席潘道津接受审查调查

江苏省盐城市政协原副主席潘道津接受审查调查

界面新闻
2026-03-26 19:12:28
日产43万桶炼油厂被炸!特朗普遭背刺,油价飙11元,重油全砸手里

日产43万桶炼油厂被炸!特朗普遭背刺,油价飙11元,重油全砸手里

李健政观察
2026-03-26 11:21:58
中国最丑18大建筑:南京卫生巾、昆山螃蟹,不忍直视!

中国最丑18大建筑:南京卫生巾、昆山螃蟹,不忍直视!

秘密即将揭晓
2026-03-25 16:56:26
是什么,让这个日本自卫官竟敢对中国大使馆举刀?

是什么,让这个日本自卫官竟敢对中国大使馆举刀?

环球时报国际
2026-03-26 00:13:51
四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

高博新视野
2026-03-25 08:00:28
石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

蜉蝣说
2026-03-26 16:52:10
浙江省高校排名更新!宁波大学第4,浙工大第7,温州医科大仅排14

浙江省高校排名更新!宁波大学第4,浙工大第7,温州医科大仅排14

朗威谈星座
2026-03-26 18:09:46
蒋介石下令炸开汪精卫之墓,发现他身上放着一张纸条,写了何内容

蒋介石下令炸开汪精卫之墓,发现他身上放着一张纸条,写了何内容

北海史记
2026-03-26 15:06:32
80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

80年陈云建议陈锡联辞职,陈锡联猛拍桌:让我干啥,我绝无二话!

抽象派大师
2026-03-25 12:04:28
梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

梁兴初被隔离审查8年,自由后叶帅给出两个选择,梁:一个也不要

兴趣知识
2026-03-25 12:32:27
油价调整:注意,预计下调120元/吨,油价突破下调红线!

油价调整:注意,预计下调120元/吨,油价突破下调红线!

金投网
2026-03-26 11:16:05
张雪峰猝死事件发酵!网传内蒙一公司老板开会,出资全员急救培训

张雪峰猝死事件发酵!网传内蒙一公司老板开会,出资全员急救培训

火山詩话
2026-03-26 10:42:17
迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

迟迟都等不到中企复工,巴拿马头号帮手已介入,中方加强港口管制

福建平子
2026-03-26 09:00:29
森林狼逆火箭:申京努力了,然而杜兰特啊

森林狼逆火箭:申京努力了,然而杜兰特啊

张佳玮写字的地方
2026-03-26 13:03:18
东北两省书记省长会见刘强东

东北两省书记省长会见刘强东

观察者网
2026-03-25 21:43:37
伊朗:击中击落美以202架飞机;以方:坦格西里身亡,他负责封锁霍尔木兹!想快速抽身,特朗普:打伊朗不是战争,是“军事行动”

伊朗:击中击落美以202架飞机;以方:坦格西里身亡,他负责封锁霍尔木兹!想快速抽身,特朗普:打伊朗不是战争,是“军事行动”

每日经济新闻
2026-03-26 17:27:09
伊媒:伊朗若遭美国地面入侵将打击曼德海峡

伊媒:伊朗若遭美国地面入侵将打击曼德海峡

参考消息
2026-03-26 11:02:08
2026-03-26 21:03:00
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
886709文章数 238937关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
旅游
家居
健康
教育

数码要闻

小米Book Pro 14超薄设计引爆市场!这家国产厂商立功了

旅游要闻

20元人民币背景观景台乱收费?景区通报:不存在封闭管控、强制收费等

家居要闻

傍海而居 静观蝴蝶海

转头就晕的耳石症,能开车上班吗?

教育要闻

来上课了——高考阅读难题大综合(细节+主旨+含义)(下)第1段

无障碍浏览 进入关怀版