网易首页 > 网易号 > 正文 申请入驻

GPT-5发布,这一次OpenAI没有颠覆式创新|新京报专栏

0
分享至

▲OpenAI发布其最新人工智能模型GPT-5。图/IC photo

GPT-5终于来了,但比所有人的预期都要晚。

据新华社报道,美国开放人工智能研究中心(OpenAI)8月7日发布其最新人工智能模型GPT-5。

从2023年3月GPT-4横空出世之后,不少人曾认为,当年下半年GPT-5就可以出来。但这一等,就是2年多的时间。期间,OpenAI推出了其他众多以奇奇怪怪方式命名的大模型,复杂得让用户在选择时,都犯了选择困难症。

虽然不少媒体对这次发布会给予了积极评价,但从更广泛视角看,与其说这是OpenAI的一次技术展示,不如说是OpenAI和奥尔特曼不得不举办的一场发布会。

OpenAI的升级与失落

从发布会来看,OpenAI给出的GPT-5卖点很清晰:更强、更稳、更便宜、更好用。

“更强”,是OpenAI一贯的特色。每一次GPT系列产品出来,总要在模型能力上来个“屠榜”,这次也不例外。OpenAI官方数据显示,GPT-5在多项基准测试中创下新纪录,包括数学、编程、多模态理解和健康等领域。

不仅如此,GPT-5采用统一系统架构,整合了高效基础模型、深度推理模块和实时路由系统,能够根据不同情况判断何时该快速回应,何时应进行深度推理思考以提供专家级的答案。也就是“简单问题快答,复杂问题拉长思考”,这样的使用体验,比把不同子模型硬塞给用户选择更自然。

此外,达到400K的超长上下文能力,也是GPT-5值得一提的改进。这对长文档检索与跨文件代码修改更友好,虽然相比Gemini 1M(谷歌旗下产品)的上下文量还有距离,但于其他对手而言,已算是领先一步。

“更稳”,针对的是AI大模型普遍存在的“幻觉”问题。OpenAI官方反复强调,GPT-5在事实性与安全性上比前代显著进步:更少的幻觉、更少的“编理由”“迎合性回答”,在“该不知道的时候更愿意承认不知道”。这既是对过去一年里“推理模型幻觉陡增”的纠偏,也是面向企业落地的现实诉求。

“更便宜”,则是这次更具杀伤力的一点。GPT-5在编程能力大幅度提升的情况下,其API(应用程序编程接口)价格却比8月5日刚发布的Claude Opus 4.1更便宜,同时也比Gemini 2.5 Pro价格低。这可以说是对Anthropic(美国人工智能初创公司)的致命一击。

要知道,OpenAI作为这一领域的前沿公司,过去是它做什么,大家做什么;但现在,这种趋势正在被Anthropic取代。比如编程能力、幻觉抑制、安全,以及MCP等都属于Anthropic,而OpenAI最擅长的就只剩下“屠榜”和营销了。

所以,这次OpenAI把GPT-5系列的价格定得很低,与主打高强度推理与编码的Claude Opus 4.1相比,足足有一个数量级的差距,显然就不仅仅是象征性的实惠,而是为了实实在在改变开发团队的选择。

这其实也解释了,为什么Anthropic会在日前公开指责OpenAI违反服务条款,切断OpenAI对Claude(Anthropic发布的大型语言模型家族)系列AI模型的API访问权限。

“更好用”,就是让用户不用再为选择什么模型而苦恼。过去那些乱七八糟的命名模型,反映的不仅是GPT-5迟迟无法达到预期目标的结果,也大大降低了用户的使用体验。基本上没有其他产品像GPT一样,存在如此多不同命名的模型。这次GPT-5推出之后,终于实现了“大一统”,其他所有大模型统统消失,只剩下GPT-5系列产品。

营销大师的尴尬

但GPT-5的这些进步,显然不可能是颠覆性的,只能算是技术上的“小步快跑”,离所谓的AGI(通用人工智能)显然还有相当大的距离。甚至可以说,GPT-5在这个时候发布,很大程度上是因为OpenAI和奥尔特曼不得不举办。

作为出了名的“营销大师”,早在几个月前开始,关于GPT-5的消息、截图总是不时出现在社交平台上。奥尔特曼在接受媒体采访时感叹自己能力不如GPT-5,甚至为AI的发展将超出现有监管能力而担忧。

在发布会的前一天,一些渠道上还有各种“提前走漏风声”,让大家对这场发布会的预期拉得很高——这会是一场再次改变游戏规则与行业走向的发布会?

但发布会过后,外界对OpenAI的模型能力评价却出现了下滑,有的甚至充满了失望。这场发布会的实际演示与讲述,更像一场“产品化与可用性升级”的汇报——重要,但不惊艳。更别说那些被网友抓包的PPT错误了。

但不管如何,对于OpenAI和奥尔特曼,这却是一场不得不举办的发布会。

首先是因为,GPT-5已一再爽约。外界两年多来的等待,以及中间各种传闻和暗示,已经把时间窗口压得很窄。如果再不发布GPT-5,恐怕后续OpenAI的叙事方式,就要从“我们在引领”变成“我们为什么还没发布”。

▲GPT-5主打“更强、更稳、更便宜、更好用”卖点。图/IC photo

竞争压力也是看得见摸得着。在Anthropic、Google、Meta(脸书)、xAI(马斯克成立的人工智能公司)以及中国一众大语言模型公司的激烈竞争下,OpenAI在业内的优势已经越来越不明显了。就在这次发布会之前,Anthropic把Claude Opus 4.1的编码表现又往上推了一截;过去一年里,Claude系在长程专注、复杂代码重构上的口碑持续攀升。

除了具体的模型能力之外,AI人才战也愈演愈烈。从2024年的OpenAI安全团队离职潮,到今年多份人才报告显示的流向Anthropic的净迁移,再到Meta开出天价薪酬到处挖人,这些都对OpenAI产生了巨大的压力。OpenAI既要保持住自己的优势与吸引力,同时也要稳住团队士气。

所以,从这一点来看,其实也就非常好理解了,为何这次发布会上,OpenAI主打的是“更强、更稳、更便宜、更好用”的卖点组合了。换句话说,当价格战成为OpenAI应对强劲对手的武器时,就可以清清楚楚地感受到,这家一直以来以技术领先为核心定义的公司,其实面临着怎样的巨大压力。

因此,更便宜的价格,既是这场发布会令人意外的最大亮点,却也是令人叹息的地方。而当先行者变得务实,也许才是技术快速发展期结束的最明显标志。

AI狂飙时代的结束?

在营销大师奥尔特曼主导下的这场发布会,出乎意料地变得很实在。它没有承诺AGI的到来,也没有宣布颠覆式的新能力,而是把稳定性、安全性、价格、默认可用放在C位——这些恰恰是平台期最值得押注的要素。

同时,这也反映OpenAI在变慢,AI行业整体也在变慢的现实。所以,未来AI行业恐怕在短期之内,很难会像此前GPT横空出世一样,带给公众巨大的颠覆感和震撼感。

从GPT-4.5(Orion)项目的失败,就已经让大家看到了参数Scaling Law(规模定律)逐渐放缓的迹象。一个典型的例子是,即使是用了10倍算力强化学习的Grok-4,表现也不算特别惊艳。

正如有分析认为,当前的评估基准正在接近饱和,“基本上就像看高中生做初中题目”。当所有模型都能在现有测试中取得90%以上的分数时,这些数字还有多大意义?

低垂的果实已经摘完了。那堵看不见的AI增长之墙,也就变得越发明显。整个行业都需要新的突破——可能是架构上的创新,可能是训练方法的革命,也可能是我们还未想到的全新方式。只是,这个突破何时到来、以何种形式到来,已经变得难以预测。

所以,某种意义上来说,GPT-5的发布,既标志着OpenAI逐渐变慢的开始,也预示整个AI行业,将从过去的“奇迹时代”走入“平凡时代”。

OpenAI曾经是那个定义游戏规则的先行者,现在却不得不在一场并不完美的发布会上,用价格战来守住阵地。这不仅是OpenAI的转折点,也可能是整个AI行业的分水岭。

因此,GPT-5远不是AGI产品。而通向AGI的道路,也可能将远比我们想象的要长得多。

撰稿 / 新京智库高级研究员 郑伟彬

编辑 / 马小龙

校对 / 王心

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高市公布“喜讯”再叫嚣!赖清德挑衅大陆,只有英媒看出中国高明

高市公布“喜讯”再叫嚣!赖清德挑衅大陆,只有英媒看出中国高明

野史日记
2026-02-22 10:00:10
高速路上粤C车主挂在后备箱上的活鸭子掉落,当场逃走,车主:吃的时候记得熬久一点

高速路上粤C车主挂在后备箱上的活鸭子掉落,当场逃走,车主:吃的时候记得熬久一点

环球网资讯
2026-02-23 09:45:36
“上了高速,发现全是聪明人”!还有人带了一锅饭……

“上了高速,发现全是聪明人”!还有人带了一锅饭……

极目新闻
2026-02-23 08:54:39
特斯拉旧将或重写百年电网!中国变压器站在十字路口?

特斯拉旧将或重写百年电网!中国变压器站在十字路口?

能见
2026-02-22 22:20:16
22分惨败!东契奇25+5裁判引不满,布朗32分12罚,老詹20+5创纪录

22分惨败!东契奇25+5裁判引不满,布朗32分12罚,老詹20+5创纪录

鱼崖大话篮球
2026-02-23 10:02:35
高市早苗连任后的第一次演讲,公开点名中俄朝三个国家

高市早苗连任后的第一次演讲,公开点名中俄朝三个国家

近史博览
2026-02-22 16:03:07
上汽1月销量领跑背后:从造车到懂你,新产品新技术全面提速

上汽1月销量领跑背后:从造车到懂你,新产品新技术全面提速

路咖汽车
2026-02-22 17:30:03
万幸!家庭聚会男子中途去屋外透气,抬头见3岁儿子坠楼,立马伸手接住!“后怕极了”

万幸!家庭聚会男子中途去屋外透气,抬头见3岁儿子坠楼,立马伸手接住!“后怕极了”

极目新闻
2026-02-22 11:50:28
2026年公务员政审三代最新标准

2026年公务员政审三代最新标准

深度报
2026-02-22 22:51:50
硬核评测!博主实测44台手机,撕碎行业遮羞布:国产厂商集体翻车

硬核评测!博主实测44台手机,撕碎行业遮羞布:国产厂商集体翻车

爆角追踪
2026-02-22 19:30:57
2月22日俄乌最新:川普逼迫乌克兰2天内投降

2月22日俄乌最新:川普逼迫乌克兰2天内投降

西楼饮月
2026-02-22 16:03:29
华为确实是出现了严重的问题,只是至今官方还没有公开承认

华为确实是出现了严重的问题,只是至今官方还没有公开承认

雪中风车
2026-02-22 20:18:26
詹姆斯43000分里程碑:41岁创历史首人纪录 无愧最长的河

詹姆斯43000分里程碑:41岁创历史首人纪录 无愧最长的河

醉卧浮生
2026-02-23 09:10:33
破25亿,张艺谋甘拜下风,春节档最强电影诞生了

破25亿,张艺谋甘拜下风,春节档最强电影诞生了

社会日日鲜
2026-02-23 05:56:04
鹅粉砸了重金的「俄罗斯娜娜」,原来是中国大妈,可她毕竟温暖了多少人夜里难眠的心……

鹅粉砸了重金的「俄罗斯娜娜」,原来是中国大妈,可她毕竟温暖了多少人夜里难眠的心……

家传编辑部
2026-02-22 16:40:47
邻居养 38 只鸽子我不吭声,悄悄装 5 面镜子,三天后他求我手下留情

邻居养 38 只鸽子我不吭声,悄悄装 5 面镜子,三天后他求我手下留情

健身狂人
2026-02-22 13:46:26
王楚然美到犯规,丰满波霸这身材比例简直是行走的荷尔蒙?

王楚然美到犯规,丰满波霸这身材比例简直是行走的荷尔蒙?

娱乐领航家
2026-02-22 22:00:03
宁愿在国外种地,也不愿意回国,培养出92个世界冠军的李永波图啥

宁愿在国外种地,也不愿意回国,培养出92个世界冠军的李永波图啥

阅微札记
2026-02-22 19:15:15
AGI时代,养老金将变得毫无意义?大白话告诉你AGI到底是什么?

AGI时代,养老金将变得毫无意义?大白话告诉你AGI到底是什么?

我不叫阿哏
2026-02-22 13:14:03
平顶山15岁女孩被鞋扇砖砸事件后续,女孩伤重未醒,全网求严惩

平顶山15岁女孩被鞋扇砖砸事件后续,女孩伤重未醒,全网求严惩

观察鉴娱
2026-02-22 15:19:39
2026-02-23 11:31:00
新京报 incentive-icons
新京报
好新闻,无止境
563271文章数 2506868关注度
往期回顾 全部

科技要闻

腾讯字节,“火拼”漫剧

头条要闻

女歌手曲婉婷新账号疑似被封 中纪委曾发文提及其母亲

头条要闻

女歌手曲婉婷新账号疑似被封 中纪委曾发文提及其母亲

体育要闻

谷爱凌:6次参赛6次夺牌 我对自己非常自豪

娱乐要闻

谷爱凌奶奶去世,谷爱凌泪奔

财经要闻

结婚五金迈入10万大关 年轻人结婚更难了

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

艺术
游戏
手机
本地
公开课

艺术要闻

十大名家画春,送给春天的你!

游戏女主播曝抖音直播内幕!播游戏没工资 真会饿死

手机要闻

时隔4年终于回归!iPhone 18 Pro将推出深红配色

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版