网易首页 > 网易号 > 正文 申请入驻

OpenAI发布GPT-5!这是一篇很主观的解读...

0
分享至

凌晨1点,OpenAI 终于发布了万众期待的 GPT-5。

距离 GPT-4 发布,已经过去整整两年半了。我还清晰记得那是2023年的3月14号,距离我从大厂离开还不到一周时间。那个时刻,对AI的兴奋和热情完全掩盖了面对未知前路的恐惧。

在这两年多里,OpenAI其实已经发布了十多个不同的模型(包括什么4o、4.1、4.5、o1、o3、o4……模型名字快赶上显卡厂商了)。

但这次,他们终于喊出了GPT-5的名号。

所以,它到底有什么新变化?值不值得你切换?Claude 4.1 是不是要下岗了?

在展开介绍之前,我们先来看看一个小乌龙:

世界顶级AI公司也能做出这种PPT?

在发布会的图表里,OpenAI展示了一个模型评估的对比:

你看这个数字,52.8 比 69.1 还高,你信吗?

而且,这个错误还不止一次

我服了这个草台班子的世界。

我合理怀疑,这PPT要是让GPT-5自己来做,可能反而更靠谱。

GPT-5 三个版本,立刻上线?

OpenAI这次一口气发布了三个版本的GPT-5 API:GPT-5、GPT-5 Mini、GPT-5 Nano

官网内提供的版本估计也就用这几个大小不一的模型做些小改造。OpenAI官方说是所有用户今天都能用上GPT5。

但截至我写文章时,ChatGPT官网还是老样子,没更新。

反倒是我在Cursor里已经能用上 GPT-5 了,OpenAI:你是不是舔Cursor舔猛了?

这里插播个有趣的小故事,其实OpenAI是Cursor最早的投资者之一,但是随着Claude模型能力的增强,Cursor逐渐和Anthropic变得眉来眼去,经常有深度交流和联合发布了。
但随着现在Anthropic出了个和Cursor正面竞争的Claude Code,这三者的关系又迎来了有趣的变数,敌人的敌人,再次成了朋友。
“自适应思考”:抄了Claude的作业?

这次GPT-5最大的变化之一,是加入了自适应思考能力

也就是说,模型会根据你的问题,动态决定要不要深度思考、思考多久。

这听起来很先进,你不需要纠结选GPT-4o还是o3还是o4-mini之类的模型了,但实际上……

早在 Claude 的 CEO 就提出过类似的理念 —— 让模型既能快速直觉(系统一),又能深度推理(系统二),而不是二选一。Claude模型从3.7开始也就是这么设计的。

所以OpenAI这波,多少有点跟随者的味道。

发布会最大重点:全力压注编程能力

发布会超过一半时间都在讲「编程能力」和「Agent执行」。

  • 请来了 Cursor 的 CEO 现场演示

  • 实测代码修改、网页生成、Agent 多步骤推理

你从这个重点方向也能看出:

OpenAI很清楚,现在Anthropic靠 Claude 在API市场上抢走了大量写代码的用户和收入

一组数据告诉你,现在OpenAI真有点急

  • OpenAI 总年收入:约 125 亿美元

  • Anthropic 总年收入:约 50 亿美元(其中API收入已反超OpenAI

而且 Anthropic 的 API 收入中,显然主要来自写代码的用户(Cursor、Github Copilot等)。

这也是 OpenAI 为什么在 GPT-5 上要主打「编程」,它是真想在API市场和Anthropic刚一刚。

GPT-5 vs Claude 4.1,代码实测结果来了

我也挑了发布会里两个 GPT-5 展示案例,复制了 Prompt,用 Claude 4.1 在 Cursor 中重跑了一遍。

✅ 案例1:学习法语的卡牌游戏网站

Create a beautiful, highly interactive web app for my partner, an English speaker, to learn French.
Track her daily progress.
Use a highly engaging theme.
Include a variety of activities (e.g., flashcards, quizzes, etc.).
One activity should be a snake-style game in which the snake is replaced by a mouse and the apples are replaced by cheese. Each time the mouse eats a piece of cheese, play a voice-over that introduces a new French word so she can practice pronunciation while playing.
Make it controllable with the arrow keys.
Think before answering. Render everything in canvas.

GPT-5 演示的效果很不错,多个卡牌、页面抽卡逻辑也在线。

但我用 Claude 4.1 复现时,发现页面结构也基本一致,只是交互有点小bug。

结论:表现接近,GPT-5略强,但不是质变。

✅ 案例2:生成创业公司财务看板

Please create a finance dashboard for my Series D startup, which makes digital fidget spinners for Al agents.

The target audience is the CFO and c-suite, to check every day and quickly understand how things are going. It should be beautifully and tastefully designed, with some interactivity, and have clear hierarchy for easy focus on what matters. Use fake names for any companies and generate sample data.
Make it colorful!

Use Next.js and tailwind CSS.

GPT-5 的可视化仪表盘做得很精致。

但 Claude 4.1 给出的交互式图表也几乎一样,甚至细节上更有设计感。

结论:不分上下,我个人更偏爱 Claude 的审美。

那GPT-5到底强在哪?值不值得用?

OpenAI官方当然是放了一堆Benchmark,什么AIME数学 100%,SWE-Bench 74.9%……

但我想说句实话:

这些Benchmark的价值越来越低了。

高强度数理逻辑对普通人来说没意义;从98.4%提升到99%,对真实使用体验没多少帮助;用户更关心的是它是否能帮我写得更好、写得更自然。

最后

GPT-5说实话是有点令人失望了,更像是一次 GPT-4.6 式的升级。

或者,也许,我们再也不应该以2022年11月的ChatGPT、2023年3月的GPT-4那种发布的震撼级别来要求OpenAI了。

OpenAI在那刻时刻就已经完成了他们石破天惊的历史使命,把大语言模型和训练方法带给了全世界。现在模型能力的升级已经进入了深水区,也许我们后面真的只能一次次看到挤牙膏式的性能提升,或者成本降低。

可惜,AGI还没来

幸好,AGI还没来

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3万人堵门三星工厂!员工要求瓜分AI暴利:人均奖金40万美元,否则5月停工18天

3万人堵门三星工厂!员工要求瓜分AI暴利:人均奖金40万美元,否则5月停工18天

CSDN
2026-04-24 18:44:38
徐静雨:火湖G3是The goat之战,湖人今年冥冥之中注定要夺冠

徐静雨:火湖G3是The goat之战,湖人今年冥冥之中注定要夺冠

懂球帝
2026-04-25 12:07:11
夫妻相恋六年恩爱八年,演《八千里路云和月》再走红

夫妻相恋六年恩爱八年,演《八千里路云和月》再走红

奇怪的鲨鱼们
2026-04-25 09:04:44
“只顾自己纹眉,不管女儿死活?”14岁女孩生日照,脸上全是槽点

“只顾自己纹眉,不管女儿死活?”14岁女孩生日照,脸上全是槽点

蝴蝶花雨话教育
2026-04-25 00:45:03
骂了十年中超水货,如今联赛连个能进球的都找不到,我们全骂错了

骂了十年中超水货,如今联赛连个能进球的都找不到,我们全骂错了

圣西罗的太阳
2026-04-25 12:42:40
西甲悬念终结 皇马遭绝平+4轮仅1胜 巴萨或11分领跑 最快下轮夺冠

西甲悬念终结 皇马遭绝平+4轮仅1胜 巴萨或11分领跑 最快下轮夺冠

我爱英超
2026-04-25 06:15:13
拳打特斯拉,脚踢丰田!国产保姆车杀疯了,拿捏一众中产富豪

拳打特斯拉,脚踢丰田!国产保姆车杀疯了,拿捏一众中产富豪

品牌观察官
2026-04-22 16:59:59
1938年,贺子珍在莫斯科给毛主席写信:我生了个孩子,长得很像你

1938年,贺子珍在莫斯科给毛主席写信:我生了个孩子,长得很像你

历史龙元阁
2026-04-25 13:45:05
詹姆斯谈与布朗尼空接:他一直在示意要球,我观察了很久

詹姆斯谈与布朗尼空接:他一直在示意要球,我观察了很久

懂球帝
2026-04-25 11:35:09
眼红啊!工资到账19380.52元,自称“长沙教培牛马”发帖刷爆网络

眼红啊!工资到账19380.52元,自称“长沙教培牛马”发帖刷爆网络

火山詩话
2026-04-24 07:35:54
回归仅7天!国际乒联改口认证马龙,刘国梁的预判终究全部应验

回归仅7天!国际乒联改口认证马龙,刘国梁的预判终究全部应验

刘哥谈体育
2026-04-25 12:23:04
郑钦文2-1逆转仅3小时,下轮对手正式确定:再遇强敌,进16强难了

郑钦文2-1逆转仅3小时,下轮对手正式确定:再遇强敌,进16强难了

侃球熊弟
2026-04-24 22:20:51
切尔西疯了?酝酿请回冠军主帅!蓝军功勋或空降斯坦福桥

切尔西疯了?酝酿请回冠军主帅!蓝军功勋或空降斯坦福桥

澜归序
2026-04-25 05:55:02
邮报:纽卡已经“开摆”,堪称阿森纳现在最理想的对手

邮报:纽卡已经“开摆”,堪称阿森纳现在最理想的对手

懂球帝
2026-04-25 13:33:08
破案!末节为何死用张皓嘉不用崔永熙的原因找到,媒体人道出实情

破案!末节为何死用张皓嘉不用崔永熙的原因找到,媒体人道出实情

南海浪花
2026-04-25 07:30:43
现代级魔改,估计俄罗斯娘家也看傻眼了吧

现代级魔改,估计俄罗斯娘家也看傻眼了吧

三叔的装备空间
2026-04-24 23:53:16
妻子升副局长跟我离婚,半年后我去开会,见她在门口等我2小时

妻子升副局长跟我离婚,半年后我去开会,见她在门口等我2小时

千秋文化
2026-03-25 21:49:57
中际旭创市值突破1万亿,山东诞生新首富

中际旭创市值突破1万亿,山东诞生新首富

中国能源网
2026-04-24 17:42:04
福原爱生三胎后首次露面 日本网友称她与古贺纱里奈站一起像母女

福原爱生三胎后首次露面 日本网友称她与古贺纱里奈站一起像母女

劲爆体坛
2026-04-25 12:44:09
为什么医生不太喜欢送锦旗的患者?原因太扎心

为什么医生不太喜欢送锦旗的患者?原因太扎心

梅斯医学
2026-04-24 07:53:43
2026-04-25 14:24:49
AI进化论花生 incentive-icons
AI进化论花生
AI博主,AppStore付费榜第一的小猫补光灯app开发者
192文章数 112关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

美能源出口创新高 二战以来首次接近成为原油净出口国

头条要闻

美能源出口创新高 二战以来首次接近成为原油净出口国

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

艺术
健康
数码
教育
游戏

艺术要闻

荒废十多年!福建石狮“最美烂尾楼”,德国品牌接盘了

干细胞如何让烧烫伤皮肤"再生"?

数码要闻

华为WATCH Buds 2开售 手表耳机二合一 3488元起

教育要闻

小学教师中硕博士越来越多,超5900名拥有博士学历

任天堂提醒您:吃灰的Switch别忘记充电

无障碍浏览 进入关怀版