网易首页 > 网易号 > 正文 申请入驻

OpenAI发布GPT-5!这是一篇很主观的解读...

0
分享至

凌晨1点,OpenAI 终于发布了万众期待的 GPT-5。

距离 GPT-4 发布,已经过去整整两年半了。我还清晰记得那是2023年的3月14号,距离我从大厂离开还不到一周时间。那个时刻,对AI的兴奋和热情完全掩盖了面对未知前路的恐惧。

在这两年多里,OpenAI其实已经发布了十多个不同的模型(包括什么4o、4.1、4.5、o1、o3、o4……模型名字快赶上显卡厂商了)。

但这次,他们终于喊出了GPT-5的名号。

所以,它到底有什么新变化?值不值得你切换?Claude 4.1 是不是要下岗了?

在展开介绍之前,我们先来看看一个小乌龙:

世界顶级AI公司也能做出这种PPT?

在发布会的图表里,OpenAI展示了一个模型评估的对比:

你看这个数字,52.8 比 69.1 还高,你信吗?

而且,这个错误还不止一次

我服了这个草台班子的世界。

我合理怀疑,这PPT要是让GPT-5自己来做,可能反而更靠谱。

GPT-5 三个版本,立刻上线?

OpenAI这次一口气发布了三个版本的GPT-5 API:GPT-5、GPT-5 Mini、GPT-5 Nano

官网内提供的版本估计也就用这几个大小不一的模型做些小改造。OpenAI官方说是所有用户今天都能用上GPT5。

但截至我写文章时,ChatGPT官网还是老样子,没更新。

反倒是我在Cursor里已经能用上 GPT-5 了,OpenAI:你是不是舔Cursor舔猛了?

这里插播个有趣的小故事,其实OpenAI是Cursor最早的投资者之一,但是随着Claude模型能力的增强,Cursor逐渐和Anthropic变得眉来眼去,经常有深度交流和联合发布了。
但随着现在Anthropic出了个和Cursor正面竞争的Claude Code,这三者的关系又迎来了有趣的变数,敌人的敌人,再次成了朋友。
“自适应思考”:抄了Claude的作业?

这次GPT-5最大的变化之一,是加入了自适应思考能力

也就是说,模型会根据你的问题,动态决定要不要深度思考、思考多久。

这听起来很先进,你不需要纠结选GPT-4o还是o3还是o4-mini之类的模型了,但实际上……

早在 Claude 的 CEO 就提出过类似的理念 —— 让模型既能快速直觉(系统一),又能深度推理(系统二),而不是二选一。Claude模型从3.7开始也就是这么设计的。

所以OpenAI这波,多少有点跟随者的味道。

发布会最大重点:全力压注编程能力

发布会超过一半时间都在讲「编程能力」和「Agent执行」。

  • 请来了 Cursor 的 CEO 现场演示

  • 实测代码修改、网页生成、Agent 多步骤推理

你从这个重点方向也能看出:

OpenAI很清楚,现在Anthropic靠 Claude 在API市场上抢走了大量写代码的用户和收入

一组数据告诉你,现在OpenAI真有点急

  • OpenAI 总年收入:约 125 亿美元

  • Anthropic 总年收入:约 50 亿美元(其中API收入已反超OpenAI

而且 Anthropic 的 API 收入中,显然主要来自写代码的用户(Cursor、Github Copilot等)。

这也是 OpenAI 为什么在 GPT-5 上要主打「编程」,它是真想在API市场和Anthropic刚一刚。

GPT-5 vs Claude 4.1,代码实测结果来了

我也挑了发布会里两个 GPT-5 展示案例,复制了 Prompt,用 Claude 4.1 在 Cursor 中重跑了一遍。

✅ 案例1:学习法语的卡牌游戏网站

Create a beautiful, highly interactive web app for my partner, an English speaker, to learn French.
Track her daily progress.
Use a highly engaging theme.
Include a variety of activities (e.g., flashcards, quizzes, etc.).
One activity should be a snake-style game in which the snake is replaced by a mouse and the apples are replaced by cheese. Each time the mouse eats a piece of cheese, play a voice-over that introduces a new French word so she can practice pronunciation while playing.
Make it controllable with the arrow keys.
Think before answering. Render everything in canvas.

GPT-5 演示的效果很不错,多个卡牌、页面抽卡逻辑也在线。

但我用 Claude 4.1 复现时,发现页面结构也基本一致,只是交互有点小bug。

结论:表现接近,GPT-5略强,但不是质变。

✅ 案例2:生成创业公司财务看板

Please create a finance dashboard for my Series D startup, which makes digital fidget spinners for Al agents.

The target audience is the CFO and c-suite, to check every day and quickly understand how things are going. It should be beautifully and tastefully designed, with some interactivity, and have clear hierarchy for easy focus on what matters. Use fake names for any companies and generate sample data.
Make it colorful!

Use Next.js and tailwind CSS.

GPT-5 的可视化仪表盘做得很精致。

但 Claude 4.1 给出的交互式图表也几乎一样,甚至细节上更有设计感。

结论:不分上下,我个人更偏爱 Claude 的审美。

那GPT-5到底强在哪?值不值得用?

OpenAI官方当然是放了一堆Benchmark,什么AIME数学 100%,SWE-Bench 74.9%……

但我想说句实话:

这些Benchmark的价值越来越低了。

高强度数理逻辑对普通人来说没意义;从98.4%提升到99%,对真实使用体验没多少帮助;用户更关心的是它是否能帮我写得更好、写得更自然。

最后

GPT-5说实话是有点令人失望了,更像是一次 GPT-4.6 式的升级。

或者,也许,我们再也不应该以2022年11月的ChatGPT、2023年3月的GPT-4那种发布的震撼级别来要求OpenAI了。

OpenAI在那刻时刻就已经完成了他们石破天惊的历史使命,把大语言模型和训练方法带给了全世界。现在模型能力的升级已经进入了深水区,也许我们后面真的只能一次次看到挤牙膏式的性能提升,或者成本降低。

可惜,AGI还没来

幸好,AGI还没来

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
89年我救下落水女同桌,她说是我推的,她爹找上门:公了还是私了

89年我救下落水女同桌,她说是我推的,她爹找上门:公了还是私了

秋风专栏
2025-11-07 10:52:33
越扒越深了!网传赵某晖“吞掉”人家装修款,有业主直言她坏良心

越扒越深了!网传赵某晖“吞掉”人家装修款,有业主直言她坏良心

火山诗话
2025-11-18 06:39:29
初中生开窍的规律,还挺准的!

初中生开窍的规律,还挺准的!

好爸育儿
2025-11-17 09:25:09
3-2大逆转!樊振东又赢了,连赢7分打懵梁靖崑,谁注意许昕的表现

3-2大逆转!樊振东又赢了,连赢7分打懵梁靖崑,谁注意许昕的表现

大秦壁虎白话体育
2025-11-18 11:39:05
6国外援候命,高市通知全球,对华打响第二枪,解放军被逼上硬菜

6国外援候命,高市通知全球,对华打响第二枪,解放军被逼上硬菜

桑启红原
2025-11-15 16:03:29
1996年,姚文元出狱后,向中央提两个请求,第二个被一口回绝

1996年,姚文元出狱后,向中央提两个请求,第二个被一口回绝

雍亲王府
2025-11-15 21:50:03
破防了!狗咬人事件追踪:李律师发近20条作品,为申某良无罪辩护

破防了!狗咬人事件追踪:李律师发近20条作品,为申某良无罪辩护

火山诗话
2025-11-17 12:50:06
日本走向不归路?中国要直接敲打

日本走向不归路?中国要直接敲打

杨风
2025-11-17 22:18:15
发小当上公安局长后,竟把我调去守水库!三个月后他突然深夜到访

发小当上公安局长后,竟把我调去守水库!三个月后他突然深夜到访

呆子的故事
2025-11-14 16:18:57
谁在纵容《好东西》这种烂片到处拿奖?

谁在纵容《好东西》这种烂片到处拿奖?

木风的影视剧综Vista
2025-11-17 20:51:38
两家中国公司投产2nm芯片!

两家中国公司投产2nm芯片!

新浪财经
2025-11-17 14:33:37
多部日本电影撤档!院线经理回应《鬼灭之刃》20日停映

多部日本电影撤档!院线经理回应《鬼灭之刃》20日停映

释凡电影
2025-11-18 04:12:09
最新金牌榜:山东40金稳居第一,浙江37金紧追广东,湖北反超河南

最新金牌榜:山东40金稳居第一,浙江37金紧追广东,湖北反超河南

体育就你秀
2025-11-18 11:27:51
山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

山西摔狗反杀案,为何检方认为防卫过当?被告律师一语道破真相

慢半拍sir
2025-11-15 21:23:31
全运女团四强出炉!陈梦率领山东艰难晋级,孙颖莎王曼昱再相遇

全运女团四强出炉!陈梦率领山东艰难晋级,孙颖莎王曼昱再相遇

烧体坛
2025-11-18 13:20:20
暴跌1500点!高市之“祸”拖垮日股,AI泡沫“杀跌”全球?

暴跌1500点!高市之“祸”拖垮日股,AI泡沫“杀跌”全球?

格隆汇
2025-11-18 14:39:03
全运游泳收官!诞生5大赢家,2人失意,2人成未来希望,一项没落

全运游泳收官!诞生5大赢家,2人失意,2人成未来希望,一项没落

篮球圈里的那些事
2025-11-17 21:01:57
杀疯了!狂砍19分30板1助2断3帽!不愧是酷似威少的男人呀!

杀疯了!狂砍19分30板1助2断3帽!不愧是酷似威少的男人呀!

鬼魅突破上篮
2025-11-18 07:42:42
关于供应链转移这事,有业内网友说出了这些细节

关于供应链转移这事,有业内网友说出了这些细节

清晖有墨
2025-11-18 13:29:54
全线大跌!黄金跳水,比特币暴跌!超17万人爆仓!

全线大跌!黄金跳水,比特币暴跌!超17万人爆仓!

证券时报e公司
2025-11-18 12:39:30
2025-11-18 16:23:00
AI进化论花生 incentive-icons
AI进化论花生
AI博主,AppStore付费榜第一的小猫补光灯app开发者
86文章数 24关注度
往期回顾 全部

科技要闻

OPPO Reno15系列深评:实况封神+颜值暴击

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

头条要闻

女子投诉借剪刀被保安限时20分钟还疑遭威胁 酒店回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

曝喻恩泰离婚2年前转移走300箱茅台?

财经要闻

青云租陷兑付危机 集资与放贷的双面生意

汽车要闻

更加豪华 更加全地形 极石ADAMAS

态度原创

旅游
健康
本地
亲子
游戏

旅游要闻

新疆昌吉:天山天池风景区宛如冰雪童话世界

警惕超声报告这六大"坑"

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

亲子要闻

家有“暖心娃”的幸福时光:8岁孩子情绪价值拉满,宝爸心花怒放

《命运石之门 RE:BOOT》延期至明年发售 更多细节将公开

无障碍浏览 进入关怀版