网易首页 > 网易号 > 正文 申请入驻

GPT-5:没有AGI,失望和天花板,最具竞争力的可能是定价

0
分享至

GPT-5 发布速记:

刚看完GPT-5发布会,我对GPT-5整体感觉都已经在标题里了

整个发布会一上来就出现多个错误图片,瞬间刷爆整个网络

而Sam Altman 一直在发推说GPT-5有多好,比如代码能力远超vibecoding的范围

市场对GPT-5比较失望,OpenAI在polymarket惨败

专家认为:GPT-5开发过于仓促,模型已经撞墙

就像大家知道的那样GPT-5有三个型号,是一个包含快速回答、深度思考和智能路由器的统一系统,能自主判断问题难度,决定是秒回还是深度思考,也可以通过提示词引导它think hard about this

所有人都可以免费访问,plus用量多一些,pro用户可以访问最多计算量

GPT-5基础性能

可以这么说:

GPT-5 是没有推理能力的 o4.5,GPT-5-mini 是没有推理能力的 o4.5-mini。GPT-5-nano 本质上是 GPT-4.2。GPT-5-thinking 是带有少量推理能力的 o4.5。GPT-5-pro 是带有并行推理能力的 o4.5,而 o4.5 是带有推理能力的 GPT-4.5+

GPT-5在ARC-AGI 1和ARC-AGI 2表现不佳,还不如Grok 4

GPT-5在大模型竞技场排第一,这个看看就好了

在人类最后的考试中就比ChatGPT Agent表现好一点,问题是ChatGPT Agent也比较鸡肋啊

训练截止时间:2024年知识截止,这个真的很糟,看起来确实是人类产生的的数据不够了?不过OpenAI的研发人员说GPT-5证明了合成数据的有效

400k 上下文窗口,符合预期

非多模态输入

GPT-5的幻觉症状明显改善,幻觉暴降80%

GPT-5 定价

GPT-5最大的亮点可能是极具竞争力的价格,定价与谷歌的Gemini 2.5 pro持平了,这个要表扬一下了,毕竟谷歌推理用的自己的芯片

GPT-5代码能力

OpenAI专门给开发者写了一个blog ,比较详细的说明了GPT-5代码能力,拉来了一大堆伙伴站台,比如cusor,windsurf,初步评价很猛,但是究竟与Claude 相比怎么样还是未知数

curor ceo评价:

GPT-5 是我们使用过的最智能的编码模型。我们的团队发现 GPT-5 非常智能,易于操控,甚至拥有我们在其他任何模型中都未曾见过的个性。它不仅能捕捉棘手、隐藏深层的 bug,还能运行长时间、多轮的后台代理,将复杂的任务进行到底——这类问题过去常常让其他模型陷入困境。它已经成为我们日常工作的驱动力,从范围界定和规划 PR,到完成端到端构建,无所不包

Windsurf 工程主管评价:

GPT-5 在我们的内部评估中处于 SOTA 阶段,该评估衡量了模型在现实世界软件工程任务中的表现。我们还发现,该模型的工具调用错误率仅为其他前沿模型的一半。它始终能够以连贯、易懂的方式解决复杂任务

具体的评估参数我就不放了,大家感兴趣可以去这里看:

https://openai.com/index/introducing-gpt-5-for-developers/

大家看后续测试吧,总结来说,感觉GPT-5是一个努力了很久的拼凑的模型,没有GPT-3到GPT-4的惊艳和震撼,更谈不上AGI

参考:

https://openai.com/index/introducing-gpt-5/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

这才是宋美龄和继子蒋经国的一张真实合影,都是真人的容貌

喜欢历史的阿繁
2026-04-16 11:17:28
刘晓庆没了假发直接秒变路人,头发严重影响一个人的颜值

刘晓庆没了假发直接秒变路人,头发严重影响一个人的颜值

阿废冷眼观察所
2026-04-22 13:05:39
祭拜鬼社当天,日本发出崩溃预警,美欧视而不见,中国不再伸援手

祭拜鬼社当天,日本发出崩溃预警,美欧视而不见,中国不再伸援手

阿伧说事
2026-04-22 10:54:35
贵州网红晓浪哥去世,仅34岁,爱在墓地拍视频,早给自己选好墓地

贵州网红晓浪哥去世,仅34岁,爱在墓地拍视频,早给自己选好墓地

奇思妙想草叶君
2026-04-21 16:24:04
火狐把VPN塞进浏览器,免费午餐能吃吗?

火狐把VPN塞进浏览器,免费午餐能吃吗?

报错免疫体
2026-04-22 00:36:29
特朗普没料到:霍尔木兹危机打醒中国,一个万亿级产业开始爆发

特朗普没料到:霍尔木兹危机打醒中国,一个万亿级产业开始爆发

触摸史迹
2026-04-22 12:45:25
欧洲人终于发现了:俄乌闹4年了,合着是华强北在打代理人战争?

欧洲人终于发现了:俄乌闹4年了,合着是华强北在打代理人战争?

用冷眼洞悉世界
2026-04-22 02:23:19
缺口超50%!光模块核心材料,国产化提速!龙头股暴涨超60倍

缺口超50%!光模块核心材料,国产化提速!龙头股暴涨超60倍

数据宝
2026-04-22 07:39:19
10万亿经营贷,要兜不住了

10万亿经营贷,要兜不住了

新浪财经
2026-04-22 03:04:25
对着士兵遗体干这事?以色列再破底线:活人打仗,死人传宗接代

对着士兵遗体干这事?以色列再破底线:活人打仗,死人传宗接代

嫹笔牂牂
2026-04-22 09:54:51
曾经那些真实的特供,超出普通人的想象…

曾经那些真实的特供,超出普通人的想象…

深度报
2026-04-21 22:56:47
就在刚刚!广东官宣2米11中锋加盟!离队第1人出炉,不是奎因

就在刚刚!广东官宣2米11中锋加盟!离队第1人出炉,不是奎因

老吴说体育
2026-04-22 11:59:40
正负值-22!开拓者战胜马刺,验出头号软肋,占了杨瀚森出场时间

正负值-22!开拓者战胜马刺,验出头号软肋,占了杨瀚森出场时间

球场没跑道
2026-04-22 11:30:48
退休安排有变!公务员弹性延迟退休取消,新方案已确定

退休安排有变!公务员弹性延迟退休取消,新方案已确定

一口娱乐
2026-04-22 05:02:00
郑州街头车辆发生自燃!车主慌神挪车遭 "二次暴击"

郑州街头车辆发生自燃!车主慌神挪车遭 "二次暴击"

新动察
2026-04-22 09:03:10
外院缝合被同行怒批:瞎胡闹,游医水平!一个真让做,一个真敢做

外院缝合被同行怒批:瞎胡闹,游医水平!一个真让做,一个真敢做

新浪财经
2026-04-22 12:10:58
涉嫌严重违纪违法!东莞信托原董事张孟军被查

涉嫌严重违纪违法!东莞信托原董事张孟军被查

南方都市报
2026-04-22 15:49:15
牌局终了:王石,潘石屹和许加印

牌局终了:王石,潘石屹和许加印

蓝钻故事
2026-04-22 01:33:24
不是芯片不是稀土!中方突然打出"王炸",西方完全没料到这一手

不是芯片不是稀土!中方突然打出"王炸",西方完全没料到这一手

聚焦最新动态
2026-04-21 08:52:38
原作者摊牌:Windows任务管理器CPU占用全是假的 压根没做实时统计

原作者摊牌:Windows任务管理器CPU占用全是假的 压根没做实时统计

快科技
2026-04-21 12:28:14
2026-04-22 16:32:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1036文章数 396关注度
往期回顾 全部

科技要闻

对话梅涛:没有视频底座,具身智能走不远

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

头条要闻

媒体:爱奇艺AI艺人库惹众怒 CEO龚宇的解释站不住脚

体育要闻

网易传媒再度签约法国队和阿根廷队

娱乐要闻

复婚无望!baby黄晓明陪小海绵零交流

财经要闻

伊朗拒绝出席 特朗普宣布延长停火期限

汽车要闻

纯电续航301km+激光雷达 宋Pro DM-i飞驰版9.99万起

态度原创

艺术
教育
时尚
亲子
家居

艺术要闻

无花不风景

教育要闻

第8课-Sightseeing + taking photos 观光旅游和拍照

初夏穿赫本的白裤子,清新又高级!

亲子要闻

很难想象弟弟最后的表情是在想什么

家居要闻

极简绘梦 克制和谐

无障碍浏览 进入关怀版