网易首页 > 网易号 > 正文 申请入驻

终于,GPT-5发布了,也被喷惨了

0
分享至

  划重点:

  1、期盼2年的GPT-5终于在如期而至,超过那些全球最聪明的大模型,达到博士水平。

  2、GPT-5目前已面向普通用户提供免费、plus和Pro三种模式;同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。

  3、OpenAI直播期间出现重大失误,播出的性能图表被网友怒喷。

  作者 常远

  编辑重点君

  GPT-5,终于在深夜出炉。

  以为很震惊,以为很惊艳???确实有。

  但先来看一张图:

  OpenAI到底是如何做到在全球直播的场合展示Benchmark,竟然能把52.8显示得比69.1都高,甚至这个69.1能跟30.8平齐的???

  其它的不谈,单就这一点,开场直接号称“博士水平”的AI,就这么水灵灵地“按需缩放”坐标系,也是引得网友怒喷不已。

  甚至Altman都赶忙出来转移话题,称技术博客上是正确的……

  确实,技术博客确实是有所更正。

  但如此失误,着实不应该,毕竟大家都等了2年啊!

  博士水平的AI,来了

  不过有一说一,除了这个被大众诟病的致命失误之外,GPT-5在现场的表现还算是可圈可点。

  在技术博客中,OpenAI开场直接一句:“迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。”

  这次发布的GPT-5拥有四个版本:

  GPT-5:在不同领域中进行Coding和执行任务的标准模式;

  GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景;

  GPT-5 nano:强调运行速度和性价比;

  GPT-5 Chat:ChatGPT中使用的版本。

  GPT-5目前已面向普通用户提供免费、plus和Pro三种模式。

  同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。

  不仅如此,承接昨天时隔6年的开源,OpenAI表示这次GPT-5面向所有人,免费!并且是博士水平的那种。

  我们先来看下Benchmark。

  最让人吸睛的,还是GPT-5在AIME 2025的表现,直接拿下满分的成绩。

  其次就是编程能力,相较于o3和4o,GPT-5在思考模式加持之下,达到了74.9%的水平。

  除此之外,这个模型在多种多模态评测中表现出色,覆盖了图像、视频、空间理解和科学推理等方面。

  更强的多模态能力,意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容,或者回答关于图示的问题。

  而且比较罕见的是,第三方的大模型竞技场(Imarena.ai)也是及时跟进,直接发声表明:“全方面第一”

  具体而言,竞技场涉及的内容包括:文本、Web开发、视觉、编程、数学、创造力、长查询等。

  由此可见,GPT-5从目前评测标准来看,确实是AI大模型的卫冕之王。

  再看效果

  成绩是一方面,但实际效果才是硬道理。

  深谙此理的Sam Altman在自己的X账号上也是立马跟进,发布了由GPT-5生成的效果:

  并且Altman还表示,有GPT-5权限的用户,只需发送“use beatbot to make a sick beat to celebrategpt-5”即可体验。

  不多不说,营销这块,Altman还是非常手拿把掐的。

  不过在直播的现场演示过程中,GPT-5还是有不少惊艳的表现在身上的。

  例如让GPT-5生成一个学语法的APP,效果是这样的:

  不要以为是简单的网站,除了可以完成市面上AI的交互之外,它在里面还可以内嵌一个小游戏(点击“Mouse&Cheese”):

  并且若是想改变APP里面的内容,只要一句话,瞬间(现场实测)就可以改变布局:

  对于更加庞大且复杂的项目,例如现场OpenAI展示了用GPT-5先编程出来的代码:

  在运行之后,便得到了一个3D效果的“世界”:

  总而言之,从现场效果来看,GPT-5也是担得起“最聪明、最强编程”的大模型。

  “观众”们买单吗?

  从目前X上“观众”的反馈来看,讨论最激烈的就是前面我们提到的图表bug。

  甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误:

  不过另一方面,老东家微软CEO火速出面站台,并配有一个“爱心”图片以表支持:

  再如开发者们常用的VS Code,官方也是Day 0无缝衔接GPT-5:

  不过对于普罗大众来说,反馈声音最大的莫过于:“说好的免费,我的ChatGPT咋没有呢?”

  总而言之,用户到底买不买单,实测效果到底有没有那么神,需要让子弹再飞一会了。

  1、https://openai.com/index/introducing-gpt-5/

  2、https://x.com/EgeErdil2/status/1953505551570415718

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中一签赚38.9万!“易中天”概念股刷新A股上市首日最贵开盘价

中一签赚38.9万!“易中天”概念股刷新A股上市首日最贵开盘价

21世纪经济报道
2026-04-24 11:35:22
美伊将进行第二轮谈判,美防长:谈判底线是“伊朗不可能获得核弹”,对伊朗封锁已扩展至全球范围,34艘船只在霍尔木兹海峡被勒令折返

美伊将进行第二轮谈判,美防长:谈判底线是“伊朗不可能获得核弹”,对伊朗封锁已扩展至全球范围,34艘船只在霍尔木兹海峡被勒令折返

鲁中晨报
2026-04-24 21:04:06
华晨宇抚仙湖项目叫停!中国顶级淡水命脉,绝不给流量资本让路

华晨宇抚仙湖项目叫停!中国顶级淡水命脉,绝不给流量资本让路

离离言几许
2026-04-24 07:25:41
31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

31人抢一辆严重受损8400元起拍的小鹏汽车,有人出36800元拍下,法院称车主已在车祸中身亡

极目新闻
2026-04-24 17:49:19
北控78-94不敌宁波无缘季后赛,刘晓宇18+7,廖三宁16+5

北控78-94不敌宁波无缘季后赛,刘晓宇18+7,廖三宁16+5

懂球帝
2026-04-24 21:36:07
26岁女子因常年脚冷,习惯穿着袜子睡觉,脚趾甲变“千层糕”,最终不得不接受拔甲治疗

26岁女子因常年脚冷,习惯穿着袜子睡觉,脚趾甲变“千层糕”,最终不得不接受拔甲治疗

观威海
2026-04-24 09:12:16
中际旭创市值突破1万亿,山东诞生新首富

中际旭创市值突破1万亿,山东诞生新首富

中国能源网
2026-04-24 17:42:04
中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

中央纪委国家监委公开通报八起违反中央八项规定精神典型问题

新华社
2026-04-24 17:05:33
原村支书开铲车当着民警面把人埋了?网友质疑民警未及时制止;山西代县公安局:已向警督部门反馈,正处置

原村支书开铲车当着民警面把人埋了?网友质疑民警未及时制止;山西代县公安局:已向警督部门反馈,正处置

大风新闻
2026-04-24 17:19:02
人社部、财政部通知:支持大学毕业生“回炉”读技校

人社部、财政部通知:支持大学毕业生“回炉”读技校

深度报
2026-04-23 22:43:47
范志毅:只有一次02世界杯不光彩;我认为足球改革春天来了

范志毅:只有一次02世界杯不光彩;我认为足球改革春天来了

懂球帝
2026-04-24 21:15:10
大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

大闹亚航的假空姐社会性死亡!“底裤”被扒,正脸流出,十级美颜

翰飞观事
2026-04-24 19:39:03
泡泡玛特:4月30日发售两款Labubu冰箱,售价5999元,每款全球限量发售999台

泡泡玛特:4月30日发售两款Labubu冰箱,售价5999元,每款全球限量发售999台

鲁中晨报
2026-04-24 20:08:07
腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」

腾讯发布了 7 个座舱智能体,汽车的意义从「空间位移」走向了「时间价值」

爱范儿
2026-04-24 17:22:23
当不成总统了?美国四位前总统集体发声,打响扳倒特朗普的第一枪

当不成总统了?美国四位前总统集体发声,打响扳倒特朗普的第一枪

军机Talk
2026-04-24 12:07:37
芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

芯片松绑4个月,中国一块也没买,中国不急美国急,形势反转了

王新喜
2026-04-23 20:37:56
DeepSeek-V4上线国家超算互联网

DeepSeek-V4上线国家超算互联网

界面新闻
2026-04-24 19:25:45
5月1日严查开始,家里有车、开店的抓紧办!别等罚单找上门

5月1日严查开始,家里有车、开店的抓紧办!别等罚单找上门

黑哥讲现代史
2026-04-24 04:46:42
广东91-93不敌福建 球员评价:4人优秀,8人低迷

广东91-93不敌福建 球员评价:4人优秀,8人低迷

篮球资讯达人
2026-04-24 21:36:08
被原村支书驾铲车推土掩埋村民仍在医院输液,辟谣“警察围观” 说法,警察到场后立即制止

被原村支书驾铲车推土掩埋村民仍在医院输液,辟谣“警察围观” 说法,警察到场后立即制止

红星新闻
2026-04-24 20:05:42
2026-04-24 22:32:49
划重点KeyPoints incentive-icons
划重点KeyPoints
去除噪音,划下重点 追踪全球AI科技,记录中国硬核崛起 沟通?一把把一伞一久耳久久漆
200文章数 18关注度
往期回顾 全部

科技要闻

DeepSeek V4牵手华为,价格依然"屠夫级"

头条要闻

航班提前起飞10分钟 大学生把海航告了

头条要闻

航班提前起飞10分钟 大学生把海航告了

体育要闻

里程碑之战拖后腿,哈登18分8失误

娱乐要闻

停工16个月!赵露思证实接拍新剧

财经要闻

LG财阀内斗:百亿美元商业帝国争夺战

汽车要闻

零跑Lafa5 Ultra北京车展上市:11.88-12.48万

态度原创

亲子
健康
本地
旅游
公开课

亲子要闻

韩国叔叔又来看小满了 看看小叔子说话那个表情 笑死...

干细胞如何让烧烫伤皮肤"再生"?

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

旅游要闻

蓉城花正好 “我心中的成都最美赏花地”指南发布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版