网易首页 > 网易号 > 正文 申请入驻

GPT-5不够惊喜

0
分享至

千呼万唤,GPT-5面世了。一键生成网页、写作像诗人、更懂健康问题,OpenAI称它将彻底改变人们工作、学习及创新方式。但许多人表示,这次GPT-5并没有带来更多的惊喜,反倒是价格策略成了此次发布的最大亮点。GPT-5上线后,社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用。

"博士级专家"

自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。2020年GPT-3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过"上下文学习"能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。

两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。

美东时间8月7日,OpenAI正式发布GPT-5。新模型发布后,OpenAI联合创始人、首席执行官萨姆·奥尔特曼在一场访谈中表示,相比于GPT-4,GPT-5不仅能解答各种难题,更能实现即时的、按需的软件开发,并将彻底改变人们工作、学习及创新方式。

奥尔特曼用三个身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的"博士级专家",能够随时助力用户达成各种复杂目标。

OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。

值得一提的是,在访谈中,奥尔特曼表示,GPT-5在健康建议方面的能力显著提升,它的答案更准确、幻觉更少,更有可能告知真正的病因和应对措施。奥尔特曼还表示,在2035年,人们将能借助这些工具治愈或至少有效治疗许多目前仍在困扰人类的疾病。

在奥尔特曼看来,在GPT-8时代,人们可以利用这一AI工具治疗某种癌症。比如,GPT-8会先遍历所有现存的研究与数据,并提出治疗思路。随后告知用户:"我需要你找一个实验室完成这9个实验,并反馈结果。"

边际收益递减

近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。

但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。

从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。

OpenAI在发布会上还特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:"GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。"但他随即话锋一转:"然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。"

"GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。"AI营销与销售专家、太和智库研究员唐兴通分析指出,"我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。"

他认为,AI的发展正面临两大物理限制:"我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。"

不过,不少人表示价格很"香"。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。

缺少温度

最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。

庞大的用户规模,帮助ChatGPT的商业收入再创新高。曾有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元的年度经常性收入,成为全球最大的AI创业公司。它的最大竞争对手Anthropic同期收入预计仅为50亿美元。

不过,OpenAI的挑战也显而易见。尤其是在企业级市场,OpenAI的市场份额正在迅速被竞争对手蚕食。近期,海外投资机构Menlo Ventures发布的一份报告显示,Anthropic在企业大语言模型市场占有率已达32%。相比之下,OpenAI的市场份额仅为25%。

ChatGPT-5上线后,不少用户发现OpenAI停用了GPT-4o版本。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。用户对GPT-5的"吐槽",主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。

面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用"显示旧版模型"访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。

针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。

奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。

北京商报记者 赵天舒

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《妻子浪漫旅行》最尴尬的夫妻,话少还装甜蜜,没李纯马頔自然

《妻子浪漫旅行》最尴尬的夫妻,话少还装甜蜜,没李纯马頔自然

一娱三分地
2026-04-09 19:22:11
67施工员哭诉:我退休金8000,有房有存款,可就是没有人愿意嫁我

67施工员哭诉:我退休金8000,有房有存款,可就是没有人愿意嫁我

施工员小天哥
2026-04-09 08:45:57
上海女博士在家8年未出门,警察破门后,看到屋内景象顿时傻眼了

上海女博士在家8年未出门,警察破门后,看到屋内景象顿时傻眼了

诡谲怪谈
2025-05-02 00:08:52
甘肃天水一佳人好漂亮, 身高168cm,体重48kg 美的让人移不开眼

甘肃天水一佳人好漂亮, 身高168cm,体重48kg 美的让人移不开眼

乡野小珥
2026-04-08 00:48:57
录音门事件:欧尔班与普京通话曝光,匈牙利大选最后一刻生变

录音门事件:欧尔班与普京通话曝光,匈牙利大选最后一刻生变

民间胡扯老哥
2026-04-10 01:03:46
全球能源咽喉再关闭油轮紧急返航,美媒曝超级油轮过海峡需缴200万美元,伊朗每天允许不超过15艘船只通过霍尔木兹海峡

全球能源咽喉再关闭油轮紧急返航,美媒曝超级油轮过海峡需缴200万美元,伊朗每天允许不超过15艘船只通过霍尔木兹海峡

每日经济新闻
2026-04-09 23:24:00
又躺了!仅打4分钟退赛,32场啊,生涯新低,3年1亿要打水漂

又躺了!仅打4分钟退赛,32场啊,生涯新低,3年1亿要打水漂

球童无忌
2026-04-09 22:30:27
女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

女子假信佛与多位高僧发生不当关系,秘密录制5600段视频。

特约前排观众
2026-02-09 00:05:05
特朗普准备打“世界大战”?

特朗普准备打“世界大战”?

合赞历史
2026-04-09 13:23:40
迟重瑞,已皈依佛门,不生孩子家族显赫,财富差距掩盖了他的才华

迟重瑞,已皈依佛门,不生孩子家族显赫,财富差距掩盖了他的才华

混沌录
2026-04-09 18:45:25
1931年她在咖啡馆多坐了十分钟,救下整个党中央,活到110岁

1931年她在咖啡馆多坐了十分钟,救下整个党中央,活到110岁

鹤羽说个事
2026-04-07 22:55:09
1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

1950年志愿军摸进美军炮兵阵地,发现24门重炮,营长当场违抗命令

鉴史录
2026-04-09 20:22:15
伊朗副外长:伊朗代表团将前往伊斯兰堡参加谈判

伊朗副外长:伊朗代表团将前往伊斯兰堡参加谈判

财联社
2026-04-09 21:17:17
藤蔓,不要再读téng màn了!丢不起那个人!

藤蔓,不要再读téng màn了!丢不起那个人!

未央看点
2026-04-08 05:50:07
达美乐外卖员顺手做了这件小事,收到4万刀小费!(不是扔垃圾)

达美乐外卖员顺手做了这件小事,收到4万刀小费!(不是扔垃圾)

新欧洲
2026-04-08 19:44:20
王思聪韩国约会“小金晨”,女伴五官立体超美!网友向懒懒告密

王思聪韩国约会“小金晨”,女伴五官立体超美!网友向懒懒告密

娱乐团长
2026-04-09 20:20:59
陈光标最新回应捐1000万用途:无条件信任李亚鹏,钱怎么有效怎么用

陈光标最新回应捐1000万用途:无条件信任李亚鹏,钱怎么有效怎么用

现代快报
2026-04-09 22:35:02
房贷集体缩水,银行开始慌了

房贷集体缩水,银行开始慌了

大川东山再起
2026-04-09 15:20:42
为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

为什么WTO很少被提起了?中国入世谈判花了15年,如今几乎被架空

古史青云啊
2026-04-07 14:52:09
郑丽文访陆没上新闻联播?别乱猜,原因很简单

郑丽文访陆没上新闻联播?别乱猜,原因很简单

靓仔情感
2026-04-10 01:58:19
2026-04-10 09:55:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
279374文章数 300024关注度
往期回顾 全部

科技要闻

程序员惊喜,每月100美元!OpenAI推新套餐

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

头条要闻

牛弹琴:巴基斯坦被以色列激怒了 这是一个不祥的信号

体育要闻

8万人面前心脏骤停 现在他还站在球场上

娱乐要闻

金莎官宣结婚 与老公孙丞潇相差18岁

财经要闻

AI短剧"买脸"成风 肖像生意成灰色产业

汽车要闻

文飞掌舵,给神行者带来了什么?

态度原创

健康
时尚
房产
家居
本地

干细胞抗衰4大误区,90%的人都中招

越来越流行的松弛感穿搭,照着穿就很好看

房产要闻

利润暴跌44%!那个春节被骂惨了的海峡股份 正在经历什么?

家居要闻

清新自然 复古风尚

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

无障碍浏览 进入关怀版