网易首页 > 网易号 > 正文 申请入驻

GPT-5不够惊喜

0
分享至

千呼万唤,GPT-5面世了。一键生成网页、写作像诗人、更懂健康问题,OpenAI称它将彻底改变人们工作、学习及创新方式。但许多人表示,这次GPT-5并没有带来更多的惊喜,反倒是价格策略成了此次发布的最大亮点。GPT-5上线后,社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用。


"博士级专家"

自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。2020年GPT-3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过"上下文学习"能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。

两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。

美东时间8月7日,OpenAI正式发布GPT-5。新模型发布后,OpenAI联合创始人、首席执行官萨姆·奥尔特曼在一场访谈中表示,相比于GPT-4,GPT-5不仅能解答各种难题,更能实现即时的、按需的软件开发,并将彻底改变人们工作、学习及创新方式。

奥尔特曼用三个身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的"博士级专家",能够随时助力用户达成各种复杂目标。

OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。

值得一提的是,在访谈中,奥尔特曼表示,GPT-5在健康建议方面的能力显著提升,它的答案更准确、幻觉更少,更有可能告知真正的病因和应对措施。奥尔特曼还表示,在2035年,人们将能借助这些工具治愈或至少有效治疗许多目前仍在困扰人类的疾病。

在奥尔特曼看来,在GPT-8时代,人们可以利用这一AI工具治疗某种癌症。比如,GPT-8会先遍历所有现存的研究与数据,并提出治疗思路。随后告知用户:"我需要你找一个实验室完成这9个实验,并反馈结果。"

边际收益递减

近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。

但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。

从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。

OpenAI在发布会上还特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:"GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。"但他随即话锋一转:"然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。"

"GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。"AI营销与销售专家、太和智库研究员唐兴通分析指出,"我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。"

他认为,AI的发展正面临两大物理限制:"我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。"

不过,不少人表示价格很"香"。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。

缺少温度

最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。

庞大的用户规模,帮助ChatGPT的商业收入再创新高。曾有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元的年度经常性收入,成为全球最大的AI创业公司。它的最大竞争对手Anthropic同期收入预计仅为50亿美元。

不过,OpenAI的挑战也显而易见。尤其是在企业级市场,OpenAI的市场份额正在迅速被竞争对手蚕食。近期,海外投资机构Menlo Ventures发布的一份报告显示,Anthropic在企业大语言模型市场占有率已达32%。相比之下,OpenAI的市场份额仅为25%。

ChatGPT-5上线后,不少用户发现OpenAI停用了GPT-4o版本。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。用户对GPT-5的"吐槽",主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。

面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用"显示旧版模型"访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。

针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。

奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。

北京商报记者 赵天舒

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
深圳小学生“A”级评价从90分变85分?家长们不淡定了

深圳小学生“A”级评价从90分变85分?家长们不淡定了

音乐时光的娱乐
2026-02-02 15:00:54
新华社消息|伊朗总统:战争既不符合伊朗利益也不符合美国利益

新华社消息|伊朗总统:战争既不符合伊朗利益也不符合美国利益

新华社
2026-02-01 10:37:07
留学一年嘴都变大了?女留学生“面相变化图”走红

留学一年嘴都变大了?女留学生“面相变化图”走红

没有偏旁的常庆
2026-02-02 06:10:03
全球首次!宇树机器人-47.4℃极寒行走13万步:走出冬奥雪面图案

全球首次!宇树机器人-47.4℃极寒行走13万步:走出冬奥雪面图案

快科技
2026-02-01 15:37:05
有色金属行业资金流出榜:紫金矿业、北方稀土等净流出资金居前

有色金属行业资金流出榜:紫金矿业、北方稀土等净流出资金居前

证券时报
2026-02-02 17:23:06
安徽一男子参加公司年会,先后抽中10万元彩票和苹果17ProMax,活动负责人:纯运气,无暗箱操作

安徽一男子参加公司年会,先后抽中10万元彩票和苹果17ProMax,活动负责人:纯运气,无暗箱操作

台州交通广播
2026-02-01 18:08:46
牢A命中,被一窝端16人都是女留学生

牢A命中,被一窝端16人都是女留学生

雪中风车
2026-01-28 13:23:54
学医后才知道,冠心病前最危险的信号,不是心脏疼,而是这5症状

学医后才知道,冠心病前最危险的信号,不是心脏疼,而是这5症状

医学科普汇
2026-01-23 09:46:27
具俊晔揭幕大S雕像哭红眼,S妈白了头,小S肿脸,儿女缺席引热议

具俊晔揭幕大S雕像哭红眼,S妈白了头,小S肿脸,儿女缺席引热议

银河史记
2026-02-02 17:05:31
两个95后华人,搞出硬件版Clawdbot,售价1700元

两个95后华人,搞出硬件版Clawdbot,售价1700元

量子位
2026-02-02 12:01:03
“很晦气,这房子不敢住了!” 杭州夫妻买房2年后得知一个消息,想退房了

“很晦气,这房子不敢住了!” 杭州夫妻买房2年后得知一个消息,想退房了

潇湘晨报
2026-01-31 10:38:17
恩爱难抵残酷现实,向太撕开刘德华婚姻滤镜,朱丽倩承受了太多

恩爱难抵残酷现实,向太撕开刘德华婚姻滤镜,朱丽倩承受了太多

喜欢历史的阿繁
2026-01-31 15:21:28
曝40岁C罗拒为胜利出战!2大原因致其罢赛 不满引援+金主偏心新月

曝40岁C罗拒为胜利出战!2大原因致其罢赛 不满引援+金主偏心新月

我爱英超
2026-02-02 07:02:39
虽败犹荣!广东队惨败却收重大喜讯,杜锋留了一手

虽败犹荣!广东队惨败却收重大喜讯,杜锋留了一手

宗介说体育
2026-02-02 10:35:13
打脸!马斯克曾说多次拒绝爱泼斯坦,邮件内容曝光,清醒人设崩了

打脸!马斯克曾说多次拒绝爱泼斯坦,邮件内容曝光,清醒人设崩了

八斗小先生
2026-02-02 09:44:38
台湾2025人均GDP近4万美元,22年首超日韩

台湾2025人均GDP近4万美元,22年首超日韩

老马拉车莫少装
2026-02-01 21:45:43
给《太平年》演技最好的演员排个名:朱亚文第七,倪大红第三

给《太平年》演技最好的演员排个名:朱亚文第七,倪大红第三

立场影视
2026-02-02 16:45:14
2月2日人民币对美元中间价调贬17个基点

2月2日人民币对美元中间价调贬17个基点

证券时报
2026-02-02 09:31:07
特朗普:世界“很快会看到”哈梅内伊的警告是否正确

特朗普:世界“很快会看到”哈梅内伊的警告是否正确

新华社
2026-02-02 11:05:02
俞敏洪:陈行甲已到新东方报到

俞敏洪:陈行甲已到新东方报到

澎湃新闻
2026-02-02 18:06:08
2026-02-02 19:31:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
273439文章数 299950关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

时尚
旅游
亲子
健康
艺术

普通人衣服没必要买太多,准备好这些单品,简单实用又耐看

旅游要闻

回家的路就是最美的风景

亲子要闻

孩子出现5种症状,可能是白血病

耳石症分类型,症状大不同

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

无障碍浏览 进入关怀版