网易首页 > 网易号 > 正文 申请入驻

GPT-5不够惊喜

0
分享至

千呼万唤,GPT-5面世了。一键生成网页、写作像诗人、更懂健康问题,OpenAI称它将彻底改变人们工作、学习及创新方式。但许多人表示,这次GPT-5并没有带来更多的惊喜,反倒是价格策略成了此次发布的最大亮点。GPT-5上线后,社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用。

"博士级专家"

自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。2020年GPT-3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过"上下文学习"能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。

两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。

美东时间8月7日,OpenAI正式发布GPT-5。新模型发布后,OpenAI联合创始人、首席执行官萨姆·奥尔特曼在一场访谈中表示,相比于GPT-4,GPT-5不仅能解答各种难题,更能实现即时的、按需的软件开发,并将彻底改变人们工作、学习及创新方式。

奥尔特曼用三个身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的"博士级专家",能够随时助力用户达成各种复杂目标。

OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。

值得一提的是,在访谈中,奥尔特曼表示,GPT-5在健康建议方面的能力显著提升,它的答案更准确、幻觉更少,更有可能告知真正的病因和应对措施。奥尔特曼还表示,在2035年,人们将能借助这些工具治愈或至少有效治疗许多目前仍在困扰人类的疾病。

在奥尔特曼看来,在GPT-8时代,人们可以利用这一AI工具治疗某种癌症。比如,GPT-8会先遍历所有现存的研究与数据,并提出治疗思路。随后告知用户:"我需要你找一个实验室完成这9个实验,并反馈结果。"

边际收益递减

近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。

但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。

从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。

OpenAI在发布会上还特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:"GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。"但他随即话锋一转:"然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。"

"GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。"AI营销与销售专家、太和智库研究员唐兴通分析指出,"我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。"

他认为,AI的发展正面临两大物理限制:"我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。"

不过,不少人表示价格很"香"。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。

缺少温度

最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。

庞大的用户规模,帮助ChatGPT的商业收入再创新高。曾有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元的年度经常性收入,成为全球最大的AI创业公司。它的最大竞争对手Anthropic同期收入预计仅为50亿美元。

不过,OpenAI的挑战也显而易见。尤其是在企业级市场,OpenAI的市场份额正在迅速被竞争对手蚕食。近期,海外投资机构Menlo Ventures发布的一份报告显示,Anthropic在企业大语言模型市场占有率已达32%。相比之下,OpenAI的市场份额仅为25%。

ChatGPT-5上线后,不少用户发现OpenAI停用了GPT-4o版本。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。用户对GPT-5的"吐槽",主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。

面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用"显示旧版模型"访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。

针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。

奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。

北京商报记者 赵天舒

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国大满贯:女单4席晋级,申裕斌横扫,早田希娜战韩莹

美国大满贯:女单4席晋级,申裕斌横扫,早田希娜战韩莹

赵或是个热血青年
2026-07-01 08:57:38
单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

单局2-11惨败心态不崩!蒯曼3-1力克华裔老将,下轮大战韩国一姐

钉钉陌上花开
2026-07-01 10:41:57
史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

史上唯一被灭绝的民族,因过于凶残被各族联合剿杀,名字很耳熟!

小莜读史
2026-06-24 13:27:56
为什么高校会延长硕士、博士的学制?

为什么高校会延长硕士、博士的学制?

文忆天下
2026-07-01 14:48:20
张凌赫:我连心疼你,都隔着整整一段时差

张凌赫:我连心疼你,都隔着整整一段时差

陈意小可爱
2026-07-01 15:27:56
“泼天的富贵落到我头上?”重庆29岁工人世界杯预测32中31

“泼天的富贵落到我头上?”重庆29岁工人世界杯预测32中31

新浪财经
2026-07-01 12:34:49
生日尾数大有说法!0-9各有命格,晚年享福的人大多是这几个数字

生日尾数大有说法!0-9各有命格,晚年享福的人大多是这几个数字

宝哥精彩赛事
2026-07-01 10:17:05
卢卡申科出席儿子北大毕业典礼:中国最大特点是……

卢卡申科出席儿子北大毕业典礼:中国最大特点是……

观察者网
2026-07-01 10:16:04
7-2,死亡小组全军覆没,1夺冠热门倒下,冠军将在3支胜利队产生

7-2,死亡小组全军覆没,1夺冠热门倒下,冠军将在3支胜利队产生

我就是一个说球的
2026-07-01 15:49:26
比赛还剩3天,阿根廷先迎来一个超级大喜讯,取胜佛得角彻底稳了

比赛还剩3天,阿根廷先迎来一个超级大喜讯,取胜佛得角彻底稳了

零度眼看球
2026-07-01 09:08:01
搬去印度的代价,iPhone18全泄露,天价罚单后,苹果再遭重锤

搬去印度的代价,iPhone18全泄露,天价罚单后,苹果再遭重锤

王新喜
2026-06-30 18:30:27
57岁奥运冠军:宋凯去中国足协升官发财!疆超主教练睡队员家长

57岁奥运冠军:宋凯去中国足协升官发财!疆超主教练睡队员家长

念洲
2026-07-01 09:06:46
李克勤的儿子面相惊人,有混血的模样

李克勤的儿子面相惊人,有混血的模样

动物奇奇怪怪
2026-07-01 14:06:34
宝马最新X5混动内饰曝光,这处设计让老车主集体沉默

宝马最新X5混动内饰曝光,这处设计让老车主集体沉默

体坛观察猿
2026-07-01 00:03:20
新一届港姐亮相红毯,这审美又回来了

新一届港姐亮相红毯,这审美又回来了

娱你同欢
2026-06-28 20:48:27
走面风波升级,“一言不发”的冯小刚,终于不再顾及所谓的体面!

走面风波升级,“一言不发”的冯小刚,终于不再顾及所谓的体面!

摸爬滚打的烙印
2026-06-29 07:20:54
杯子离开视线千万别喝!100mg“伟哥”下肚,比你想象的更可怕!

杯子离开视线千万别喝!100mg“伟哥”下肚,比你想象的更可怕!

宝哥精彩赛事
2026-07-01 02:17:07
别笑梅威瑟破产,他的死局,90%的有钱人都逃不掉!

别笑梅威瑟破产,他的死局,90%的有钱人都逃不掉!

格斗时代
2026-06-30 20:34:39
李连杰首度公开回应不管前妻两女儿:她们曾被送回北京由奶奶带大,但利智给前妻女儿买房留钱到100岁

李连杰首度公开回应不管前妻两女儿:她们曾被送回北京由奶奶带大,但利智给前妻女儿买房留钱到100岁

背包旅行
2026-06-29 15:13:56
Windhorst:勇士将在明早尝试签下自由球员勒布朗-詹姆斯

Windhorst:勇士将在明早尝试签下自由球员勒布朗-詹姆斯

林子说事
2026-07-01 10:47:33
2026-07-01 17:27:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
287004文章数 300125关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

头条要闻

女生考驾照留下心理阴影 还被练车的"人情世故"整崩溃

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

张凌赫:我连心疼你都隔着时差

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

交付持续攀升再破纪录 零跑6月全球交付93376台

态度原创

家居
教育
房产
数码
公开课

家居要闻

传奇筑 日常诗

教育要闻

来!测测你对中考作文的认知吧,敢吗?

房产要闻

洋房盛大交付,中海丨南海·叁號院献映世界海岸的人居答案

数码要闻

九州风神推出冰域420一体式水冷散热器,649元

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版