网易首页 > 网易号 > 正文 申请入驻

GPT-5不够惊喜

0
分享至

千呼万唤,GPT-5面世了。一键生成网页、写作像诗人、更懂健康问题,OpenAI称它将彻底改变人们工作、学习及创新方式。但许多人表示,这次GPT-5并没有带来更多的惊喜,反倒是价格策略成了此次发布的最大亮点。GPT-5上线后,社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用。

"博士级专家"

自2018年OpenAI发布首个大模型GPT-1以来,GPT系列已经走过了七年。2020年GPT-3的出现,让大模型参数规模从15亿直接拓展到了1750亿,也因此通过"上下文学习"能力,摆脱了对大量标注数据的依赖,使大模型能够开始作为效率工具使用。

两年后,基于GPT-3.5构建的对话式模型ChatGPT上线,进一步推动大模型走入C端日常,成为通用AI应用的重要落地转折点。随后GPT-4的全面升级,更是在实现万亿级模型参数的同时,让大模型在单纯文本输出的基础上,实现了图像的交互提升。

美东时间8月7日,OpenAI正式发布GPT-5。新模型发布后,OpenAI联合创始人、首席执行官萨姆·奥尔特曼在一场访谈中表示,相比于GPT-4,GPT-5不仅能解答各种难题,更能实现即时的、按需的软件开发,并将彻底改变人们工作、学习及创新方式。

奥尔特曼用三个身份,类比了公司三代旗舰模型的演进:GPT-3像是偶有灵光闪现但常伴挫败感的高中生;GPT-4则如同具备了真实智慧与实用价值的大学生;而最新的GPT-5,则被誉为可以按需召唤的"博士级专家",能够随时助力用户达成各种复杂目标。

OpenAI声称,GPT-5在超高难度的科学问题上刷新了世界纪录,并在与人类专家的对比测试中,有近70%的场景表现更优。此外,GPT-5还与现有的o系列模型进行了无缝整合,能够根据任务的复杂性,自动选择最佳的推理路径。官方数据显示,GPT-5在代码生成和写作领域的准确率均高于GPT-4系列,部分内部测试中的错误率甚至下降了约80%。

值得一提的是,在访谈中,奥尔特曼表示,GPT-5在健康建议方面的能力显著提升,它的答案更准确、幻觉更少,更有可能告知真正的病因和应对措施。奥尔特曼还表示,在2035年,人们将能借助这些工具治愈或至少有效治疗许多目前仍在困扰人类的疾病。

在奥尔特曼看来,在GPT-8时代,人们可以利用这一AI工具治疗某种癌症。比如,GPT-8会先遍历所有现存的研究与数据,并提出治疗思路。随后告知用户:"我需要你找一个实验室完成这9个实验,并反馈结果。"

边际收益递减

近两年,随着AI工具开始席卷各行各业,人们渴望AI能够取代重复繁琐的工作,也在担忧自己是否会被AI所取代,这也是GPT-5发布前备受关注的原因之一。

但相比此前GPT-3到GPT-4所带来的全方位升级,许多人表示,这次GPT-5并没有带来更多的惊喜,从发布会规模、产品亮点到性能升级,都显得较为平庸,相较当前主流SOTA模型,提升幅度并不显著。

从第三方的基准测试数据来看,GPT-5相较于竞争对手的旗舰模型,其领先优势也微乎其微。根据Artificial Analysis的综合排名,GPT-5目前虽然位列第一,但其综合得分仅比自家的老模型o3高出两分,比Grok 4仅高出一分。而在被誉为AGI终极测试的Arc Prize竞赛中,GPT-5更是被Grok 4大幅超越。

OpenAI在发布会上还特别强调了GPT-5在代码生成和写作方面的能力。然而,用户的实际使用体验,似乎并未完全印证官方的说法。Meta公司的一位工程师体验GPT-5后在社交媒体上感叹道:"GPT-5仅用一次调用就重构了我的整个代码库:25个工具调用,3000多行新代码,12个全新的文件。"但他随即话锋一转:"然而,这些代码都无效(无法正常工作),虽然确实写得很漂亮。"

"GPT-5不太可能‘超越一切预期’,因为大模型的边际收益正在迅速递减。"AI营销与销售专家、太和智库研究员唐兴通分析指出,"我们今天所看到的所谓‘进步’,更多是来自于工程层面的调优和多模态能力的融合,而非纯粹的智能层面上的突破。"

他认为,AI的发展正面临两大物理限制:"我们必须清醒地认识到,‘数据墙’是客观存在的,高质量的公共训练数据正在被快速耗尽。同时,算力成本的指数级增长,也让过去那种‘大力出奇迹’的暴力美学难以为继。"

不过,不少人表示价格很"香"。GPT-5的API调用价格仅为前几日发布的Claude Opus 4.1的1/15,显著低于Gemini 2.5 Pro,在当前大模型市场上展现出极强的性价比。

缺少温度

最新数据显示,今年8月ChatGPT周活跃用户已达7亿,同比增长4倍。其付费用户数从2024年的300万增至500万,Pro会员和企业版用户贡献了超60%的收入。

庞大的用户规模,帮助ChatGPT的商业收入再创新高。曾有媒体报道,截至今年7月末,OpenAI预计将实现120亿美元的年度经常性收入,成为全球最大的AI创业公司。它的最大竞争对手Anthropic同期收入预计仅为50亿美元。

不过,OpenAI的挑战也显而易见。尤其是在企业级市场,OpenAI的市场份额正在迅速被竞争对手蚕食。近期,海外投资机构Menlo Ventures发布的一份报告显示,Anthropic在企业大语言模型市场占有率已达32%。相比之下,OpenAI的市场份额仅为25%。

ChatGPT-5上线后,不少用户发现OpenAI停用了GPT-4o版本。社交媒体出现不少关于GPT-5使用感不佳的吐槽,更有用户直呼"还我GPT-4o"。用户对GPT-5的"吐槽",主要集中在新模型虽提升了回答的专业度,但却缺少了情感交互的温度、个性及想象力。

面对用户争议,OpenAI发文宣布,重新上线GPT-4o,供Plus和Team用户使用,若需多平台使用,用户可在ChatGPT网页版设置中启用"显示旧版模型"访问GPT-4o。与此同时,下周还将推出迷你版GPT-5和GPT-5 thinking。

针对用户对GPT-5的负面反馈,奥尔特曼解释称,这是由于自动切换器损坏,致使GPT-5表现异常。他表示,未来将专注于完成GPT-5的部署与改进,并确保其稳定性。奥尔特曼同时透露,GPT-5上线后,ChatGPT API流量在24小时内翻倍增长,OpenAI正在全力优化系统并寻找更多的容量。但他坦言,预计下周仍将面临严峻的容量挑战。

奥尔特曼坦言,低估了用户对GPT-4o的喜爱程度,并表示这强化了公司为不同用户提供定制化服务的理念,未来将推出比当前更多的定制化内容。同时,其宣布将允许Plus用户继续使用GPT-4o,并将密切关注用户使用情况,考虑旧版本模型的保留期限。

北京商报记者 赵天舒

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央视主持人突然集体落泪 工作与亲情到底谁更重要 真相让人心头一紧

央视主持人突然集体落泪 工作与亲情到底谁更重要 真相让人心头一紧

草莓解说体育
2026-03-29 05:06:39
55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

55年授衔,当主席看到名单中有个熟悉的名字,大笔一挥:他不是少将

睡前讲故事
2025-12-12 13:58:11
中国下重手,AI顶会NeurIPS迅速滑跪,为禁止华为等公司参会道歉

中国下重手,AI顶会NeurIPS迅速滑跪,为禁止华为等公司参会道歉

混沌录
2026-03-28 16:12:19
农村家长晒5个儿子,被网友群嘲:送外卖都费劲,还为国效力呢?

农村家长晒5个儿子,被网友群嘲:送外卖都费劲,还为国效力呢?

今朝牛马
2026-03-27 18:23:13
疯了!特朗普要把霍尔木兹改名“特朗普海峡”

疯了!特朗普要把霍尔木兹改名“特朗普海峡”

老马拉车莫少装
2026-03-28 19:41:22
46岁张柏芝三亚被拍,那一圈“软乎乎”的肉,让网友集体破防

46岁张柏芝三亚被拍,那一圈“软乎乎”的肉,让网友集体破防

手工制作阿歼
2026-03-28 11:43:19
女排3-8名确定!庄宇珊受伤福建降级,王梦洁发文,江苏拿冠军点

女排3-8名确定!庄宇珊受伤福建降级,王梦洁发文,江苏拿冠军点

排球黄金眼
2026-03-29 00:46:54
惊天逆转!杨瀚森绝杀马刺,逆转引发广泛讨论!

惊天逆转!杨瀚森绝杀马刺,逆转引发广泛讨论!

我是阿Sen
2026-03-28 14:42:52
油价破9!骂油价涨的人不知道,越南已经涨了30%!中国有三张底牌

油价破9!骂油价涨的人不知道,越南已经涨了30%!中国有三张底牌

近史博览
2026-03-29 02:23:45
大家要做好准备,若不出意外的话,下个月,楼市或将迎来4大转变

大家要做好准备,若不出意外的话,下个月,楼市或将迎来4大转变

平说财经
2026-03-28 14:39:10
俄媒:伊朗战争迫使海湾君主们重新审视世界并与美国梦彻底告别

俄媒:伊朗战争迫使海湾君主们重新审视世界并与美国梦彻底告别

茶韵浮生
2026-03-29 05:35:58
吉林女歌手与知名男演员,宣布结婚生子

吉林女歌手与知名男演员,宣布结婚生子

新浪财经
2026-03-28 22:00:57
穿过霍尔木兹海峡

穿过霍尔木兹海峡

经济观察报
2026-03-28 18:18:18
中国已无需武统?美专家:美军白忙一场,解放军已有不战而胜之法

中国已无需武统?美专家:美军白忙一场,解放军已有不战而胜之法

有牙的兔纸
2026-02-25 00:44:28
阚清子产后首登红毯,穿最多引热议,遮肉还是怕冷?

阚清子产后首登红毯,穿最多引热议,遮肉还是怕冷?

明星爆料客
2026-03-28 16:57:14
都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

都熟知西游记,那东游记、南游记、北游记,分别都是什么书?

长风文史
2026-03-27 16:31:57
邵佳一赛前霸气喊话:既要态度还要结果!张玉宁:兄弟们上去就干

邵佳一赛前霸气喊话:既要态度还要结果!张玉宁:兄弟们上去就干

念洲
2026-03-28 12:47:14
特斯拉网约车停车场被曝光,大量 Model Y 标配后摄像头清洗装置!

特斯拉网约车停车场被曝光,大量 Model Y 标配后摄像头清洗装置!

新浪财经
2026-03-27 15:53:03
苹果用户7年不换机,电池崩了后ChatGPT给了个反常识解法

苹果用户7年不换机,电池崩了后ChatGPT给了个反常识解法

硬核玩家2哈
2026-03-26 14:27:05
泽连斯基:美方正施压乌克兰撤出顿巴斯

泽连斯基:美方正施压乌克兰撤出顿巴斯

财联社
2026-03-28 22:55:19
2026-03-29 06:51:00
北京商报 incentive-icons
北京商报
北京商报社隶属于中共北京市委宣传部,由北京日报报业集团主管主办
278245文章数 300014关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

头条要闻

美媒:和欧盟"外长"发生激烈交锋 鲁比奥"显然很恼火"

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

本地
游戏
数码
公开课
军事航空

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

《异替》现已登陆Steam

数码要闻

苹果或重启与长江存储合作 国行机型拟采用国产NAND

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军中东基地损失最新披露

无障碍浏览 进入关怀版