网易首页 > 网易科技 > IT业界 > 正文

OpenAI发布全新GPT-5 外媒:进步显著,但离取代人还很远

0
分享至
核心提示
  • 01 OpenAI于周四正式发布其全新AI模型GPT-5,旨在保持行业领先地位。其首席执行官萨姆·奥特曼称之为一次“重大升级”,表示新模型在编程、创意写作及复杂问题推理方面均有显著提升,并已向所有用户开放。
  • 02 GPT-5被定位为强大的编程工具,旨在实现“软件按需生成”,演示中可在几分钟内生成完整应用。早期测试者称其在构建复杂应用和修复漏洞上表现优越。此外,模型可自动判断所需思考深度,以优化算力与回答质量。
  • 03 媒体评论基调审慎,普遍认为此次属“增量提升”。《金融时报》指出其仍未跳脱范畴,通用人工智能尚未到来。《The Verge》则对发布会上的误导性图表提出质疑,引发了外界对数据准确性的担忧。

8月8日消息,周四,美国人工智能企业OpenAI正式推出备受期待的全新AI模型GPT-5,旨在通过更强大的性能,保持其在激烈竞争中的行业领先地位。

GPT-5于当天的直播活动中正式亮相,其在编程、创意写作以及复杂问题推理等方面的能力均有显著提升。OpenAI首席执行官萨姆·奥特曼(Sam Altman)在本周早些时候的记者吹风会上,称其为公司现有模型的一次“重大升级”,并表示GPT-5首次“真正让人感觉是在与各领域专家直接对话”。

从周四起,OpenAI将向所有用户开放GPT-5。付费客户将享有更高使用额度,Pro会员可访问GPT-5 Pro版本,免费用户在配额用尽后将被切换至GPT-5 mini模型。教育和企业客户预计下周获得访问权限。

近三年前,OpenAI发布的聊天机器人ChatGPT(当时由GPT-3.5驱动)引爆了生成式AI热潮。此后,OpenAI陆续推出了一系列日益复杂的系统,包括可模拟人类推理过程的模型,以及几乎无需人工干预、可代替用户执行任务的AI智能体。

今年以来,围绕GPT-5的猜测甚嚣尘上,其中部分信息源自奥特曼本人的“推波助澜”。 今年4月,他曾表示GPT-5将“比公司最初预期好得多”,近期更直言新模型的能力“让他本人都感到压力”。奥特曼回忆:“我收到一封邮件,问题我没太看懂,于是将其输入GPT-5,结果它给出了完美答案。那一刻,与AI相比,我感觉自己毫无用处。”

OpenAI的ChatGPT团队负责人尼克·特利(Nick Turley)表示,新模型响应速度更快,解答更精准,产生事实性错误的频率也大幅减少。“当你和它对话时,感觉更加自然,”特利说。

作为此次发布的一部分,OpenAI还推出了四种预设“人格”供ChatGPT用户选择,以更好地定制与聊天机器人的互动。这些选项目前以“研究预览”的形式开放,其中包括“犬儒”(Cynic)、机器人(Robot)、“倾听者”(Listener)和“书呆子”(Nerd)。

OpenAI称,GPT-5可自动判断何时需要更深入思考,以及应投入多少时间,从而免去用户在常规大模型与推理系统之间手动切换的麻烦。此机制既可优化算力资源,也能提升回答质量。

尤为关键的是,OpenAI将GPT-5定位为一款强大的编程工具。随着越来越多科技巨头和初创公司推出AI编程助手,“氛围编程(vibe coding)”已成为趋势。奥特曼说:“‘软件按需生成’将成为GPT-5时代的标志性特征。”

在周三的现场演示中,一位研究员展示了如何利用GPT-5快速构建一个用于教英语使用者法语的网页应用。在提出“美观、高度互动”并包含单词卡、测验和一个“老鼠吃奶酪”小游戏的需求后,ChatGPT在几分钟内就生成了完整的软件。

为验证模型能力,OpenAI邀请了多家公司作为早期测试伙伴,其中包括热门AI编程助手Cursor的开发商Anysphere,以及瑞典“氛围编程”初创公司Lovable。

Lovable的联合创始人兼CEO安东·奥西卡(Anton Osika)在接受采访时评价称,GPT-5在快速构建复杂应用方面表现优于其他模型。他举例说,在构建一个内嵌聊天机器人的财务规划应用这类复杂软件时,开发者通常需要反复迭代,但新模型生成的代码更易于维护,并且在修复程序漏洞方面也表现出色。

一次审慎的飞跃:GPT-5性能亮眼,但AGI仍遥远

路透社认为,GPT-5有望继续推动全球商业和文化的变革,但其发布正值AI行业的一个关键时刻。报道援引经济学作家诺亚·史密斯(Noah Smith)的观点称:“到目前为止,企业的AI支出一直相当疲软,但消费者支出则相对强劲……但仅靠消费者的支出,远不足以支撑数据中心所投入的巨额资金。”

《金融时报》也指出,GPT-5在数学、科学与编程方面的能力表现突出,但仍未跳脱“增量提升”的范畴,通用人工智能尚未到来。该报还提到,GPT-5在编程能力基准测试SWE-bench Verified上的得分,略微超过了该领域的领先者Anthropic的最新模型。不过,马斯克旗下xAI公司于上月推出的Grok 4 Heavy模型,在一些评估推理和知识能力的测试中仍优于GPT-5。

尽管新模型在编码和科学问题解决能力上表现亮眼,但部分早期测试用户认为,此次从GPT-4到GPT-5的性能飞跃,并未达到公司前几次产品迭代时的颠覆性程度,且远未达到能完全取代人类的水平。就连奥特曼本人也承认,GPT-5仍然缺乏自主学习能力,而这正是让AI比肩人类能力的关键。

科技媒体The Verge则特别指出,发布会上演示的部分图表存在严重的视觉误导(例如横轴比例失真),引发了外界对GPT-5透明度及数据准确性的质疑。奥特曼事后承认这是一个“重大图表失误”,并表示营销团队已道歉并公布了修正后的图表。

彭博社认为,OpenAI发布GPT-5,是其应对来自中美AI企业激烈竞争的最新举措。尽管OpenAI长期领跑AI市场,但如今正面临多方挑战,其中不乏来自前员工和盟友的竞争。谷歌、Anthropic以及由OpenAI联合创始人埃隆·马斯克创办的xAI,都已发布了对标OpenAI的推理模型和智能体产品,并全力角逐AI辅助编程市场。与此同时,像DeepSeek这样的中国公司也在迅速崛起。Meta更是投入巨资为新成立的AI实验室招募顶尖人才,甚至不惜从OpenAI直接挖走了十多名员工。

为了保持领先优势,目前估值高达3000亿美元的OpenAI已筹集到数百亿美元资金,用于支付构建和支持GPT-5等尖端模型所需的人才、芯片和数据中心费用。据报道,OpenAI还在就潜在的员工售股进行初步谈判,估值约为5000亿美元。

其核心护城河依然是家喻户晓的聊天机器人ChatGPT。作为公司各种付费服务的“门户产品”,ChatGPT的周活跃用户已近7亿,付费企业用户达500万。为进一步扩大影响力,OpenAI本周三表示,将以每年1美元的象征性费用向美国联邦机构提供ChatGPT的访问权限;本周早些时候,公司还发布了两款免费开源模型,以应对来自DeepSeek和Meta的竞争。

美联社指出,GPT模型的更新是衡量生成式AI发展进程的关键指标,备受业界关注。市场之所以对GPT-5抱有极高期望,很大程度上是因为OpenAI长期以来都将自身的技术迭代,描绘为一条通往通用人工智能(AGI)的必经之路。

康奈尔大学计算机科学助理教授约翰·锡克斯顿(John Thickstun)认为,从技术层面看,GPT-5在最新基准测试中显示出“适度但显著的改进”,且与GPT-4相比,其架构已焕然一新,这可能为未来的创新奠定基础。他补充道:“我并非‘工作终结论’的信徒,也不认为AI能解决人类的所有问题。但我坚信,OpenAI及该领域的其他参与者,在持续改进技术方面仍有巨大的探索空间,而不是仅仅满足于对现有成果的利用。”

高德纳(Gartner)分析师奇拉格·德卡特(Chirag Dekate)则给出了更为审慎的评价:“GPT-5在技术性能方面符合预期,在任务推理和编码方面有所提升,但在其他领域则表现平平……其在写作质量上只是渐进式的提升。”

分析普遍认为,即便只是渐进式的提升,在OpenAI与竞争对手的商业博弈中也具有重要意义。(辰辰)

延伸阅读
相关推荐
热点推荐
沧州杀妻案金某判死刑,吓得大小便失禁,哭着后悔认错,太晚了!

沧州杀妻案金某判死刑,吓得大小便失禁,哭着后悔认错,太晚了!

鋭娱之乐
2025-12-09 19:46:05
别酸闵超 26 岁当博导了,他的核心论文比你想象的硬

别酸闵超 26 岁当博导了,他的核心论文比你想象的硬

觉叔说
2025-12-10 12:43:34
6万人前,33岁孙兴慜含泪挥别热刺:10年太短,希望你们别忘掉我

6万人前,33岁孙兴慜含泪挥别热刺:10年太短,希望你们别忘掉我

风过乡
2025-12-10 07:40:01
山姆超市致歉“自有MM烘焙麻薯吃出老鼠”:订单地址存在鼠害

山姆超市致歉“自有MM烘焙麻薯吃出老鼠”:订单地址存在鼠害

财中社
2025-12-09 18:37:20
全球 TOP10 手机排名:iPhone 17 Pro Max 太恐怖了

全球 TOP10 手机排名:iPhone 17 Pro Max 太恐怖了

刘奔跑
2025-12-09 23:39:02
2012年,广东老板参加宴请后失踪,13年后托梦妻子:我在车库里

2012年,广东老板参加宴请后失踪,13年后托梦妻子:我在车库里

农村情感故事
2025-12-06 07:32:53
0-3哑火!张本智和被打懵,狂吼变沉默,邱党用3板杀招打回原形

0-3哑火!张本智和被打懵,狂吼变沉默,邱党用3板杀招打回原形

番茄体坛
2025-12-10 14:02:18
沉默48小时,林剑一锤定音,中方不买美国次级芯片,黄仁勋踩刹车

沉默48小时,林剑一锤定音,中方不买美国次级芯片,黄仁勋踩刹车

触摸史迹
2025-12-09 09:17:03
39岁何洁现身活动,一头金发很显黑,小腿粗壮,网友:感觉好邋遢

39岁何洁现身活动,一头金发很显黑,小腿粗壮,网友:感觉好邋遢

章眽八卦
2025-12-10 11:24:44
马斯克「开颅插针」首破1.5秒!上万人挤爆,争当赛博格

马斯克「开颅插针」首破1.5秒!上万人挤爆,争当赛博格

新智元
2025-12-08 12:24:12
南非多地发生涉中国公民绑架等恶性案件!驻南非大使馆再次发布安全提醒:保持言行低调不露富,外出不佩戴贵重首饰

南非多地发生涉中国公民绑架等恶性案件!驻南非大使馆再次发布安全提醒:保持言行低调不露富,外出不佩戴贵重首饰

每日经济新闻
2025-12-09 19:37:11
老太破坏修路路面后续:民警走了又挖,村干部曝真相,子女被牵连

老太破坏修路路面后续:民警走了又挖,村干部曝真相,子女被牵连

观察鉴娱
2025-12-10 09:37:00
德云社风波又起!北京西城文旅评论区沦陷,中国曲协站台力挺…

德云社风波又起!北京西城文旅评论区沦陷,中国曲协站台力挺…

火山詩话
2025-12-10 06:40:45
WTT总决赛:前世界第1开门黑!陈熠兑现第2个局点,11-6领先!

WTT总决赛:前世界第1开门黑!陈熠兑现第2个局点,11-6领先!

刘姚尧的文字城堡
2025-12-10 15:07:18
数览中国脉动|稳扎稳打!我国实体经济底盘更稳固

数览中国脉动|稳扎稳打!我国实体经济底盘更稳固

新华社
2025-12-10 09:14:55
人民日报副总编辑公开表达不满:我困惑很久,不吐不快!

人民日报副总编辑公开表达不满:我困惑很久,不吐不快!

霹雳炮
2025-12-08 22:03:16
比美国B2还先进!轰20造价有多贵?印专家:一架能抵20架歼20战机

比美国B2还先进!轰20造价有多贵?印专家:一架能抵20架歼20战机

混沌录
2025-11-30 10:36:04
婚姻法新规:非夫妻关系的男女自愿同居,如果被查到了...

婚姻法新规:非夫妻关系的男女自愿同居,如果被查到了...

谭老师地理大课堂
2025-12-09 18:24:33
重庆男子飞无人机偶然发现崖洞,洞内有一具干尸,当事人:洞内有塑料瓶子、毛毯和人类的衣服

重庆男子飞无人机偶然发现崖洞,洞内有一具干尸,当事人:洞内有塑料瓶子、毛毯和人类的衣服

极目新闻
2025-12-10 10:28:53
WTT总决赛:首个单打8强诞生!男乒名将一轮游,林昀儒4-2开门红

WTT总决赛:首个单打8强诞生!男乒名将一轮游,林昀儒4-2开门红

郝小小看体育
2025-12-10 12:59:18
2025-12-10 16:32:49

科技要闻

8周生死时速,全员保日活!

头条要闻

26岁研究员任浙大博导 校方:程序规范 接受社会监督

头条要闻

26岁研究员任浙大博导 校方:程序规范 接受社会监督

体育要闻

试训20支球队,落选,成为NBA新秀助攻王

娱乐要闻

孙俪扛住死亡镜头 网友:嬛嬛回来了

财经要闻

白银史上首次站上60美元

汽车要闻

零百2.5s 纯电保时捷Cayenne Turbo新车图解

态度原创

艺术
亲子
本地
时尚
公开课

艺术要闻

40张海边撒野照片,真是太有创意了!

亲子要闻

王雷李小萌晒娃引热议,儿子长相被说像“返祖”,家庭宠爱藏玄机

本地新闻

打工人梦想中的生活,宠物已经提前过上了

今年冬天一定要拥有的6件衣服,谁穿谁好看!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×