全文 4,000字 | 阅读约 13 分钟
(OpenAI GPT-5发布会 Sam Altman演讲精彩片段)
2025年 8 月 8 日,OpenAI 正式发布 GPT-5。
这是一次技术发布,但又不只是技术发布。
如果说过去的 ChatGPT 只是“一个聪明的对话者”,那么 GPT-5,已经变成了一个可以“上岗干活”的行动者。
正如 OpenAI CEO Sam Altman 所说:
“每周 7 亿人都在用 ChatGPT,但 GPT-5,才是真正把 AI 从‘对话者’变成‘行动者’的升级。”
不仅能回答问题、写摘要、写代码,GPT-5 现在还能完成整套工作任务:从理解需求、思考路径、生成内容、编写前端、调试后端,到最终上线一个可用的产品。
这标志着 AI“动手能力”的全面爆发。
更关键的是,这股热潮已经突破了科技圈的界限。GPT-5 发布后立即面向全体 ChatGPT 用户开放,免费用户也能直接使用。
(网页版GPT-5界面:内置思考功能,每次都给出最佳答案)
接下来,我们不谈技术参数,只看实际表现——
AI 究竟是怎样从助手变成“工作伙伴”的。
第一节|GPT-5 有多聪明?像博士团队一样懂你
“GPT-3 像和一个高中生对话,GPT-4o 像大学生,而 GPT-5,就像在和一个博士聊天。”
这不是夸张,而是 Sam Altman 对 GPT 智能演进的直观类比。
这一次,OpenAI 把聪明变成了有用——不仅反应更快、答得更准,还能听懂长故事、记住关键细节、持续接住话头,甚至主动想下一步该怎么帮你做事。
他们在现场展示了四项能力升级,你只要看懂这四点,就知道 GPT-5 为什么已经不是聊天机器人了。
升级一:记忆扩大 100 倍,一次能看懂整本书
(上下文窗口提升到了 400K tokens)
GPT-5 的上下文窗口提升到了 400K tokens,相当于 30 万字左右。
OpenAI 工程团队成员 Michelle 在演讲中强调:“我们不仅把窗口拉长了,还让模型在这个超长内容中保持理解力。”
什么意思?
你可以一次性扔给它一本长文档、一天会议纪要,甚至是过去几周的聊天记录,它能看得完、记得住、提取关键点,不用你重复提醒。
这背后的意义是:AI 第一次可以参与一个任务的完整过程,而不是只处理一小段信息。
升级二:思考时间自适应,不急不慢刚刚好
以前,用 ChatGPT 时你可能会遇到这种情况:
问一个简单问题,它反而写了五段;
提个复杂任务,它却几秒钟就敷衍回答。
GPT-5 改变了这一点。
正如首席研究官 Mark Chen 所说:
“以前你得在快与慢之间选,现在 GPT-5 会自己判断什么时候该快、什么时候该深思。”
GPT-5引入了推理机制(Reasoning),能够在回答前进行深度思考,用户还可以查看模型的思考过程。简单说,它会在内部分步骤理清思路再给你答复,而且你还能点开看它是怎么想的。
这是不是很像一个实习生不但在干活,还主动和你汇报我为什么这么做。
升级三:答得更准,幻觉也更少
(GPT 5幻觉问题上的进展显著)
OpenAI 这次特别强调了一件事:准确率。
在以往的大模型里,很多人诟病的是“它说得像真的,但其实不对”,专业术语叫“幻觉”。
GPT-5 针对这个问题做了系统优化,重点提升了三类任务的可靠性:
复杂的开放式问题
医疗、法律等高风险领域
有多个参考资料的总结性任务
Max(后训练团队负责人)在现场说:
“我们设计了一套全新的测评方法,不光测答案对不对,还测模型能不能‘做对事’。”
在健康相关问题上,GPT-5 被评为目前最靠谱的模型,比 GPT-4o 的表现要高一个级别。
这也为后面演示中的“癌症报告解读”“日程自动规划”等任务打下了基础。
升级四:全面提升编程、数学、视觉等动手能力
(GPT-5系列模型智能基准测试成绩,展现在数学和科学推理方面的突破性表现)
GPT-5 不只会回答问题,做起事来也很厉害。
比如编程能力,它在 SWEBench(模拟真实软件工程任务)中创下新纪录。
在视觉推理方面,它在 MMMU(看图找问题)测试中打败了市面上绝大多数模型,甚至超过很多人类专家。
在数学推理方面,它在 2025 年的 AIME(奥数预选赛)上得分超越 GPT-4 和 Claude。
一句话总结就是:写代码、做题、看图、做决定,它都能上场。
“我们不是做了一个更大的模型,而是一个更懂得如何帮人完成事的模型。” ——OpenAI 首席研究官 Mark Chen
GPT-5 的这些变化,背后有很多技术细节,但对普通人来说,最直接的感受只有一句话:
以前,你用 AI 是问它怎么做;
现在,你可以直接让它去做了。
第二节|它不只聊天,是真的在干活
GPT-5 到底怎么“干活”的?
OpenAI 用一整场发布会做了回答。
这不是 PPT 演示,也不是功能对比表格,而是一场人机协作的现场实战:从学术辅导到程序开发,从动画制作到网站建设,从文本到图形,GPT-5 每一次都切实完成了实际工作。。
他们没有讲大道理,而是让你看 AI 是怎么被用起来的。
以下是 3 个关键演示,值得你一次看懂。
演示一:让孩子懂“伯努利效应”?
主持人 Elaine 给 GPT-5 一个简单请求:
“帮我复习一下伯努利效应和飞机的形状。”
GPT-5 秒回,先讲清了“气流越快,压力越小”的原理,然后 Elaine 追加了一句:
“能不能再做个动画,展示气流和升力?”
这时候 GPT-5 停下来“想了一下”,然后开始写代码。
几秒钟后,现场屏幕上出现了一个能动的模拟画面:两条气流穿过机翼上方,下方显示压力变化,甚至还带滑动条让你调整风速和攻角。
Elaine 当场惊叹:
“我一句话,它就给我写了 200 多行前端代码。”
不仅如此,GPT-5 还自动生成了代码的注释,并写了思路说明:“为了实现动画,我选择了 React 和 Tailwind,并在 SVG 中模拟了流体变化。”
你可以不懂编程,但你一定能看懂一个事实:
过去你要请一个工程师 + 一个设计师,今天只需要一句话。
演示二:想给伴侣做个法语学习网站?
GPT-5 不只做个“演示用小程序”,它还能完成一套完整产品。
OpenAI 研究员 Yan 给它的任务是:
“帮我为伴侣做一个法语学习网站,要有抽认卡、测验,还有个小游戏。”
GPT-5 开始执行了——不是单步操作,而是自己“拆任务、开工干”。
它的流程包括:
生成网站结构(Next.js)
写前端样式(Tailwind)
构建功能页面(学习卡片、练习测验)
嵌入小游戏(“老鼠吃奶酪”的法语版贪吃蛇)
不到 5 分钟,Yan 点开页面,网站已经上线运行。
点击“测验”按钮,一张卡片跳出来:“non = 不”。
点击小游戏,一个动画老鼠出场,每吃到一块奶酪,就跳出一个法语单词发音:“bonjour!”
Yan 总结说:
“它不只是把网站拼出来了,而是真的理解我想做的是什么。”
演示三:CFO 想做财务看板?
现场另一位研究员 Adi 给 GPT-5 的指令更像“工作任务”:
“为一家创业公司的 CFO 做一套财务仪表盘,要美观、有交互,能展示收入趋势。”
GPT-5 回应得像一个团队成员:
先选了框架(Next.js)
再生成 KPI 模块、收入曲线图、客户细分视图
自动搭建文件结构,补上说明文档
最后运行代码、打开端口,真正上线展示
当画面打开时,现场观众看到的是一个可以点、可以滑动的“真·财务看板”。
Adi 边操作边说:
“它自动配色、对齐元素,甚至加了鼠标悬停后的数据浮动提示,这些我以前至少要写两天。”
更神的是,GPT-5 在过程中发现了一个前端 bug,自己回滚、重新编译,自动修复,整个过程不需要人工插手。
这就是自主发现问题并进行修复的能力。
这些演示传达了一个清晰的信号:GPT-5 不仅理解你的需求,更能将想法真正落地实现。
第三节|开发者试完 GPT-5:这活,它真能接
发布会上的演示已经说明了一件事:
GPT-5 不只是“写几行代码”,而是开始接近真实工作场景。
但更关键的是——它不光能“做”,还能和人配合着做事情。
这节里,我们就来看一个开发者的视角:当你把 AI 拉进你的项目,它到底帮了多大的忙?
Cursor CEO 现身说法:GPT-5 是编程的最佳拍档
Michael Truell 是 AI 编程工具 Cursor 的联合创始人兼 CEO。他是第一批拿到 GPT-5 的开发者之一。
他在发布会上讲了个真实场景:我们把 GPT-5 丢进代码库,让它试着找出架构设计上的重点……几分钟内它不仅找到了我们用于远程执行代码的组件,还理解了我们为什么这样设计,是为了安全性。
这件事的意义在于:
GPT-5 不是只读代码,它能读懂“背后的思路”。
Michael 说得很直白:
“这本来是需要人花几周时间理解的决策,它几分钟搞定了。”
一次修 Bug 演示:GPT-5 整个流程跑通了
为了验证 GPT-5 的“实战能力”,他们在发布会上现场试了一个难题:
找出并修复 OpenAI 官方 Python SDK 的一个 Github 问题,这个 bug 已经挂了三周都没人解决。
GPT-5 是怎么干的?
它的操作流程如下:
自己读取整个代码库
搜索关键词,定位可疑模块
主动写出“我要这么改的原因”
修改代码,跑测试,构建上线
发现 lint 警告,自己判断无关,忽略
打包完毕,准备合并 PR
过程中,它会主动向开发者同步状态:
“我正在搜索关键路径……接下来将修改 upload_pdf() 函数……已定位问题出在 MIME 类型处理……”
你不用懂技术也能听出来,它干得比很多实习生还利索。
当被问及是否试过自己修复时,演示者 Brian 坦白承认:"我试过,我做不到……GPT-5 修好了。"
后来 Cursor 的 CEO Michael 补充说:
"我们用GPT-5处理实际工作代码库,它能发现非常复杂的架构问题,这些决策我们团队花了几周时间才想通。"
开发者怎么用它?不只是让它写,而是和它一起做
OpenAI 联合创始人兼总裁 Greg Brockman 问了 Michael 一个关键问题:
你觉得开发者怎么才能把 GPT-5 真正用起来?
Michael 回答:
“用它做你的真活。不是玩玩,而是让它直接参与你的项目。”
他还总结了 GPT-5 作为同事的几个关键特点:
有上下文感:知道前面聊过什么,能顺着做下去
沟通能力强:会告诉你它的计划,出错时能解释原因
可以回溯:你说它错了,它不会死犟,而是按你说的改回来
风格可调:你可以设定它是“安静型”还是“多话型”开发者
会自己 debug:出错时会查日志、调代码、重跑测试,不是出错就罢工 这些行为,已经非常接近一个“真正的合作者”。
Michael 说得很清楚:这不再是‘把代码交给 AI 生成’,而是你和 AI 一起开发、一起上线。
GPT-5 干的事,不只是“把事做了”,而是能适应人类的工作流程、沟通方式和协作习惯。
这些行为,已经非常接近一个"真正的合作者"。
这句话概括了GPT-5的真实价值:不是更强,而是更好用。
到这一步,你会发现:
GPT-5 能不能写代码,已经不是问题;它能不能参与一整个项目,从讨论到交付,才是更大的突破。
第四节|从医院到银行,GPT-5 已经“上班了”
到这里,GPT-5 不只是展示潜力,而是已经投入实战了。
发布会的下半场,OpenAI 重点介绍了 GPT-5 如何融入真实的工作环境——它不是被用来作展示,而是被企业员工、医生、家长、教育机构、政府部门真实接入业务流程。
1、医疗现场:AI 解读癌症报告,帮人做出治疗决定
最打动人的一段分享,来自一位真实用户 Carolina 和她的丈夫 Filipe。
她在 39 岁时被确诊为三种癌症,其中一种是侵袭性的乳腺癌。
“我打开活检报告,能看懂的只有两个词:‘侵袭性癌(invasive carcinoma)’。我慌了,第一反应是截图发给 ChatGPT。”
这不是一次科普提问,而是一个人在生命最脆弱的时刻,把希望交给了 AI。
Carolina 说:
“GPT-5 把这份专业术语密密麻麻的报告,用我能理解的语言解释给我听。”
更重要的是:
当医生们对是否进行放疗意见不一时,GPT-5 不仅讲清了选项,还帮她权衡利弊,最终做出决策。
她说:
“它不是替我决定,而是帮我理解、比较,然后让我有信心支持自己的选择。”
她的丈夫补了一句:
“GPT-5 让她重新掌控了工作节奏。当很多人还在为难题发愁时,她已经能从容应对。”
2、家庭教育:AI 帮你学外语、备考试、做规划
OpenAI 研究员 Ruochen 在演示中展示了 GPT-5 的语音学习功能。
他对 GPT-5 说:
“假装我们在咖啡店,教我怎么用韩语点咖啡。”
GPT-5 用非常自然的声音回复了完整句式,还能放慢语速、重复发音、调整节奏。
他接着要求:
“说得再快点,像韩国人一样快。”
GPT-5 就把原句以极快语速复读一遍,效果惊艳。
Ruochen 总结说:
“这是我学韩语以来最有效的练习方式。”
而这些语音能力,也能被用在孩子的语言学习、考试准备,甚至家庭出游的旅行对话练习。
更实用的是,GPT-5 还能读懂你的 Gmail 和日历,帮你安排日程、备课、规划家庭活动。
研究员 Christina 演示说:
“它自动看出我有一个晚上的红眼航班,然后整理了我的行李清单。”
一句话总结:GPT-5 已经可以像一个超级家长那样帮你照顾生活琐事。
3、企业:银行、医药、保险公司都在用 GPT-5 做决策
OpenAI 平台负责人 Olivier 在发布会上公布了几家使用 GPT-5 的大公司:
Amgen(全球生物医药公司):用 GPT-5 阅读科研文献、分析临床数据,辅助药物设计
Oscar Health(纽约健康保险公司):GPT-5 被用作临床协助工具,提升理赔和问诊效率
BBVA 银行(欧洲大型银行):GPT-5 用于财务报告分析、风控建模,效果“击败所有其他模型”
其中 BBVA 给出的对比尤为直接:
人类分析师需要三周做的报告,GPT-5 几小时搞定。
这些企业的共通点是:它们并不是 AI 公司,却都在大规模集成 GPT-5 进日常业务。
4、政府开始部署:200 万美国联邦员工将使用 GPT-5
Olivier 还透露了一个重要消息:我们与美国联邦政府合作,将 GPT-5 和 ChatGPT 提供给 200 万公务员使用。
这意味着,GPT-5 不再是科技公司里的工具,它正进入政策制定、文书处理、服务交互等场景。
Sam Altman 点出核心:
“GPT-5 是你口袋里的专家,不论你做什么行业,都可以带着它一起工作。”
GPT-5 的角色,已经不是“一个工具”,而是一个可以上岗、能帮你干实事的工作搭档。
它可能不是唯一的决策者,但已经变成了每个人都可以调用的“第二大脑”。
这场变革,不是遥远的趋势,而是正在进行的现实。
结语|不是发布会,而是转折点
GPT-5 发布这一天,不只是 OpenAI 又迭代了一个模型。
它标志着一个重要转折:AI 从"会回答问题"进化到了"能解决问题":
能听懂你说的每句话,也能跟上你做的每一件事;
不再只是输出答案,而是开始参与整个过程;
不是让你选工具,而是带着你把事做完。
Altman 说它是“你口袋里的博士团队”,但我们更应该关注的是:
从今天起,每个岗位、每个行业,都开始出现一个能干活的 AI 搭档。
这不是终点,而是起点。
GPT-5 之后,问题已经不再是——AI 能不能做事?
而是:
你准备好,把哪部分工作交给它了吗?
你又该把自己的能力,升级到哪个位置?
注:OpenAI 发布了关于如何使用 GPT-5 的指南
链接:https://platform.openai.com/docs/guides/latest-model
本文由AI深度研究院出品,内容翻译和整理自OpenAI GPT-5发布会实录。未经授权,不得转载。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
https://www.youtube.com/watch?v=0Uu_VJeVVfo&ab_channel=OpenAI
https://techcrunch.com/2025/08/07/openais-gpt-5-is-here/?utm_campaign=social&utm_source=X&utm_medium=organic
https://shumer.dev/gpt5review
https://www.latent.space/p/gpt-5-review
来源:官方媒体/网络新闻,
排版:Atlas
编辑:深思
主编:图灵
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.