Sam Altman 发布 GPT-5：超长上下文＋持久记忆，AI 正式“干活”了|调用|代码|编程|gpt

分享至

全文 4,000字 | 阅读约 13 分钟

（OpenAI GPT-5发布会 Sam Altman演讲精彩片段）

2025年 8 月 8 日，OpenAI 正式发布 GPT-5。

这是一次技术发布，但又不只是技术发布。

如果说过去的 ChatGPT 只是“一个聪明的对话者”，那么 GPT-5，已经变成了一个可以“上岗干活”的行动者。

正如 OpenAI CEO Sam Altman 所说：

“每周 7 亿人都在用 ChatGPT，但 GPT-5，才是真正把 AI 从‘对话者’变成‘行动者’的升级。”

不仅能回答问题、写摘要、写代码，GPT-5 现在还能完成整套工作任务：从理解需求、思考路径、生成内容、编写前端、调试后端，到最终上线一个可用的产品。

这标志着 AI“动手能力”的全面爆发。

更关键的是，这股热潮已经突破了科技圈的界限。GPT-5 发布后立即面向全体 ChatGPT 用户开放，免费用户也能直接使用。

(网页版GPT-5界面：内置思考功能，每次都给出最佳答案)

接下来，我们不谈技术参数，只看实际表现——

AI 究竟是怎样从助手变成“工作伙伴”的。

第一节｜GPT-5 有多聪明？像博士团队一样懂你

“GPT-3 像和一个高中生对话，GPT-4o 像大学生，而 GPT-5，就像在和一个博士聊天。”

这不是夸张，而是 Sam Altman 对 GPT 智能演进的直观类比。

这一次，OpenAI 把聪明变成了有用——不仅反应更快、答得更准，还能听懂长故事、记住关键细节、持续接住话头，甚至主动想下一步该怎么帮你做事。

他们在现场展示了四项能力升级，你只要看懂这四点，就知道 GPT-5 为什么已经不是聊天机器人了。

升级一：记忆扩大 100 倍，一次能看懂整本书

（上下文窗口提升到了 400K tokens）

GPT-5 的上下文窗口提升到了 400K tokens，相当于 30 万字左右。

OpenAI 工程团队成员 Michelle 在演讲中强调：“我们不仅把窗口拉长了，还让模型在这个超长内容中保持理解力。”

什么意思？

你可以一次性扔给它一本长文档、一天会议纪要，甚至是过去几周的聊天记录，它能看得完、记得住、提取关键点，不用你重复提醒。

这背后的意义是：AI 第一次可以参与一个任务的完整过程，而不是只处理一小段信息。

升级二：思考时间自适应，不急不慢刚刚好

以前，用 ChatGPT 时你可能会遇到这种情况：

问一个简单问题，它反而写了五段；
提个复杂任务，它却几秒钟就敷衍回答。

GPT-5 改变了这一点。

正如首席研究官 Mark Chen 所说：

“以前你得在快与慢之间选，现在 GPT-5 会自己判断什么时候该快、什么时候该深思。”

GPT-5引入了推理机制(Reasoning)，能够在回答前进行深度思考，用户还可以查看模型的思考过程。简单说，它会在内部分步骤理清思路再给你答复，而且你还能点开看它是怎么想的。

这是不是很像一个实习生不但在干活，还主动和你汇报我为什么这么做。

升级三：答得更准，幻觉也更少

（GPT 5幻觉问题上的进展显著）

OpenAI 这次特别强调了一件事：准确率。

在以往的大模型里，很多人诟病的是“它说得像真的，但其实不对”，专业术语叫“幻觉”。

GPT-5 针对这个问题做了系统优化，重点提升了三类任务的可靠性：

复杂的开放式问题
医疗、法律等高风险领域
有多个参考资料的总结性任务

Max（后训练团队负责人）在现场说：

“我们设计了一套全新的测评方法，不光测答案对不对，还测模型能不能‘做对事’。”

在健康相关问题上，GPT-5 被评为目前最靠谱的模型，比 GPT-4o 的表现要高一个级别。

这也为后面演示中的“癌症报告解读”“日程自动规划”等任务打下了基础。

升级四：全面提升编程、数学、视觉等动手能力

（GPT-5系列模型智能基准测试成绩，展现在数学和科学推理方面的突破性表现）

GPT-5 不只会回答问题，做起事来也很厉害。

比如编程能力，它在 SWEBench（模拟真实软件工程任务）中创下新纪录。
在视觉推理方面，它在 MMMU（看图找问题）测试中打败了市面上绝大多数模型，甚至超过很多人类专家。
在数学推理方面，它在 2025 年的 AIME（奥数预选赛）上得分超越 GPT-4 和 Claude。

一句话总结就是：写代码、做题、看图、做决定，它都能上场。

“我们不是做了一个更大的模型，而是一个更懂得如何帮人完成事的模型。” ——OpenAI 首席研究官 Mark Chen

GPT-5 的这些变化，背后有很多技术细节，但对普通人来说，最直接的感受只有一句话：

以前，你用 AI 是问它怎么做；

现在，你可以直接让它去做了。

第二节｜它不只聊天，是真的在干活

GPT-5 到底怎么“干活”的？

OpenAI 用一整场发布会做了回答。

这不是 PPT 演示，也不是功能对比表格，而是一场人机协作的现场实战：从学术辅导到程序开发，从动画制作到网站建设，从文本到图形，GPT-5 每一次都切实完成了实际工作。。

他们没有讲大道理，而是让你看 AI 是怎么被用起来的。

以下是 3 个关键演示，值得你一次看懂。

演示一：让孩子懂“伯努利效应”？

主持人 Elaine 给 GPT-5 一个简单请求：

“帮我复习一下伯努利效应和飞机的形状。”

GPT-5 秒回，先讲清了“气流越快，压力越小”的原理，然后 Elaine 追加了一句：

“能不能再做个动画，展示气流和升力？”

这时候 GPT-5 停下来“想了一下”，然后开始写代码。

几秒钟后，现场屏幕上出现了一个能动的模拟画面：两条气流穿过机翼上方，下方显示压力变化，甚至还带滑动条让你调整风速和攻角。

Elaine 当场惊叹：

“我一句话，它就给我写了 200 多行前端代码。”

不仅如此，GPT-5 还自动生成了代码的注释，并写了思路说明：“为了实现动画，我选择了 React 和 Tailwind，并在 SVG 中模拟了流体变化。”

你可以不懂编程，但你一定能看懂一个事实：

过去你要请一个工程师 + 一个设计师，今天只需要一句话。

演示二：想给伴侣做个法语学习网站？

GPT-5 不只做个“演示用小程序”，它还能完成一套完整产品。

OpenAI 研究员 Yan 给它的任务是：

“帮我为伴侣做一个法语学习网站，要有抽认卡、测验，还有个小游戏。”

GPT-5 开始执行了——不是单步操作，而是自己“拆任务、开工干”。

它的流程包括：
生成网站结构（Next.js）
写前端样式（Tailwind）
构建功能页面（学习卡片、练习测验）
嵌入小游戏（“老鼠吃奶酪”的法语版贪吃蛇）

不到 5 分钟，Yan 点开页面，网站已经上线运行。

点击“测验”按钮，一张卡片跳出来：“non = 不”。

点击小游戏，一个动画老鼠出场，每吃到一块奶酪，就跳出一个法语单词发音：“bonjour！”

Yan 总结说：

“它不只是把网站拼出来了，而是真的理解我想做的是什么。”

演示三：CFO 想做财务看板？

现场另一位研究员 Adi 给 GPT-5 的指令更像“工作任务”：

“为一家创业公司的 CFO 做一套财务仪表盘，要美观、有交互，能展示收入趋势。”

GPT-5 回应得像一个团队成员：

先选了框架（Next.js）
再生成 KPI 模块、收入曲线图、客户细分视图
自动搭建文件结构，补上说明文档
最后运行代码、打开端口，真正上线展示

当画面打开时，现场观众看到的是一个可以点、可以滑动的“真·财务看板”。

Adi 边操作边说：

“它自动配色、对齐元素，甚至加了鼠标悬停后的数据浮动提示，这些我以前至少要写两天。”

更神的是，GPT-5 在过程中发现了一个前端 bug，自己回滚、重新编译，自动修复，整个过程不需要人工插手。

这就是自主发现问题并进行修复的能力。

这些演示传达了一个清晰的信号：GPT-5 不仅理解你的需求，更能将想法真正落地实现。

第三节｜开发者试完 GPT-5：这活，它真能接

发布会上的演示已经说明了一件事：

GPT-5 不只是“写几行代码”，而是开始接近真实工作场景。

但更关键的是——它不光能“做”，还能和人配合着做事情。

这节里，我们就来看一个开发者的视角：当你把 AI 拉进你的项目，它到底帮了多大的忙？

Cursor CEO 现身说法：GPT-5 是编程的最佳拍档

Michael Truell 是 AI 编程工具 Cursor 的联合创始人兼 CEO。他是第一批拿到 GPT-5 的开发者之一。

他在发布会上讲了个真实场景：我们把 GPT-5 丢进代码库，让它试着找出架构设计上的重点……几分钟内它不仅找到了我们用于远程执行代码的组件，还理解了我们为什么这样设计，是为了安全性。

这件事的意义在于：

GPT-5 不是只读代码，它能读懂“背后的思路”。

Michael 说得很直白：

“这本来是需要人花几周时间理解的决策，它几分钟搞定了。”

一次修 Bug 演示：GPT-5 整个流程跑通了

为了验证 GPT-5 的“实战能力”，他们在发布会上现场试了一个难题：

找出并修复 OpenAI 官方 Python SDK 的一个 Github 问题，这个 bug 已经挂了三周都没人解决。

GPT-5 是怎么干的？

它的操作流程如下：

自己读取整个代码库
搜索关键词，定位可疑模块
主动写出“我要这么改的原因”
修改代码，跑测试，构建上线
发现 lint 警告，自己判断无关，忽略
打包完毕，准备合并 PR

过程中，它会主动向开发者同步状态：

“我正在搜索关键路径……接下来将修改 upload_pdf() 函数……已定位问题出在 MIME 类型处理……”

你不用懂技术也能听出来，它干得比很多实习生还利索。

当被问及是否试过自己修复时，演示者 Brian 坦白承认："我试过，我做不到……GPT-5 修好了。"

后来 Cursor 的 CEO Michael 补充说：

"我们用GPT-5处理实际工作代码库，它能发现非常复杂的架构问题，这些决策我们团队花了几周时间才想通。"

开发者怎么用它？不只是让它写，而是和它一起做

OpenAI 联合创始人兼总裁 Greg Brockman 问了 Michael 一个关键问题：

你觉得开发者怎么才能把 GPT-5 真正用起来？

Michael 回答：

“用它做你的真活。不是玩玩，而是让它直接参与你的项目。”

他还总结了 GPT-5 作为同事的几个关键特点：

有上下文感：知道前面聊过什么，能顺着做下去
沟通能力强：会告诉你它的计划，出错时能解释原因
可以回溯：你说它错了，它不会死犟，而是按你说的改回来
风格可调：你可以设定它是“安静型”还是“多话型”开发者
会自己 debug：出错时会查日志、调代码、重跑测试，不是出错就罢工这些行为，已经非常接近一个“真正的合作者”。

Michael 说得很清楚：这不再是‘把代码交给 AI 生成’，而是你和 AI 一起开发、一起上线。

GPT-5 干的事，不只是“把事做了”，而是能适应人类的工作流程、沟通方式和协作习惯。

这些行为，已经非常接近一个"真正的合作者"。

这句话概括了GPT-5的真实价值：不是更强，而是更好用。

到这一步，你会发现：

GPT-5 能不能写代码，已经不是问题；它能不能参与一整个项目，从讨论到交付，才是更大的突破。

第四节｜从医院到银行，GPT-5 已经“上班了”

到这里，GPT-5 不只是展示潜力，而是已经投入实战了。

发布会的下半场，OpenAI 重点介绍了 GPT-5 如何融入真实的工作环境——它不是被用来作展示，而是被企业员工、医生、家长、教育机构、政府部门真实接入业务流程。

1、医疗现场：AI 解读癌症报告，帮人做出治疗决定

最打动人的一段分享，来自一位真实用户 Carolina 和她的丈夫 Filipe。

她在 39 岁时被确诊为三种癌症，其中一种是侵袭性的乳腺癌。

“我打开活检报告，能看懂的只有两个词：‘侵袭性癌（invasive carcinoma）’。我慌了，第一反应是截图发给 ChatGPT。”

这不是一次科普提问，而是一个人在生命最脆弱的时刻，把希望交给了 AI。

Carolina 说：

“GPT-5 把这份专业术语密密麻麻的报告，用我能理解的语言解释给我听。”

更重要的是：

当医生们对是否进行放疗意见不一时，GPT-5 不仅讲清了选项，还帮她权衡利弊，最终做出决策。

她说：

“它不是替我决定，而是帮我理解、比较，然后让我有信心支持自己的选择。”

她的丈夫补了一句：

“GPT-5 让她重新掌控了工作节奏。当很多人还在为难题发愁时，她已经能从容应对。”

2、家庭教育：AI 帮你学外语、备考试、做规划

OpenAI 研究员 Ruochen 在演示中展示了 GPT-5 的语音学习功能。

他对 GPT-5 说：

“假装我们在咖啡店，教我怎么用韩语点咖啡。”

GPT-5 用非常自然的声音回复了完整句式，还能放慢语速、重复发音、调整节奏。

他接着要求：

“说得再快点，像韩国人一样快。”

GPT-5 就把原句以极快语速复读一遍，效果惊艳。

Ruochen 总结说：

“这是我学韩语以来最有效的练习方式。”

而这些语音能力，也能被用在孩子的语言学习、考试准备，甚至家庭出游的旅行对话练习。

更实用的是，GPT-5 还能读懂你的 Gmail 和日历，帮你安排日程、备课、规划家庭活动。

研究员 Christina 演示说：

“它自动看出我有一个晚上的红眼航班，然后整理了我的行李清单。”

一句话总结：GPT-5 已经可以像一个超级家长那样帮你照顾生活琐事。

3、企业：银行、医药、保险公司都在用 GPT-5 做决策

OpenAI 平台负责人 Olivier 在发布会上公布了几家使用 GPT-5 的大公司：

Amgen（全球生物医药公司）：用 GPT-5 阅读科研文献、分析临床数据，辅助药物设计
Oscar Health（纽约健康保险公司）：GPT-5 被用作临床协助工具，提升理赔和问诊效率
BBVA 银行（欧洲大型银行）：GPT-5 用于财务报告分析、风控建模，效果“击败所有其他模型”

其中 BBVA 给出的对比尤为直接：

人类分析师需要三周做的报告，GPT-5 几小时搞定。

这些企业的共通点是：它们并不是 AI 公司，却都在大规模集成 GPT-5 进日常业务。

4、政府开始部署：200 万美国联邦员工将使用 GPT-5

Olivier 还透露了一个重要消息：我们与美国联邦政府合作，将 GPT-5 和 ChatGPT 提供给 200 万公务员使用。

这意味着，GPT-5 不再是科技公司里的工具，它正进入政策制定、文书处理、服务交互等场景。

Sam Altman 点出核心：

“GPT-5 是你口袋里的专家，不论你做什么行业，都可以带着它一起工作。”

GPT-5 的角色，已经不是“一个工具”，而是一个可以上岗、能帮你干实事的工作搭档。

它可能不是唯一的决策者，但已经变成了每个人都可以调用的“第二大脑”。

这场变革，不是遥远的趋势，而是正在进行的现实。

结语｜不是发布会，而是转折点

GPT-5 发布这一天，不只是 OpenAI 又迭代了一个模型。

它标志着一个重要转折：AI 从"会回答问题"进化到了"能解决问题"：

能听懂你说的每句话，也能跟上你做的每一件事；
不再只是输出答案，而是开始参与整个过程；
不是让你选工具，而是带着你把事做完。

Altman 说它是“你口袋里的博士团队”，但我们更应该关注的是：

从今天起，每个岗位、每个行业，都开始出现一个能干活的 AI 搭档。

这不是终点，而是起点。

GPT-5 之后，问题已经不再是——AI 能不能做事？

而是：

你准备好，把哪部分工作交给它了吗？

你又该把自己的能力，升级到哪个位置？

注：OpenAI 发布了关于如何使用 GPT-5 的指南

链接：https://platform.openai.com/docs/guides/latest-model

本文由AI深度研究院出品，内容翻译和整理自OpenAI GPT-5发布会实录。未经授权，不得转载。

星标公众号，点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

https://www.youtube.com/watch?v=0Uu_VJeVVfo&ab_channel=OpenAI

https://techcrunch.com/2025/08/07/openais-gpt-5-is-here/?utm_campaign=social&utm_source=X&utm_medium=organic

https://shumer.dev/gpt5review

https://www.latent.space/p/gpt-5-review

来源：官方媒体/网络新闻，

排版：Atlas

编辑：深思

主编：图灵

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

Sam Altman 发布 GPT-5：超长上下文＋持久记忆，AI 正式“干活”了

营收翻倍、巨亏31亿！中国大模型太烧钱了

牛弹琴：战争开始烂尾 特朗普要跑了以色列目瞪口呆

牛弹琴：战争开始烂尾 特朗普要跑了以色列目瞪口呆

县城修车工，用20年成为世界冠军

《月鳞绮纪》空降 鞠婧祎却被举报偷税

欧央行行长与美财长G7会议上交锋！

腾势Z9GT到底GT在哪？

态度原创

“伪热门”专业，90%家长都踩坑了！（三）教育学#新学期超给力

听说中小学朋友们要放春假啦，济宁景区也放“价”啦！

用Color Walk的方式解锁城市春日

iPhone将内置呼气传感器 可筛查糖尿病与高胆固醇

牛弹琴：战争开始烂尾特朗普要跑了以色列目瞪口呆

牛弹琴：战争开始烂尾特朗普要跑了以色列目瞪口呆

《月鳞绮纪》空降鞠婧祎却被举报偷税

iPhone将内置呼气传感器可筛查糖尿病与高胆固醇