Anthropic 联创 Tom Brown：从 GPT 到 Claude，他把模型“做成了产品”|tom|工作流|claude|anthropic

分享至

全文 4,000字 | 阅读约 13 分钟

(Tom Brown 谈：发现 scaling law 的震撼时刻)

演示很好看。

上线却总卡壳。

卡在可靠性，卡在成本，卡在能否稳定重现。

最关键的卡点是：能否真正进入工作环境，而不是停留在 Demo 阶段。

2025 年 8 月 19 日，YC 的一场公开对谈中，Anthropic 联合创始人 Tom Brown 谈到了他的“非常规路径”、scaling laws 带来的行业转折，以及最容易被忽略、却最要命的事：产品化思维。

Claude 不是能聊天的模型，而是能负责的系统。

如何做到"能负责"？他们聚焦可用、可控、可复现三大支柱。技术扎实了，商业自然跟上：

《彭博社》：2025年7月，Anthropic 年化营收达约 40 亿美元；
《The Information》：2025年8月，最新报道数字逼近 50 亿美元。

这样的增长背后，是资本与渠道的双重支撑。亚马逊 40 亿美元投资到位，Claude 通过 AWS Bedrock 进入企业。达美航空、西门子等一线客户已经接入 Claude 模型，应用场景覆盖客服、运维、合规等核心工作流。

Anthropic 成功的关键，不在模型强大，而在产品完整。

Tom Brown 从 GPT-3 的幕后 builder，到 Claude 的产品操盘手，不靠热度拉估值、不靠参数刷榜单，而是靠一件事赢下今天：

他把模型“做成了产品”。

第一节｜不是科学家，是开发者

Tom Brown 一直不是传统意义上的“尖子生”。

他在播客开场就自嘲：我上大学时，编程课经常挂科。靠重修才能勉强过。 MIT 毕业后，也没去大厂做研究，而是加入朋友的创业公司写代码。

也许正因为这样的经历，他形成了独特的工程思维：“我喜欢亲手搭建系统，把它跑通，然后看到它真正发挥作用。”

从早期创业到 OpenAI 打造 GPT 训练系统，他的风格一直没变。

而这种"把东西真正做出来"的工程师思维，正是 GPT 成功所需要的。

✅他是开发者，不是科学家。

2018-2019年，OpenAI 正在开发 GPT-3。这个模型的规模达到了新高度：1750亿参数，训练工程的难度可想而知。Tom Brown 在 2018 年重返 OpenAI，并带队完成了 GPT-3 的训练部署。

他说：“GPT-3 是个特别复杂的项目，不只是训练，而是整个系统得从头到尾都能跑通。”

换句话说，不是简单写个模型代码，而是：

要搭好硬件资源和训练脚本；
要能监控每一次微调是否有效；
要能在模型出问题时快速定位、及时修复、准确复现。

当成百上千个指标同时运行时，一旦模型崩溃，他必须第一时间定位出问题的超参数。

这种工程实践让 Tom Brown 对 AI 的理解更加深刻。而 GPT-3 项目结束后，他没去接着追 GPT-4，也没有选择进学术圈发表论文。他选择离开 OpenAI，另起炉灶。

原因只有一个——

“我不只是想让模型变聪明，我想让它能用。”

第二节｜不追最强模型，只追最稳闭环

Tom Brown 这样说：现在很多模型表现很好，但它们无法在现实世界里真正被用起来。

不是因为它们不聪明，而是缺少“产品闭环”：

你不能总指望用户容忍模型说错话；
你不能让工程团队修 bug 没完没了；
你更不能处处要人工补救，却叫"AI上线"。

一个能用的 AI 产品，需要三件事：

① 它必须“能复现”

Tom 的原话是：“你得能多次拿到一致的结果。”

很多模型 demo 看起来很炫，但只成功一次，后面怎么调都不稳定。这在做科研可以接受，但在做产品时，就意味着灾难。

企业不会要一个只在台上表现好的模型。它得在流程里、在用户面前，每一次都可靠。

Anthropic 团队花了很多精力，做了一套调试和回测的工具链，确保每次修改不会破坏已有能力。不是靠猜，而是靠记录、测试和对比。

② 它必须“能被控制”

“控制”不是压制模型，而是确保它在各种环境下，都不会突然说错话、做错事。

Tom 举了个例子：Claude 在某些客服场景里回答非常稳，但有时在自由聊天模式下，可能会绕远路或说废话。

为了解决这个问题，他们设计了“行为配置”：不同的客户、不同的使用目标，可以配置 Claude 的语气、答案风格、甚至输出的格式。

他们不是要求一个模型适配所有人，而是让它变成多个可控的角色。

这也是 Claude 被企业接受的原因之一：它更像一个"可靠的同事"，而非"聪明的实习生"。

③ 它必须“能查得清”

Claude 要成为产品，第一步不是功能强，而是能看懂它哪错了。

Tom 特别强调了这个点：“我们必须知道模型回答错误是因为训练数据的问题，还是因为提示词不够好，还是系统接入出了错。”

为了做到这一点，他们开发了很多辅助工具：

日志记录每一次调用；
提示词版本有清晰管理；
回答可以被评估、打分、标记。

不是靠猜，而是像调试代码一样，一步步拆解原因。

这些理念平淡无奇：既不谈"万亿参数"的宏大，也不吹"超越人类"的神奇，更不提"图灵测试"的突破。

然而，正是这些朴实的工程原则，决定了 AI 能否真正投入使用。

第三节｜Claude 到底怎么赚钱？

Tom Brown 更看重一个词：产品。

在他看来，关键不是让模型有多聪明，而是做出真正可部署、可交付、可维护的系统。

这句话背后，其实有三个关键词：客户、接口、回报。

① 客户不是体验用户，是业务用户

Tom 说得很清楚：

“我们的目标用户不是‘好奇的人’，而是那些真的有工作要完成的人。”

Anthropic 一开始就没有主打娱乐性产品，也没去抢陪用户聊天的流量。他们重点做的是——Claude for Work（面向工作的 Claude）。

也就是：

能帮客服处理对话；
能替医生写初稿、分析文档；
能支持生物医药公司处理复杂研究数据。

这些客户不是为了追逐热点，而是为了提效、降本、规范流程。

这些合作不是靠关系，而是靠实际价值：能否节省时间，能否减少人工，能否提高准确率。

② 接口不是产品界面，是系统组件

Claude 真正的落地方式，不是大家打开个网站来用，而是被嵌入到了企业的工作流里。

比如：

客服团队：Claude 会自动归类问题、推荐答案草稿；
法律顾问：Claude 被内嵌到合同审查工具中，提供风险提示；
医疗团队：Claude 参与报告生成、知识抽取。

这些不是点到为止，而是深入使用、系统集成、长期运行。

Claude 不是孤立存在的产品，而是融入日常工作的重要一环。 ——Tom Brown

这意味着什么？意味着 Claude 不再以对话量论价值，而是以实际完成的任务为准。

③ 回报不是技术领先，是商业价值

Tom 没有谈估值，也没强调技术多领先，而是强调了一组最直接的商业数据：

“我们的目标是：让 Claude 自己带来收入。”

根据彭博社、《The Information》等媒体在 2025 年 7–8 月的报道：

Anthropic 年化营收已达 40–50 亿美元区间；
客户主要来自医疗、航空、能源、制造、金融等行业；
Claude 是目前增长最快的大模型产品之一。

这些增长，并不靠炒概念、讲故事，而是靠产品实打实在客户场景里干活拿钱。

他们在做的，不是拿技术去推市场，

而是从需求里反推模型该怎么演进。

第四节｜工程纪律，决定能不能走到最后

如果你以为，Claude 能在企业场景跑通，是因为模型“够聪明”，那就低估了它背后的“冷启动难度”。

Tom Brown 在对谈里点出一个经常被忽略的核心问题：

“大模型不是发布之后就能自动好用的。真正的问题，是怎么让它每次都给出稳定、准确的结果。”

换句话说，真正的挑战，不是“能不能答对一次”，而是能不能答对一千次、一万次。

① 从实验室走向生产线，降低不确定性

Tom 在 OpenAI 参与训练 GPT-2 和 GPT-3 时就意识到：

模型越大，能力越强，但同时也越不可控；
每一次输出都有“随机性”，模型在不同 prompt 下的表现差异很大；
想要用到实际流程中，就得从“探索性研究”走向“工程标准”。

他说：

“我们花了大量精力，把原本‘很艺术’的调优工作，变成了可追踪、可迭代的标准化过程。”

这听起来枯燥，却是 Claude 真正变成“产品”的关键。

② 每一次错误都要能追根溯源

Claude能上线，关键不在于不出错，而在于出错后能追溯、能修复、能改进。

Tom 说得很实在：

“模型表现不好，不是因为它不够聪明，而是我们还没搞清楚它怎么运作、哪会出错。”

在 Anthropic，开发流程像工业流水线一样：

每一次模型输出，都会打上“可追溯标签”；
每一组实验结果，都有版本号、对比基准、修正路径；
即使是“幻觉”错误，也要被细化成“哪种数据不足、哪类问题边界不清楚”等可处理问题。

像工业制造一样，系统分析每一次偏差，把问题转化为优化机会。

③ 合规要求必须前置，不能事后补救

大多数人以为安全、对齐、合规是在发布后“补救”的环节。但 Tom 直接指出：

“我们一开始设计 Claude 时，就考虑到它要面对金融、医疗、法律等高风险行业。”

也就是说：

Claude 的对话机制、拒答策略、信息引用方式，都预设了合规限制；
不是“看心情”答不答，而是明确设计规则——什么能说，什么不能说；
就连客户自己上传的知识库，Claude 在调用时也要“保持边界”。

这种合规，不是为了限制模型，而是为了让它能被信任、能复用、能部署。

从这个角度看，AI 产品的成败关键不在于它更聪明，而在于它更规范。

第五节｜靠的不是天才，而是高密度团队

当模型从实验室走向实际应用，决定成败的不只是技术，更是人。

Tom Brown 的这场对谈，讲得最多的不是模型有多强，而是团队怎么做事。

他深有体会：

“很多人以为这是一两个顶级研究员推动出来的。但 Claude 的诞生，其实靠的是一个高密度、高纪律的团队结构。”

① 不比个人智商，比团队交付力

Tom 回忆，他在 OpenAI 早期就意识到：

“一个模型从想法到上线，要踩过无数个坑。不是天才解决一切，而是要很多细致、耐心的工程工作。”

所以在 Anthropic，他和创始团队一开始就设定了招聘原则：

不只看个人能力，更看是否认同使命愿景；
不追求明星个人，而是关注能否与团队协作共事；
不鼓励各自为战，而是强调透明沟通和集体决策。

一句话：不是谁最聪明，而是谁最认同这件事。

② AI产品成败看组织能力，不看技术能力

Tom 特别讲到一个关键能力：context switching（上下文切换）。

“AI 公司必须同时做研究、工程、产品、安全，甚至合规和商务。”

而这背后，最难的不是技术，而是组织能不能在这些事情之间顺畅切换、迅速对齐、减少内耗。

Anthropic 内部做法是：

团队之间用非常细的接口沟通（明确输入、输出、责任人）；
大部分协作依赖文档，不依赖会议；
所有测试和上线流程都有“公共评估基准”，避免部门扯皮。

做 AI 产品不是全员跟风，而是各司其职、精准分工。

③ 管理者要消除混乱，不是发号施令

Tom 提出一个很有意思的观点：

我们不是在管理人，而是在管理不确定性。

举个例子：

一个功能上线前，产品会先把目标用数据标准写清楚；
工程团队接手后，不是靠猜，而是靠验证链条逐步压缩出错空间；
模型团队提供的是“可调用版本”，不是研究草稿。

这套流程让 Anthropic 的模型不只是跑得起来，更重要的是在客户那里跑得稳、用得住。

Tom 最后总结：

“Anthropic 并不靠单点突破，而是建立了能持续化解复杂性、有序推进目标的组织。”

这也解释了 Claude 为何能成功落地：不是靠某个天才想法，而是靠组织能力和工程积累，一步步打磨出来的。

结语｜ AI 产品闭环的新分水岭

Tom Brown 这场对谈，没吹概念，没画大饼。

他说的，是一个正在成型的新范式：AI 不止是模型之争，更是产品之战、组织之战。

Claude 的成功不是偶然。

它背后，是四年从 OpenAI 到 Anthropic 的积累：工程优先的理念，安全可控的机制，上下游闭环的反馈，还有组织协作的模式。

正如 Tom 所说：

有了能力，才有资格谈产品；做成产品，才有资格谈市场。

而一旦进入市场，评判标准只有一个：是不是能持续地创造价值。

Anthropic 已经证明了“能不能做”。

Claude 能不能跑通商业闭环，现在已经有答案了。

下一个问题，是：谁能把模型真正做成产品？谁能让客户真正产生依赖？

本文由AI深度研究院出品，内容翻译整理自Tom Brown在YC播客访谈内容翻译整理。未经授权，不得转载。。

星标公众号，点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料：

https://www.youtube.com/watch?v=JdT78t1Offo&t=5s&ab_channel=YCombinator

https://www.ycombinator.com/library?utm_source=chatgpt.com

https://www.theinformation.com/articles/anthropic-revenue-pace-nears-5-billion-run-mega-round?utm_source=chatgpt.com

https://www.bloomberg.com/news/articles/2025-07-29/anthropic-nears-deal-to-raise-funding-at-170-billion-valuation?utm_source=chatgpt.com

https://www.aboutamazon.com/news/company-news/amazon-anthropic-ai-investment?utm_source=chatgpt.com

https://apnews.com/article/f5108beaa33455f331010489e03586d4?utm_source=chatgpt.com

https://www.reuters.com/business/anthropic-hits-3-billion-annualized-revenue-business-demand-ai-2025-05-30/?utm_source=chatgpt.com

来源：官方媒体/网络新闻

排版：Atlas

编辑：深思

主编: 图灵

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手机 / 数码

房产 / 家居

Anthropic 联创 Tom Brown：从 GPT 到 Claude，他把模型“做成了产品”

南昌三瑞智能IPO：委外代工模式存疑

媒体：高市早苗接连触碰中国底线 日本贼心不死

媒体：高市早苗接连触碰中国底线 日本贼心不死

一个14岁的小男孩，决定了谁能晋级世界杯

古二曝秦雯多次炫耀袭警经历

苹果新品惨败，产线拆光、二代搁浅！

盈利"大考"，汽车智能化企业的中场战事

态度原创

超声探头会加重受伤情况吗？

四川志愿填报，这样准备就对了！

一本口袋书逛遍京城博物馆 这些地方可购买——

天马官宣首个集成NFC功能的屏幕面板，号称可实现“3cm隔空响应”

媒体：高市早苗接连触碰中国底线日本贼心不死

媒体：高市早苗接连触碰中国底线日本贼心不死

一本口袋书逛遍京城博物馆这些地方可购买——