网易首页 > 网易号 > 正文 申请入驻

Anthropic 联创 Tom Brown:从 GPT 到 Claude,他把模型“做成了产品”

0
分享至

全文 4,000字 | 阅读约 13 分钟


(Tom Brown 谈 :发现 scaling law 的震撼时刻)

演示很好看。

上线却总卡壳。

卡在可靠性,卡在成本,卡在能否稳定重现。

最关键的卡点是:能否真正进入工作环境,而不是停留在 Demo 阶段。

2025 年 8 月 19 日,YC 的一场公开对谈中,Anthropic 联合创始人 Tom Brown 谈到了他的“非常规路径”、scaling laws 带来的行业转折,以及最容易被忽略、却最要命的事:产品化思维。

Claude 不是能聊天的模型,而是能负责的系统。

如何做到"能负责"?他们聚焦可用、可控、可复现三大支柱。技术扎实了,商业自然跟上:

  • 《彭博社》:2025年7月,Anthropic 年化营收达约 40 亿美元;

  • 《The Information》:2025年8月,最新报道数字逼近 50 亿美元。

这样的增长背后,是资本与渠道的双重支撑。亚马逊 40 亿美元投资到位,Claude 通过 AWS Bedrock 进入企业。达美航空、西门子等一线客户已经接入 Claude 模型,应用场景覆盖客服、运维、合规等核心工作流。

Anthropic 成功的关键,不在模型强大,而在产品完整。

Tom Brown 从 GPT-3 的幕后 builder,到 Claude 的产品操盘手,不靠热度拉估值、不靠参数刷榜单,而是靠一件事赢下今天:

他把模型“做成了产品”。

第一节|不是科学家,是开发者

Tom Brown 一直不是传统意义上的“尖子生”。

他在播客开场就自嘲:我上大学时,编程课经常挂科。靠重修才能勉强过。 MIT 毕业后,也没去大厂做研究,而是加入朋友的创业公司写代码。

也许正因为这样的经历,他形成了独特的工程思维:“我喜欢亲手搭建系统,把它跑通,然后看到它真正发挥作用。”

从早期创业到 OpenAI 打造 GPT 训练系统,他的风格一直没变。

而这种"把东西真正做出来"的工程师思维,正是 GPT 成功所需要的。

他是开发者,不是科学家。

2018-2019年,OpenAI 正在开发 GPT-3。这个模型的规模达到了新高度:1750亿参数,训练工程的难度可想而知。Tom Brown 在 2018 年重返 OpenAI,并带队完成了 GPT-3 的训练部署。

他说:“GPT-3 是个特别复杂的项目,不只是训练,而是整个系统得从头到尾都能跑通。”

换句话说,不是简单写个模型代码,而是:

  • 要搭好硬件资源和训练脚本;

  • 要能监控每一次微调是否有效;

  • 要能在模型出问题时快速定位、及时修复、准确复现。

当成百上千个指标同时运行时,一旦模型崩溃,他必须第一时间定位出问题的超参数。

这种工程实践让 Tom Brown 对 AI 的理解更加深刻。而 GPT-3 项目结束后,他没去接着追 GPT-4,也没有选择进学术圈发表论文。他选择离开 OpenAI,另起炉灶。

原因只有一个——

“我不只是想让模型变聪明,我想让它能用。”

第二节|不追最强模型,只追最稳闭环

Tom Brown 这样说:现在很多模型表现很好,但它们无法在现实世界里真正被用起来。

不是因为它们不聪明,而是缺少“产品闭环”:

  • 你不能总指望用户容忍模型说错话;

  • 你不能让工程团队修 bug 没完没了;

  • 你更不能处处要人工补救,却叫"AI上线"。

一个能用的 AI 产品,需要三件事:

① 它必须“能复现”

Tom 的原话是:“你得能多次拿到一致的结果。”

很多模型 demo 看起来很炫,但只成功一次,后面怎么调都不稳定。 这在做科研可以接受,但在做产品时,就意味着灾难。

企业不会要一个只在台上表现好的模型。它得在流程里、在用户面前,每一次都可靠。

Anthropic 团队花了很多精力,做了一套调试和回测的工具链,确保每次修改不会破坏已有能力。不是靠猜,而是靠记录、测试和对比。

② 它必须“能被控制”

“控制”不是压制模型,而是确保它在各种环境下,都不会突然说错话、做错事。

Tom 举了个例子:Claude 在某些客服场景里回答非常稳,但有时在自由聊天模式下,可能会绕远路或说废话。

为了解决这个问题,他们设计了“行为配置”:不同的客户、不同的使用目标,可以配置 Claude 的语气、答案风格、甚至输出的格式。

他们不是要求一个模型适配所有人,而是让它变成多个可控的角色。

这也是 Claude 被企业接受的原因之一:它更像一个"可靠的同事",而非"聪明的实习生"。

③ 它必须“能查得清”

Claude 要成为产品,第一步不是功能强,而是能看懂它哪错了。

Tom 特别强调了这个点:“我们必须知道模型回答错误是因为训练数据的问题,还是因为提示词不够好,还是系统接入出了错。”

为了做到这一点,他们开发了很多辅助工具:

  • 日志记录每一次调用;

  • 提示词版本有清晰管理;

  • 回答可以被评估、打分、标记。

不是靠猜,而是像调试代码一样,一步步拆解原因。

这些理念平淡无奇:既不谈"万亿参数"的宏大,也不吹"超越人类"的神奇,更不提"图灵测试"的突破。

然而,正是这些朴实的工程原则,决定了 AI 能否真正投入使用。

第三节|Claude 到底怎么赚钱?

Tom Brown 更看重一个词:产品

在他看来,关键不是让模型有多聪明,而是做出真正可部署、可交付、可维护的系统

这句话背后,其实有三个关键词:客户、接口、回报。

① 客户不是体验用户,是业务用户

Tom 说得很清楚:

“我们的目标用户不是‘好奇的人’,而是那些真的有工作要完成的人。”

Anthropic 一开始就没有主打娱乐性产品,也没去抢陪用户聊天的流量。他们重点做的是——Claude for Work(面向工作的 Claude)。

也就是:

  • 能帮客服处理对话;

  • 能替医生写初稿、分析文档;

  • 能支持生物医药公司处理复杂研究数据。

这些客户不是为了追逐热点,而是为了提效、降本、规范流程。

这些合作不是靠关系,而是靠实际价值:能否节省时间,能否减少人工,能否提高准确率。

② 接口不是产品界面,是系统组件

Claude 真正的落地方式,不是大家打开个网站来用,而是被嵌入到了企业的工作流里。

比如:

  • 客服团队:Claude 会自动归类问题、推荐答案草稿;

  • 法律顾问:Claude 被内嵌到合同审查工具中,提供风险提示;

  • 医疗团队:Claude 参与报告生成、知识抽取。

这些不是点到为止,而是深入使用、系统集成、长期运行。

Claude 不是孤立存在的产品,而是融入日常工作的重要一环。 ——Tom Brown

这意味着什么? 意味着 Claude 不再以对话量论价值,而是以实际完成的任务为准。

③ 回报不是技术领先,是商业价值

Tom 没有谈估值,也没强调技术多领先,而是强调了一组最直接的商业数据:

“我们的目标是:让 Claude 自己带来收入。”

根据彭博社、《The Information》等媒体在 2025 年 7–8 月的报道:

  • Anthropic 年化营收已达 40–50 亿美元区间;

  • 客户主要来自医疗、航空、能源、制造、金融等行业;

  • Claude 是目前增长最快的大模型产品之一。

这些增长,并不靠炒概念、讲故事,而是靠产品实打实在客户场景里干活拿钱。

他们在做的,不是拿技术去推市场,

而是从需求里反推模型该怎么演进。

第四节|工程纪律,决定能不能走到最后

如果你以为,Claude 能在企业场景跑通,是因为模型“够聪明”,那就低估了它背后的“冷启动难度”。

Tom Brown 在对谈里点出一个经常被忽略的核心问题:

“大模型不是发布之后就能自动好用的。真正的问题,是怎么让它每次都给出稳定、准确的结果。”

换句话说,真正的挑战,不是“能不能答对一次”,而是能不能答对一千次、一万次。

① 从实验室走向生产线,降低不确定性

Tom 在 OpenAI 参与训练 GPT-2 和 GPT-3 时就意识到:

  • 模型越大,能力越强,但同时也越不可控;

  • 每一次输出都有“随机性”,模型在不同 prompt 下的表现差异很大;

  • 想要用到实际流程中,就得从“探索性研究”走向“工程标准”。

他说:

“我们花了大量精力,把原本‘很艺术’的调优工作,变成了可追踪、可迭代的标准化过程。”

这听起来枯燥,却是 Claude 真正变成“产品”的关键。

② 每一次错误都要能追根溯源

Claude能上线,关键不在于不出错,而在于出错后能追溯、能修复、能改进。

Tom 说得很实在:

“模型表现不好,不是因为它不够聪明,而是我们还没搞清楚它怎么运作、哪会出错。”

在 Anthropic,开发流程像工业流水线一样:

  • 每一次模型输出,都会打上“可追溯标签”;

  • 每一组实验结果,都有版本号、对比基准、修正路径;

  • 即使是“幻觉”错误,也要被细化成“哪种数据不足、哪类问题边界不清楚”等可处理问题。


像工业制造一样,系统分析每一次偏差,把问题转化为优化机会。

③ 合规要求必须前置,不能事后补救

大多数人以为安全、对齐、合规是在发布后“补救”的环节。但 Tom 直接指出:

“我们一开始设计 Claude 时,就考虑到它要面对金融、医疗、法律等高风险行业。”

也就是说:

  • Claude 的对话机制、拒答策略、信息引用方式,都预设了合规限制;

  • 不是“看心情”答不答,而是明确设计规则——什么能说,什么不能说;

  • 就连客户自己上传的知识库,Claude 在调用时也要“保持边界”。

这种合规,不是为了限制模型,而是为了让它能被信任、能复用、能部署。

从这个角度看,AI 产品的成败关键不在于它更聪明,而在于它更规范。

第五节| 靠的不是天才,而是高密度团队

当模型从实验室走向实际应用,决定成败的不只是技术,更是人。

Tom Brown 的这场对谈,讲得最多的不是模型有多强,而是团队怎么做事。

他深有体会:

“很多人以为这是一两个顶级研究员推动出来的。但 Claude 的诞生,其实靠的是一个高密度、高纪律的团队结构。”

① 不比个人智商,比团队交付力

Tom 回忆,他在 OpenAI 早期就意识到:

“一个模型从想法到上线,要踩过无数个坑。不是天才解决一切,而是要很多细致、耐心的工程工作。”

所以在 Anthropic,他和创始团队一开始就设定了招聘原则:

  • 不只看个人能力,更看是否认同使命愿景

  • 不追求明星个人,而是关注能否与团队协作共事

  • 不鼓励各自为战,而是强调透明沟通和集体决策

一句话:不是谁最聪明,而是谁最认同这件事。

② AI产品成败看组织能力,不看技术能力

Tom 特别讲到一个关键能力:context switching(上下文切换)。

“AI 公司必须同时做研究、工程、产品、安全,甚至合规和商务。”

而这背后,最难的不是技术,而是组织能不能在这些事情之间顺畅切换、迅速对齐、减少内耗。

Anthropic 内部做法是:

  • 团队之间用非常细的接口沟通(明确输入、输出、责任人);

  • 大部分协作依赖文档,不依赖会议;

  • 所有测试和上线流程都有“公共评估基准”,避免部门扯皮。

做 AI 产品不是全员跟风,而是各司其职、精准分工。

③ 管理者要消除混乱,不是发号施令

Tom 提出一个很有意思的观点:

我们不是在管理人,而是在管理不确定性。

举个例子:

  • 一个功能上线前,产品会先把目标用数据标准写清楚;

  • 工程团队接手后,不是靠猜,而是靠验证链条逐步压缩出错空间;

  • 模型团队提供的是“可调用版本”,不是研究草稿。

这套流程让 Anthropic 的模型不只是跑得起来,更重要的是在客户那里跑得稳、用得住。

Tom 最后总结:

“Anthropic 并不靠单点突破, 而是建立了能持续化解复杂性、有序推进目标的组织。”

这也解释了 Claude 为何能成功落地:不是靠某个天才想法,而是靠组织能力和工程积累,一步步打磨出来的。

结语| AI 产品闭环的新分水岭

Tom Brown 这场对谈,没吹概念,没画大饼。

他说的,是一个正在成型的新范式:AI 不止是模型之争,更是产品之战、组织之战。

Claude 的成功不是偶然。

它背后,是四年从 OpenAI 到 Anthropic 的积累:工程优先的理念,安全可控的机制,上下游闭环的反馈,还有组织协作的模式。

正如 Tom 所说:

有了能力,才有资格谈产品;做成产品,才有资格谈市场。

而一旦进入市场,评判标准只有一个:是不是能持续地创造价值。

Anthropic 已经证明了“能不能做”。

Claude 能不能跑通商业闭环,现在已经有答案了。

下一个问题,是:谁能把模型真正做成产品?谁能让客户真正产生依赖?

本文由AI深度研究院出品,内容翻译整理自Tom Brown在YC播客访谈内容翻译整理。未经授权,不得转载。。

星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标

参考资料:

https://www.youtube.com/watch?v=JdT78t1Offo&t=5s&ab_channel=YCombinator

https://www.ycombinator.com/library?utm_source=chatgpt.com

https://www.theinformation.com/articles/anthropic-revenue-pace-nears-5-billion-run-mega-round?utm_source=chatgpt.com

https://www.bloomberg.com/news/articles/2025-07-29/anthropic-nears-deal-to-raise-funding-at-170-billion-valuation?utm_source=chatgpt.com

https://www.aboutamazon.com/news/company-news/amazon-anthropic-ai-investment?utm_source=chatgpt.com

https://apnews.com/article/f5108beaa33455f331010489e03586d4?utm_source=chatgpt.com

https://www.reuters.com/business/anthropic-hits-3-billion-annualized-revenue-business-demand-ai-2025-05-30/?utm_source=chatgpt.com

来源:官方媒体/网络新闻

排版:Atlas

编辑:深思

主编: 图灵

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毛主席对尼泊尔首相说:你想把珠峰全部划归贵国?还有更好的办法

毛主席对尼泊尔首相说:你想把珠峰全部划归贵国?还有更好的办法

鹤羽说个事
2025-10-30 15:53:46
菲律宾遭台风灾害,外交部:中方出于人道主义提供现汇和紧急物资援助

菲律宾遭台风灾害,外交部:中方出于人道主义提供现汇和紧急物资援助

澎湃新闻
2025-11-11 15:30:27
广汽埃安UT super上市,电池租用购车价4.99万元起,京东独家销售

广汽埃安UT super上市,电池租用购车价4.99万元起,京东独家销售

红涛说車
2025-11-10 17:30:30
主力资金 | 尾盘资金出逃19股超亿元

主力资金 | 尾盘资金出逃19股超亿元

数据宝
2025-11-11 18:58:07
曾是中国第二大民企,今欠下7500亿巨债!海航帝国的崩塌内幕曝光

曾是中国第二大民企,今欠下7500亿巨债!海航帝国的崩塌内幕曝光

青眼财经
2025-11-11 18:56:33
1700万镑太值了,鲁尼:扎卡大概率就是本赛季英超最佳签约

1700万镑太值了,鲁尼:扎卡大概率就是本赛季英超最佳签约

懂球帝
2025-11-11 01:45:04
8人“倒戈”,美国史上最长“停摆”有望结束?众议院民主党人:这是“投降”

8人“倒戈”,美国史上最长“停摆”有望结束?众议院民主党人:这是“投降”

红星新闻
2025-11-10 19:18:22
德转统计巴萨队史射手榜前20:梅西断崖领先,莱万108球第13位

德转统计巴萨队史射手榜前20:梅西断崖领先,莱万108球第13位

懂球帝
2025-11-11 04:13:04
3天紧急改口,高市早苗知道自己把事闹大了!中国这次不再客气了

3天紧急改口,高市早苗知道自己把事闹大了!中国这次不再客气了

军机Talk
2025-11-11 12:03:52
林丹在西班牙为子庆生,谢杏芳盛装笑容满面,豪宅别墅显得热闹

林丹在西班牙为子庆生,谢杏芳盛装笑容满面,豪宅别墅显得热闹

科学发掘
2025-11-06 13:42:50
听到红军城失守的消息,特朗普态度反转,不再跟普京“斗气”了

听到红军城失守的消息,特朗普态度反转,不再跟普京“斗气”了

军机Talk
2025-11-11 12:11:01
房车禁令下的双面困境!心中的诗与远方,终究敌不过现实的冲突

房车禁令下的双面困境!心中的诗与远方,终究敌不过现实的冲突

行远走天下
2025-08-21 17:25:05
网红直播偷拍模特辣妹还做不雅姿势,模特愤怒报警。

网红直播偷拍模特辣妹还做不雅姿势,模特愤怒报警。

环球趣闻分享
2025-11-10 14:42:05
华中农业28岁博士摘橘子,掉入水中溺亡,老父亲在河边烧纸悼念

华中农业28岁博士摘橘子,掉入水中溺亡,老父亲在河边烧纸悼念

魔都姐姐杂谈
2025-11-11 07:14:31
张文宏直言:不管你信不信,老人过了80岁,基本都有如下7个现状

张文宏直言:不管你信不信,老人过了80岁,基本都有如下7个现状

黄河新流域
2025-09-28 13:34:43
树倒猢狲散,乌克兰士兵纷纷缴械投降,泽连斯基还得再丢一座城?

树倒猢狲散,乌克兰士兵纷纷缴械投降,泽连斯基还得再丢一座城?

乐天闲聊
2025-11-04 14:29:52
稀土的现实与想象

稀土的现实与想象

阿罗汉不约
2025-11-09 14:29:08
卫健委通报医院回应,当事人报警,涉事副院长与女医生将被问责

卫健委通报医院回应,当事人报警,涉事副院长与女医生将被问责

现代小青青慕慕
2025-11-08 05:57:56
老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老年人如何应对肌肉流失?医生提醒:坚持这两个方法,效果非常好

老嘪科普
2025-10-23 19:21:38
陈慧琳演唱会穿三角裤衩,五十多了合适吗?

陈慧琳演唱会穿三角裤衩,五十多了合适吗?

草莓解说体育
2025-11-10 06:24:55
2025-11-11 19:56:49
AI深度研究员 incentive-icons
AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
316文章数 156关注度
往期回顾 全部

财经要闻

南昌三瑞智能IPO:委外代工模式存疑

头条要闻

媒体:高市早苗接连触碰中国底线 日本贼心不死

头条要闻

媒体:高市早苗接连触碰中国底线 日本贼心不死

体育要闻

一个14岁的小男孩,决定了谁能晋级世界杯

娱乐要闻

古二曝秦雯多次炫耀袭警经历

科技要闻

苹果新品惨败,产线拆光、二代搁浅!

汽车要闻

盈利"大考",汽车智能化企业的中场战事

态度原创

健康
教育
旅游
数码
公开课

超声探头会加重受伤情况吗?

教育要闻

四川志愿填报,这样准备就对了!

旅游要闻

一本口袋书逛遍京城博物馆 这些地方可购买——

数码要闻

天马官宣首个集成NFC功能的屏幕面板,号称可实现“3cm隔空响应”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版