全文 4,000字 | 阅读约 13 分钟
![]()
(Tom Brown 谈 :发现 scaling law 的震撼时刻)
演示很好看。
上线却总卡壳。
卡在可靠性,卡在成本,卡在能否稳定重现。
最关键的卡点是:能否真正进入工作环境,而不是停留在 Demo 阶段。
2025 年 8 月 19 日,YC 的一场公开对谈中,Anthropic 联合创始人 Tom Brown 谈到了他的“非常规路径”、scaling laws 带来的行业转折,以及最容易被忽略、却最要命的事:产品化思维。
Claude 不是能聊天的模型,而是能负责的系统。
如何做到"能负责"?他们聚焦可用、可控、可复现三大支柱。技术扎实了,商业自然跟上:
《彭博社》:2025年7月,Anthropic 年化营收达约 40 亿美元;
《The Information》:2025年8月,最新报道数字逼近 50 亿美元。
这样的增长背后,是资本与渠道的双重支撑。亚马逊 40 亿美元投资到位,Claude 通过 AWS Bedrock 进入企业。达美航空、西门子等一线客户已经接入 Claude 模型,应用场景覆盖客服、运维、合规等核心工作流。
Anthropic 成功的关键,不在模型强大,而在产品完整。
Tom Brown 从 GPT-3 的幕后 builder,到 Claude 的产品操盘手,不靠热度拉估值、不靠参数刷榜单,而是靠一件事赢下今天:
他把模型“做成了产品”。
第一节|不是科学家,是开发者
Tom Brown 一直不是传统意义上的“尖子生”。
他在播客开场就自嘲:我上大学时,编程课经常挂科。靠重修才能勉强过。 MIT 毕业后,也没去大厂做研究,而是加入朋友的创业公司写代码。
也许正因为这样的经历,他形成了独特的工程思维:“我喜欢亲手搭建系统,把它跑通,然后看到它真正发挥作用。”
从早期创业到 OpenAI 打造 GPT 训练系统,他的风格一直没变。
而这种"把东西真正做出来"的工程师思维,正是 GPT 成功所需要的。
✅他是开发者,不是科学家。
2018-2019年,OpenAI 正在开发 GPT-3。这个模型的规模达到了新高度:1750亿参数,训练工程的难度可想而知。Tom Brown 在 2018 年重返 OpenAI,并带队完成了 GPT-3 的训练部署。
他说:“GPT-3 是个特别复杂的项目,不只是训练,而是整个系统得从头到尾都能跑通。”
换句话说,不是简单写个模型代码,而是:
要搭好硬件资源和训练脚本;
要能监控每一次微调是否有效;
要能在模型出问题时快速定位、及时修复、准确复现。
当成百上千个指标同时运行时,一旦模型崩溃,他必须第一时间定位出问题的超参数。
这种工程实践让 Tom Brown 对 AI 的理解更加深刻。而 GPT-3 项目结束后,他没去接着追 GPT-4,也没有选择进学术圈发表论文。他选择离开 OpenAI,另起炉灶。
原因只有一个——
“我不只是想让模型变聪明,我想让它能用。”
第二节|不追最强模型,只追最稳闭环
Tom Brown 这样说:现在很多模型表现很好,但它们无法在现实世界里真正被用起来。
不是因为它们不聪明,而是缺少“产品闭环”:
你不能总指望用户容忍模型说错话;
你不能让工程团队修 bug 没完没了;
你更不能处处要人工补救,却叫"AI上线"。
一个能用的 AI 产品,需要三件事:
① 它必须“能复现”
Tom 的原话是:“你得能多次拿到一致的结果。”
很多模型 demo 看起来很炫,但只成功一次,后面怎么调都不稳定。 这在做科研可以接受,但在做产品时,就意味着灾难。
企业不会要一个只在台上表现好的模型。它得在流程里、在用户面前,每一次都可靠。
Anthropic 团队花了很多精力,做了一套调试和回测的工具链,确保每次修改不会破坏已有能力。不是靠猜,而是靠记录、测试和对比。
② 它必须“能被控制”
“控制”不是压制模型,而是确保它在各种环境下,都不会突然说错话、做错事。
Tom 举了个例子:Claude 在某些客服场景里回答非常稳,但有时在自由聊天模式下,可能会绕远路或说废话。
为了解决这个问题,他们设计了“行为配置”:不同的客户、不同的使用目标,可以配置 Claude 的语气、答案风格、甚至输出的格式。
他们不是要求一个模型适配所有人,而是让它变成多个可控的角色。
这也是 Claude 被企业接受的原因之一:它更像一个"可靠的同事",而非"聪明的实习生"。
③ 它必须“能查得清”
Claude 要成为产品,第一步不是功能强,而是能看懂它哪错了。
Tom 特别强调了这个点:“我们必须知道模型回答错误是因为训练数据的问题,还是因为提示词不够好,还是系统接入出了错。”
为了做到这一点,他们开发了很多辅助工具:
日志记录每一次调用;
提示词版本有清晰管理;
回答可以被评估、打分、标记。
不是靠猜,而是像调试代码一样,一步步拆解原因。
这些理念平淡无奇:既不谈"万亿参数"的宏大,也不吹"超越人类"的神奇,更不提"图灵测试"的突破。
然而,正是这些朴实的工程原则,决定了 AI 能否真正投入使用。
第三节|Claude 到底怎么赚钱?
Tom Brown 更看重一个词:产品。
在他看来,关键不是让模型有多聪明,而是做出真正可部署、可交付、可维护的系统。
这句话背后,其实有三个关键词:客户、接口、回报。
① 客户不是体验用户,是业务用户
Tom 说得很清楚:
“我们的目标用户不是‘好奇的人’,而是那些真的有工作要完成的人。”
Anthropic 一开始就没有主打娱乐性产品,也没去抢陪用户聊天的流量。他们重点做的是——Claude for Work(面向工作的 Claude)。
也就是:
能帮客服处理对话;
能替医生写初稿、分析文档;
能支持生物医药公司处理复杂研究数据。
这些客户不是为了追逐热点,而是为了提效、降本、规范流程。
这些合作不是靠关系,而是靠实际价值:能否节省时间,能否减少人工,能否提高准确率。
② 接口不是产品界面,是系统组件
Claude 真正的落地方式,不是大家打开个网站来用,而是被嵌入到了企业的工作流里。
比如:
客服团队:Claude 会自动归类问题、推荐答案草稿;
法律顾问:Claude 被内嵌到合同审查工具中,提供风险提示;
医疗团队:Claude 参与报告生成、知识抽取。
这些不是点到为止,而是深入使用、系统集成、长期运行。
Claude 不是孤立存在的产品,而是融入日常工作的重要一环。 ——Tom Brown
这意味着什么? 意味着 Claude 不再以对话量论价值,而是以实际完成的任务为准。
③ 回报不是技术领先,是商业价值
Tom 没有谈估值,也没强调技术多领先,而是强调了一组最直接的商业数据:
“我们的目标是:让 Claude 自己带来收入。”
根据彭博社、《The Information》等媒体在 2025 年 7–8 月的报道:
Anthropic 年化营收已达 40–50 亿美元区间;
客户主要来自医疗、航空、能源、制造、金融等行业;
Claude 是目前增长最快的大模型产品之一。
这些增长,并不靠炒概念、讲故事,而是靠产品实打实在客户场景里干活拿钱。
他们在做的,不是拿技术去推市场,
而是从需求里反推模型该怎么演进。
第四节|工程纪律,决定能不能走到最后
如果你以为,Claude 能在企业场景跑通,是因为模型“够聪明”,那就低估了它背后的“冷启动难度”。
Tom Brown 在对谈里点出一个经常被忽略的核心问题:
“大模型不是发布之后就能自动好用的。真正的问题,是怎么让它每次都给出稳定、准确的结果。”
换句话说,真正的挑战,不是“能不能答对一次”,而是能不能答对一千次、一万次。
① 从实验室走向生产线,降低不确定性
Tom 在 OpenAI 参与训练 GPT-2 和 GPT-3 时就意识到:
模型越大,能力越强,但同时也越不可控;
每一次输出都有“随机性”,模型在不同 prompt 下的表现差异很大;
想要用到实际流程中,就得从“探索性研究”走向“工程标准”。
他说:
“我们花了大量精力,把原本‘很艺术’的调优工作,变成了可追踪、可迭代的标准化过程。”
这听起来枯燥,却是 Claude 真正变成“产品”的关键。
② 每一次错误都要能追根溯源
Claude能上线,关键不在于不出错,而在于出错后能追溯、能修复、能改进。
Tom 说得很实在:
“模型表现不好,不是因为它不够聪明,而是我们还没搞清楚它怎么运作、哪会出错。”
在 Anthropic,开发流程像工业流水线一样:
每一次模型输出,都会打上“可追溯标签”;
每一组实验结果,都有版本号、对比基准、修正路径;
即使是“幻觉”错误,也要被细化成“哪种数据不足、哪类问题边界不清楚”等可处理问题。
像工业制造一样,系统分析每一次偏差,把问题转化为优化机会。
③ 合规要求必须前置,不能事后补救
大多数人以为安全、对齐、合规是在发布后“补救”的环节。但 Tom 直接指出:
“我们一开始设计 Claude 时,就考虑到它要面对金融、医疗、法律等高风险行业。”
也就是说:
Claude 的对话机制、拒答策略、信息引用方式,都预设了合规限制;
不是“看心情”答不答,而是明确设计规则——什么能说,什么不能说;
就连客户自己上传的知识库,Claude 在调用时也要“保持边界”。
这种合规,不是为了限制模型,而是为了让它能被信任、能复用、能部署。
从这个角度看,AI 产品的成败关键不在于它更聪明,而在于它更规范。
第五节| 靠的不是天才,而是高密度团队
当模型从实验室走向实际应用,决定成败的不只是技术,更是人。
Tom Brown 的这场对谈,讲得最多的不是模型有多强,而是团队怎么做事。
他深有体会:
“很多人以为这是一两个顶级研究员推动出来的。但 Claude 的诞生,其实靠的是一个高密度、高纪律的团队结构。”
① 不比个人智商,比团队交付力
Tom 回忆,他在 OpenAI 早期就意识到:
“一个模型从想法到上线,要踩过无数个坑。不是天才解决一切,而是要很多细致、耐心的工程工作。”
所以在 Anthropic,他和创始团队一开始就设定了招聘原则:
不只看个人能力,更看是否认同使命愿景;
不追求明星个人,而是关注能否与团队协作共事;
不鼓励各自为战,而是强调透明沟通和集体决策。
一句话:不是谁最聪明,而是谁最认同这件事。
② AI产品成败看组织能力,不看技术能力
Tom 特别讲到一个关键能力:context switching(上下文切换)。
“AI 公司必须同时做研究、工程、产品、安全,甚至合规和商务。”
而这背后,最难的不是技术,而是组织能不能在这些事情之间顺畅切换、迅速对齐、减少内耗。
Anthropic 内部做法是:
团队之间用非常细的接口沟通(明确输入、输出、责任人);
大部分协作依赖文档,不依赖会议;
所有测试和上线流程都有“公共评估基准”,避免部门扯皮。
做 AI 产品不是全员跟风,而是各司其职、精准分工。
③ 管理者要消除混乱,不是发号施令
Tom 提出一个很有意思的观点:
我们不是在管理人,而是在管理不确定性。
举个例子:
一个功能上线前,产品会先把目标用数据标准写清楚;
工程团队接手后,不是靠猜,而是靠验证链条逐步压缩出错空间;
模型团队提供的是“可调用版本”,不是研究草稿。
这套流程让 Anthropic 的模型不只是跑得起来,更重要的是在客户那里跑得稳、用得住。
Tom 最后总结:
“Anthropic 并不靠单点突破, 而是建立了能持续化解复杂性、有序推进目标的组织。”
这也解释了 Claude 为何能成功落地:不是靠某个天才想法,而是靠组织能力和工程积累,一步步打磨出来的。
结语| AI 产品闭环的新分水岭
Tom Brown 这场对谈,没吹概念,没画大饼。
他说的,是一个正在成型的新范式:AI 不止是模型之争,更是产品之战、组织之战。
Claude 的成功不是偶然。
它背后,是四年从 OpenAI 到 Anthropic 的积累:工程优先的理念,安全可控的机制,上下游闭环的反馈,还有组织协作的模式。
正如 Tom 所说:
有了能力,才有资格谈产品;做成产品,才有资格谈市场。
而一旦进入市场,评判标准只有一个:是不是能持续地创造价值。
Anthropic 已经证明了“能不能做”。
Claude 能不能跑通商业闭环,现在已经有答案了。
下一个问题,是:谁能把模型真正做成产品?谁能让客户真正产生依赖?
本文由AI深度研究院出品,内容翻译整理自Tom Brown在YC播客访谈内容翻译整理。未经授权,不得转载。。
星标公众号, 点这里 1. 点击右上角 2. 点击"设为星标" ← AI深度研究员 ⋮ ← 设为星标
参考资料:
https://www.youtube.com/watch?v=JdT78t1Offo&t=5s&ab_channel=YCombinator
https://www.ycombinator.com/library?utm_source=chatgpt.com
https://www.theinformation.com/articles/anthropic-revenue-pace-nears-5-billion-run-mega-round?utm_source=chatgpt.com
https://www.bloomberg.com/news/articles/2025-07-29/anthropic-nears-deal-to-raise-funding-at-170-billion-valuation?utm_source=chatgpt.com
https://www.aboutamazon.com/news/company-news/amazon-anthropic-ai-investment?utm_source=chatgpt.com
https://apnews.com/article/f5108beaa33455f331010489e03586d4?utm_source=chatgpt.com
https://www.reuters.com/business/anthropic-hits-3-billion-annualized-revenue-business-demand-ai-2025-05-30/?utm_source=chatgpt.com
来源:官方媒体/网络新闻
排版:Atlas
编辑:深思
主编: 图灵
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.