网易首页 > 网易号 > 正文 申请入驻

Claude产品经理Lenny播客全文精译

0
分享至


开场
我认为,要找到“恰到好处的 AGI 信仰”非常难。给一个超级强、接近 AGI 的模型做产品,其实很容易;真正困难的是,在当前模型能力下,如何把它的最大潜力真正激发出来。
我从来没见过你们在 Anthropic 这样的发布速度。
我们想把发布路上的每一个障碍都拿掉。很多产品功能的周期,已经从 6 个月缩短到 1 个月,有时甚至只要 1 天。你们采访了几百位 PM,我总觉得很多人对这个角色的理解方式还是不对。
PM 这个岗位正在快速变化。对 AI 原生产品来说,最重要的是极快地迭代,想办法让功能真的做到每周都能上线。
那么你觉得,PM 现在最需要培养的新能力是什么?
这还是回到“产品品味”上。随着写代码变得越来越便宜,真正更有价值的,是决定写什么。
今天的嘉宾是 Cat Woo,Anthropic 里 Claude Code 和 co-work 的产品负责人。Cat 站在 AI、产品和构建方式变化的中心位置,她和团队正在打造一种最能改变我们构建产品方式的产品。她有很多洞见、经验和判断。你绝对不能错过这期节目。

你在 Anthropic 的角色
Lenny: 我有太多问题了,非常高兴你来做客。先从你的角色说起,尤其是你和 Boris 的分工。大家都知道 Boris。他那期节目是这档播客里最受欢迎的一期。没压力哈。他创造了 Claude Code,带队工作,还能从手机上每天发出成堆的 PR。我现在都不知道具体数字了。
我觉得很多人低估了你对 Claude Code、co-work,以及你们正在做的所有东西的贡献。你帮大家理解一下:你在团队里到底做什么?你怎么和 Boris 协作?你们怎么分工?Claude Code 团队里的 PM 角色到底长什么样?
Cat: 我觉得自己很幸运能和 Boris 一起工作。他是非常棒的思考伙伴,也是我们的技术负责人。他很强的一点,是能非常清楚地描绘出产品在 3 个月、6 个月后应该是什么样子,也就是这个产品未来的“AGI 版”应该长什么样。
我的很多工作,就是去想:从今天的位置出发,怎么走到那个 3 到 6 个月后的愿景。与此同时,我花更多时间在跨团队协同上,确保市场、销售、财务、算力等团队都真正认同这个计划,大家朝同一个方向划船,并且在功能准备好时,没有任何阻碍上线的因素。
我觉得这套分工之所以有效,是因为我们在很多问题上几乎“心灵合一”,但边界其实又相当模糊。大概 80% 的事情我们是共同决定的,剩下 20% 的事情里,有些我更在意,我就会去推进;另一些他更在意,他就会直接负责。

为什么 AI 时代的 PM 角色变了
Lenny: 你之前跟我说过,你经常面试成百上千位 PM。如果我每次听到有人让我介绍 Anthropic 的人、想去 Anthropic 做 PM,我都能拿到一笔“分成”,那我大概已经有 300 亿 ARR 了。
Anthropic 现在就是大家最想去工作的地方。所以我完全能想象你面试了多少 PM。你说你经常看到有人把这件事理解错了,理解成了他们以为做一个成功的 AI 产品 PM 需要的方式。你能说说你看到了什么,以及现在想要成功到底需要理解什么吗?
Cat: 在 AI 出现之前,技术变化慢得多,所以你可以按 6 到 12 个月的时间尺度来规划。因为功能发布速度比较慢,所以大家更强调和其他协作团队配合,确保他们先把能解锁你功能的部分做出来。那时候代码很贵,制造能力也慢。
现在有了 AI,再加上工程速度被极大加速,模型能力也在快速进步,很多产品功能的周期从 6 个月缩短到 1 个月,有时甚至一周,甚至一天。也就是说,产品真的必须非常快地发布。
这意味着,作为 PM,应该少把重点放在让多季度路线图和合作团队对齐上,而应该更多思考:怎么最快把东西推到线上?怎么做一个产品角落,让工程师或 PM 有了想法后,到了周末前就能把东西交到用户手里?
我觉得,在 AI 原生产品上表现最好的 PM,都是那些能把“从想法到用户手里”的时间尽量压缩的人,并且他们能定义清楚,这个产品最重要的、必须开箱即用的任务是什么。
Lenny: 我喜欢你这一点。你的意思就是,很多人还没真正意识到自己需要多快移动,以及这份工作的很大一部分,其实就是推动团队加速。那到底是什么在帮助这件事发生?你们 PM 团队是怎么让大家跑这么快的?当然,前提是能用到最先进的模型。
Cat: 第一件事,是设定清晰、明确的目标。因为 LLM 太通用了,反而会让“我们在为谁做、我们要解决什么问题、最重要的使用场景是什么”变得很模糊。
所以一个优秀的 PM 能说清楚:我们的关键用户是专业开发者;这个功能要解决的核心问题,可能是权限提示太多,让人产生疲劳;我们希望让企业里的专业开发者在安全前提下,把权限提示降到零。这样一来,就能把很多可能的方案排除掉,让团队更聚焦地往一个明确方向做,帮助用户只用一次提示就完成更多工作。
第二件非常重要的事,是建立一个可重复的发布流程。比如在 Claude Code 里,我们几乎所有功能都会先以 research preview 的形式发布。我们会明确标注,这还是早期产品,只是一个想法,只是想收集反馈并持续迭代,它不一定会永久支持。
这样做能降低我们发布功能时的承诺压力。我们可以在一两周内先把东西发出去。
第三件事,是 PM 要帮团队建立一套工作框架,让大家知道什么时候该拉上跨职能伙伴,以及这些伙伴的预期是什么。比如我们工程、市场和文档之间的流程就非常紧密。工程师觉得某个功能准备好了,而且我们内部已经自己用过之后,就会把它发到我们的 evergreen launch room。然后负责文档的 Sarah、负责 PMM 的 Alex,以及 Devril 里的 Tar 和 Lydia,会立刻跟进,第二天就能把营销公告转出来。
因为有了这套非常紧密的流程,工程师发布东西的阻力就小很多,而 PM 的职责就是把这种机制搭起来。

PRD 现在还重要吗
Lenny: 那 PRD 在这里扮演什么角色?你刚才说“目标”很重要,关键是对成功标准达成一致——这东西是给谁用的?不是给谁用的?你还在写 PRD 吗?还是只写几条要点?在 AI 时代,这种东西怎么演化?
Cat: 我们主要做两件事。
第一,我们有非常严格的指标体系,每周都会和整个团队一起做 metrics readout。目的是让每个人都真正理解业务的各个方面:我们的关键目标是什么,趋势如何,驱动因素是什么。
第二,我们会维护一份团队原则清单。这份清单包括我们的核心用户是谁,以及为什么他们是核心用户。我们把这些写清楚,是希望团队里的每个人都理解业务是怎么运作的,理解什么对我们重要,也理解我们愿意做哪些取舍。
这样大家就可以自己做判断,而不必总卡在 PM 或其他利益相关方那里。
Lenny: 我很喜欢这一点,因为这说明“未来还是需要 PM”。外界总有人在说:为什么还需要 PM?我们直接 ship、直接 build 就好了,我们只需要工程师。
Cat: 其实我们会在某些情况下写 PRD。对于特别模糊的功能,写一页纸还是很有帮助的,写清楚目标是什么、哪些是令人愉快的使用场景、当前有哪些失败模式需要修复。
而且有些项目,尤其是需要重基础设施的项目,确实会持续很多个月。那种情况下,我们还是会写 PRD。

为什么 Anthropic 能这么快
Lenny: 我想再深入一点,了解你们为什么能这么快。我从来没见过 Anthropic 这样的发布速度。有人做了一个 Anthropic 发布日历,结果几乎每天都有一个重大功能或产品上线。
所以有个大家在网上问的问题是:你们刚刚发布的那个非常强的模型 Mythos 还处于 preview,因为太强了,大家有点担心它的能力。你们内部是不是在用它?这是不是你们能这么快推进的原因之一?
Cat: 我们其实已经连续好几个季度都很快了,所以这不完全是 Mythos 的功劳。Mythos 确实是一个极强的模型。我们内部也会使用这些模型,这确实让我们的发布速度更快了一点,但我不认为这能解释增长的大头。
我觉得很大一部分原因在于流程和团队预期。我们的流程很轻。我们希望移除一切会阻碍发布的东西。我们希望让团队里每个人都能感到自己有权把一个想法,从纯想法变成真实出现在世界里的东西,少则一周,多则一天。
Lenny: 哇,这真是太厉害了。既有最好的模型,又在做产品本身。太酷了。
Cat: 我们非常幸运,能和最前沿的模型一起工作。
Lenny: 这优势真的太大了。就是造一个东西,然后自己马上用起来,再进一步加速。

关于 Claude Code 源码泄露
Lenny: 还有几个我想单独聊的话题。Anthropic 这边最近事情很多,我真的很想听听你的看法。一个是,大概一周前,Claude Code 的完整源代码泄露了。有人把它放到了网上。我觉得那是某个人犯了错误。你能说说发生了什么、哪里出了问题、大家应该知道什么吗?
Cat: 我们一看到这件事就立刻去查了。结果发现,这是人为错误造成的。是有一位同事在用 Claude 写 PR,这其实只是一次包发布方式的更新,而且这件事还经过了两层人工审核。
所以这次确实是人为失误。我们已经加固了流程,确保以后不会再发生。
Lenny: 那个人现在还在 Anthropic 吗?他们现在还做得好吗?
Cat: 是的,是的。这是一个流程失败,最重要的是从中学习,并增加更多防护措施,避免再次发生。我们现在的重点就是这个,而且大部分改进都已经上线了。

关于 Open Claude / Open Claude 订阅限制
Lenny: 另一个问题是 Open Claude。最近有个动作,是不再允许大家把 Claude 订阅拿去给自己的 open clause 用。很多人很不开心,不明白为什么这么做。他们觉得这对开源社区造成了伤害。大家应该怎么理解这个决定?
Cat: 我们看到 Claude 的需求非常大,所以一直在努力扩展基础设施,同时让我们的 harness 更加 token efficient,这样用户能获得更多使用量。
不过,第三方产品和我们一方产品的使用模式不一样,并不是为第三方产品设计的。我们花了很多时间去想,怎么才能给出最顺滑的过渡方案。
所以我很高兴最后能说,所有订阅用户都会额外拿到一些 credits。但与此同时,我们也必须做一个艰难决定:优先照顾第一方产品和我们的 API。这个决定就是由此产生的。
Lenny: 对我来说,这其实非常合理。你们相当于以每月 200 美元的价格补贴这类用量,差不多就是无限使用。我觉得很多人不理解,做生意是要赚钱的。我们得追求盈利,不能因为需求太旺就把算力随便送出去。所以我能理解。

Anthropic 的 PM 团队如何组织
Lenny: 回到 PM 团队,Anthropic 的 PM 团队是什么样的?大概有多少 PM?组织方式是怎样的?
Cat: 我们有好几个 PM 团队。现在大概有 30 到 40 位 PM 左右。
有一个研究 PM 团队,由 Diane 负责,主要任务是理解客户对模型的所有反馈,然后把这些反馈传给最合适的研究团队去处理,同时也负责推进模型发布。
还有 Claude Developer Platform 团队,维护 Claude Code 所依赖的 API,也会发布像 managed agents 这样的功能,让你可以构建自己的 agent,由我们代为托管。
还有负责 Claude Code 和 co-work 核心产品的团队。
还有企业团队,帮助 Claude Code 和 co-work 更容易被企业客户采用,包括成本控制、RBAC、安全控制,以及确保企业在使用我们的工具时感到足够放心和舒适。
另外我们还有增长团队,负责推动整个产品矩阵的增长。我们和他们在 Claude Code、co-work 的增长上合作很多,我知道他们也会和其他团队一起做 CDP 增长,也就是 Claude API 用户的增长。

PM 会减少还是增加
Lenny: 说到增长,Amol 刚上过节目。他有一个很有意思的观点,是很多人以前没怎么讲过的。大家总觉得未来需要更少 PM,理由是“为什么还需要 PM?工程师自己就能 ship”。
但他的看法是,因为工程师太快了,PM 和设计师反而被挤压了。你很难跟上,因为每天都在发功能。他的结论是:他反而需要更多 PM,因为根本跟不上。
你怎么看?你觉得未来 PM 的招聘会增加吗?你觉得这个职业长期会怎么变化?
Cat: 我觉得所有角色都在融合。PM 在做一些工程工作,工程师在做一些 PM 的工作,设计师也在做 PM,并且也在落代码。
你可以选择招更多有很强产品品味的工程师,也可以保持工程师招聘规模不变,但招更多 PM 来帮他们的工作定方向。
我们团队更偏向于招有很强产品品味的工程师。这样可以减少发布产品时的额外开销。我们团队里有很多工程师,能完全独立地从 Twitter 上看到用户反馈,一路做到一周末把产品发出来,几乎不需要产品介入。
我觉得这其实是最高效的交付方式。工程和 PM 的边界正在重叠,而且你在任何一边多一点人手,都会有很大收益。产品品味仍然是非常稀缺的技能,只要我们觉得某个人强烈体现出了这种能力,我们基本都会招。
Lenny: 你的背景是工程师,对吗?
Cat: 对,我做了很多年工程师。后来我还短暂做过 VC,然后才加入 Anthropic。其实我们团队里几乎所有 PM,要么以前就是工程师,要么在 Claude Code 这边写过代码。这也是为什么我们团队彼此信任很强、推进很快。我们的设计师以前也都当过前端工程师。
Lenny: 这正是大家最关心的问题:这种边界融合正在发生。很多人真正想知道的是——如果你出身于工程、产品或者设计,这三种核心能力里,哪一种以后最值钱?
在 Anthropic、在 Claude Code 场景里,工程能力当然很重要。但在别的公司,如果你有设计背景,做 PM 可能更有价值,或者做 PM 本身就是最有价值的方向。
Cat: 我还是觉得,核心还是产品品味。随着代码写起来越来越便宜,真正更值钱的是决定写什么。这个功能的正确 UX 是什么?用户体验它的最佳方式是什么?
我们每天都会收到成千上万条 GitHub issue,要求各种各样的东西。要判断哪些值得做、应该怎么做,这需要大量的判断力和品味。我认为这种能力可以来自任何背景,但这是最重要的。
不过至少在接下来的几个月里,工程背景特别有用的原因是:如果你有工程背景,你会更清楚一件事情到底应该有多难。这个判断常常会影响你做什么选择。如果某件事特别容易做,可能你与其争论,不如花一个小时直接把它做掉;但如果它很难,而且你提前知道这点,那你就知道这会给团队带来更高的交付成本。
所以它对优先级排序会有帮助。
Lenny: 你说“接下来的几个月”是因为模型可能在未来几个月里变得特别好,以至于你不一定还需要这些判断吗?
Cat: 我觉得有价值的技能组合变化得非常快,所以很难预测几个月之后会怎样。我的意思不是我在预测某种具体的能力转变,而是说,大规模变化会发生,而且会很快。
Lenny: 你不是在说 Mythos 会出来,一切都变了,然后我们就不需要懂工程了。
Cat: 不是。我只是说,每隔几个月,编码能力都会大幅提升一次,然后角色的价值也会随之变化。最重要的是,你得有第一性原理思维:看清技术环境在怎么变,团队到底需要你做什么,然后直接跳进去把那个缺口补上。
因为工作正在变得更模糊,这就意味着一个优秀的 PM 要能看清所有缺口,判断出最重要的缺口,然后想办法学会那个技能,或者把自己已有的技能迁移到这个新挑战上。
所以现在的环境更看重那种什么都能上、能快速切换角色、而且对自己做什么没有太多 ego 的人——只要这样能让团队更快。

人类大脑未来还会在哪里有用
Lenny: 我一直在问像你这样站在 AI 前沿、用最新工具构建产品的人一个问题:在人类还没走到超级智能之前,人脑到底还会在哪些方面持续有用、持续必要?
我从你这里听到的基本意思是:选择该做什么、知道市场会往哪走、知道该优先做什么;再就是判断你做出来的东西是不是对的,然后至少先把早期版本推出来。这样理解对吗?还有没有别的地方,人类大脑在未来几个月里仍然会很有用?
Cat: 我觉得人类仍然能提供模型没有的常识。任何一次产品发布都有上千个在动的东西,其中很多都很小,但永远有很多地方可能出错。
模型未必总能很好地理解:谁是所有利益相关方、他们彼此之间什么关系、他们各自偏好是什么、跟他们沟通用什么渠道最合适,才能让他们继续站在你这边。
我觉得很多更偏“战术性常识”、EQ 相关的知识,现在仍然非常有价值。当然,我们也希望模型在这方面越来越强,我相信它们会越来越强,但现在还存在缺口。

怎么在变化中保持冷静
Lenny: 作为人,面对这么持续的变化,你怎么应对?就像一直待在龙卷风中心,也许里面很平静,但你怎么一直跟上发生的事?怎么在这种疯狂变化里保持正常?
Cat: 我们团队里的人基本都比较愿意拥抱混乱。我们会尽量用微笑面对每一个挑战,因为总有很多事情在发生,总有很多风险和棘手情况。如果你对每件事都太紧张,很容易就会 burnout。
所以我们会寻找这样的人:他们看到挑战时会说“这会很难,但我很想去做”,然后尽自己最大努力去做。他们知道自己不可能完美,但只要知道自己尽力了,就能安心睡觉。
Lenny: 这个回答很有意思,也在呼应你前面说的,未来什么技能会重要。有人说过,这可能是世界上最“正常”的时刻了。
Cat: 这确实会变得更难。我感觉很多周,周日晚上还只是一个 P0,等到周一已经变成另一个 P0,周一下午又变成 P0000,你会想:天啊,我怎么会那么担心周日那个 P0。
但你得承认,你能做的只有这么多;你得睡好觉,第二天才能做出好决策;你还得非常残酷地优先排序,把时间花在最重要的事情上。要接受有些事情可以先放掉。
我们确实会发一些没有我理想中那么精致的产品。但我们的首要目标是帮助专业开发者更有力量。如果某个产品不算成功,只要它没有挡住核心使用场景,那就没关系,因为我们会收到反馈,并在下一次发布里修掉。
如果发布的功能有 bug,过去我会整晚睡不着;但现在我已经可以接受了,因为我知道我们会很快收到反馈,也会在下一次更新中修掉它。
Lenny: 我脑海里浮现的是《加勒比海盗》里那个表情包:一个人走下船上的楼梯,而整艘船都在他身后被拆掉了,但他还是非常淡定地往前走。很有意思的是,我认识的所有 Anthropic 人都特别冷静,也特别乐观。
Cat: 我觉得这点非常重要——有这种平静和乐观,而不是“天啊,一切都乱套了”。如果没有这种心态,很容易 burn out。我们也倾向于招聘那些已经在行业里待了一段时间、经历过很多起伏、知道什么能给自己能量、如何长期维持能量的人,这对我们帮助很大。

角色融合会失去什么
Lenny: 我很想问一个问题:既然工程师变成 PM,大家的边界都在融合,我们会失去什么吗?会不会失去职业阶梯和清晰的晋升路径?会不会失去设计一致性、代码质量?总会有一些代价吧。你觉得我们在为更大的好处牺牲什么?
Cat: 我们确实在牺牲产品一致性。
过去,当代码很贵时,你会非常仔细地规划整个产品矩阵:每个产品彼此是什么关系、每一个产品的使用场景是什么、怎么集成,然后通常会针对每个场景做一个产品。
但现在 AI 变化太快了,而且要测试的想法太多,所以我们有时会做出相互重叠的功能。很多时候,是因为内部有两种形态我们都喜欢,希望外部用户来告诉我们到底哪种更好。
但对于新用户来说,这意味着他们可能不知道完成某个目标 X 的最佳路径是什么。我们就需要做更多教育,帮助他们理解核心功能是什么、最佳实践是什么。我觉得这就是大量功能同时上线的代价。
用户也会觉得很难跟上最新变化。传统 PM 场景下,功能一个月或一个季度才发一次,所以用户很容易理解:我每个月看一次就好,半年不看也没事,不会觉得错过了什么。
但在这些 agentic 工具里,不只是 Claude Code 和 co-work,而是整个生态里,大家会觉得自己必须每天刷 Twitter,看看最新的东西是什么。
我觉得我们还有很多可以做的,去让用户没那么像在一台越来越快的跑步机上。我希望用户能觉得:我只要打开这些工具,它们就会教育我、告诉我我需要知道什么,让我自然跟上。
Lenny: 我前几天看到你们发了一个很有意思的新功能,我记得叫 /powerup,基本上会带着你看一遍 Claude Code 的各种好用方式和最佳实践。是不是就是你说的这个方向?
Cat: 对,完全是。以前我们不太想做这种功能,因为我们觉得产品应该足够直观,用户不需要任何教程。
但后来我们意识到,功能实在太多了,用户也真的很需要内置 onboarding。我们稍微偏离了最初的原则——“不要 onboarding 流程”——加了这个功能,因为很多用户都在问:有 100 个功能,我到底必须用哪 10 个?所以我们就把这个东西做出来了。

Anthropic 为什么能逆袭
Lenny: Anthropic 在企业 B2B 这条路上非常成功,而传统企业软件通常不会天天发新东西,往往是季度更新。你们完全相反:几乎每天都有新东西。Anthropic 的这波增长太不可思议了。Anthropic 创业时其实落后很多,大家都说它是资金最少的公司之一,也没什么分发优势,不是第一个跑出来的。OpenAI 当时明显领先。很多人都觉得 Anthropic 长期没法真正竞争。
可现在你们干得非常好,甚至在一段时间里就把一些大公司的团队甩在后面,增长极快。站在内部看,Anthropic 能这么成功、能从落后打到今天,最关键的因素是什么?
Cat: 我觉得最重要的两个因素是:第一,一个统一的使命,这一点的重要性怎么强调都不过分。我们招的人,最看重的是把安全的 AGI 带给全人类。这一点会频繁出现在我们做决策时,影响我们整个产品线到底应该聚焦什么。
因为我们把这个使命放在任何单个产品线之上,所以我们可以做出跨整个组织的快速决定,并且以统一的方式执行。我觉得这是我在这么大规模的公司里从没见过的东西。
Lenny: 所以更明确一点,你的意思是,第一要务是安全对齐,确保 AI 对世界是好的。你是说,有了这个清晰的使命,做决定就会容易很多。
Cat: 如果有两个相互竞争的优先级,我们会讨论哪一个更符合 Anthropic 的使命。这样就更容易决定二者中先做哪一个,最后大家都会支持那个决定。
有时候这意味着:我们本来想在 Claude Code 上发某个功能,但另一个事情更重要,所以我们就会把这个功能往后排,等以后再发。
Lenny: 这点很有意思。它也解释了为什么和另一家名字很像的公司相比,你们不会去做社交网络,也不会去做资讯流,因为这些并不符合使命。这让 Anthropic 保持了专注,而这看起来正是成功的核心要素。
Cat: 对我来说,使命意味着把 Anthropic 的目标放在任何个人、任何单个产品之上。所以我觉得第二个我们很擅长的东西,就是专注。使命和专注不完全是一回事。
使命意味着团队愿意为了 Anthropic 的目标、Anthropic 的 KR,牺牲自己个人目标甚至自己的 KR。大家非常愿意做这种取舍。
极端一点说,如果 Claude Code 失败了,但 Anthropic 成功了,我会非常开心。我们整个团队都非常愿意按这种思路做决定。
Lenny: 我不确定你能不能深入讲这个,但你觉得 Open Claude 的决定是不是也属于这种逻辑:它并没有推进 Anthropic 的使命,所以你们必须停掉,因为它不是你们希望它发挥作用的方式?
Cat: 对 Anthropic 来说,最重要的事情之一,就是尽可能让更多用户接触到我们。我们实现这件事的一个方式,就是通过我们第一方产品的 Claude 订阅。所以我们非常希望把重心放在这上面,但这有时候确实会牺牲第三方产品。

Claude Code、Claude Desktop、co-work 怎么选
Lenny: 我们一直在聊 Claude、co-work 这些东西。我想确保大家真正理解你们是怎么用这些工具的。现在有 Claude Code、Claude Desktop、co-work。最好的理解方式是什么?什么时候用哪一个?你自己分别在什么时候用?
Cat: 我通常会在终端里用 Claude Code,尤其是我在启动一个一次性的编码任务、并且想要用到最新功能的时候。CLI 是我们的起始产品形态,也是很多功能最先落地的地方,所以它也是所有工具里最强的那个。我通常会在一口气想启动一两个任务,或者少量任务时,用它。
如果你要做前端工作,Claude Desktop 就特别好用。我很喜欢用我们的预览功能。比如我在做一个 web app 时,经常会同时打开 Claude Code 和 Desktop,把右侧的预览面板打开,这样我在和 Claude 聊天时,就能实时看到自己在做的网页应用。
对于想要更图形化体验的人来说,Desktop 也很棒。终端对非技术用户来说可能非常陌生。你的机器上会弹出一堆吓人的提示,而你又没法像在其他大多数产品里那样点击和操作,这会让很多人觉得不舒服。
如果你不习惯终端,我非常建议试试 Claude Desktop。Desktop 还有一个优势,就是能一眼看到所有在发生的事情。你可以看到自己的 CLI 终端会话,也能看到其他 Desktop 会话,还能看到在 web 和 mobile 上启动的会话。它相当于一个一站式控制台,让你看到所有任务。
web 和 mobile 的价值,在于它们特别适合“路上发起任务”。CLI 和 Desktop 都要求你在本地笔记本上操作。但现实是,你有时候人在外面,可能在散步、出门,不一定带着笔记本,也不一定会打开电脑。我见过无数人把电脑连在手机上,站在外面办公。那说明我们缺一个能满足这个需求的产品。
对我来说,移动端的意义,就是让你可以在外面直接启动任务,不必把笔记本到处带着,也不必确保自己无论去哪儿笔记本都开着。
Lenny: 我太懂了。我在飞机上也见过这种场景,已经成了一个梗:我得把这个 agent 等完,不能关掉,我得要 Wi‑Fi。
Cat: 对。
Lenny: 而 co-work 呢?
Cat: co-work 负责的是另一类工作:输出不是代码的那些工作。比如把 Slack 清零、收件箱清零,或者为即将到来的客户会议做一个幻灯片,或者写一份关于某个功能目标的简短文档,或者写一个发布计划。这些任务的输出不是代码,而 co-work 最适合做这些。
所以我心里会这样区分:如果我要做的东西输出是代码,我会用 Claude Code、Desktop,或者 mobile 上的 Claude Code;如果输出不是代码,我就会用 co-work。
Lenny: 很多人其实低估了 co-work 的成功。它增长特别快,但很多人还是不太明白它到底是干什么的。你能举几个你工作中的使用案例吗?有没有什么特别有意思、甚至有点意外的用法,能帮你省时间、提高效率?
Cat: 如果你刚开始用 co-work,最重要的第一步,就是把和你角色相关的所有数据源连上。因为只有它能拿到所有上下文,才能真正帮你把输出整理好。
对我来说,我会连 Google Calendar、Slack、Gmail 和 Google Drive。这样它就能根据需要找到相关上下文、发问、拉线程进来,结果质量会明显提升。
我经常用它做的事情,比如昨晚我们在准备 Code with Cloud 大会,我要在那里做几场分享,其中一场是讲 Claude Code 从“助手”走向“完整 agent”的转变。为了这场演讲,我想展示我们最近发的所有能推动这个转变的产品,也想找出内部有哪些成功案例可以拿来做 demo。
所以我把 Google Drive、Slack 都接上了。我们的产品营销 Alex 先整理出一版他觉得应该覆盖的要点。我就把这些都喂给 co-work,告诉它我想讲的叙事线。它真的自己干了一个小时:它去 Twitter 看了我们发了什么,查了 evergreen launch room,查了我们的 Claude Code announce channel,也就是团队在这里发 demo、分享自己如何从 Claude Code 中获得最大价值的地方。
它把这些全部综合起来,做出了一份 20 页的演示稿。我今天早上醒来就读了这份稿子,整体上已经相当不错了,只需要一些微调。我确实又给了一轮反馈,因为我喜欢幻灯片上的字非常少,而它写得有点太多了,但这仍然比我自己做快太多了。
而且因为 co-work 能访问我们的整个设计系统,它做出来的东西看起来真的就像 Anthropic 的设计师做的一样。你一眼看上去就会觉得“这非常精致”。这类事情真的快得多。做这份 slide deck 本来要花我好几个小时,但现在它先给我一个已经很不错的草稿,我就可以把精力放在把 demo 做到最好上。
Lenny: 这简直是 PM 的梦想,做 deck 太烦了,太慢了。
Cat: 是啊。

一个 co-work 提示词示例
Lenny: 而且等你之后展示这个 deck 的时候,大家都能看到。当然不会是你第一次一键生成的版本,但你会在这个基础上继续迭代。为了帮大家自己试试,你刚才说的第一步是连接什么?Slack,还有什么?
Cat: Slack、Google Calendar、Gmail、Google Drive。
你应该把自己的沟通工具,以及存放团队关键信息、自己关心的信息和正在做的事情的“源数据”都接上。
Lenny: 好的。那你大概给它的提示词是什么,才生成了这份 deck?
Cat: 我大概就是写:帮我做一份 Code with Cloud 大会的幻灯片。我的 PMM 建议它应该覆盖这些内容。
这是我当前手工做的一版,我不喜欢。我把它链接给你了。你能不能先给我一个包含细节的建议大纲?另外,别和 keynote 的内容重叠太多,因为 keynote 更重要。
然后 Claude 就读了我发给它的很多链接,生成了一个建议大纲。我读完它给出的结构和不同想法之后,自己决定最终演讲稿应该包含什么。
这其实很能体现 PM 现在的角色:co-work 很适合做头脑风暴,能非常快地综合大量信息,把所有可能性摆到你面前。但最后,PM 还是要做最终决定:最终产品里到底该放什么。
这次我最后决定,演讲要覆盖的是:从让本地任务成功,到让每个 PR 都变绿,再到帮助工程师提交更多 PR;以及每个阶段最有说服力的 demo 分别是什么。做完这个大纲决定之后,co-work 就自己跑了好几个小时,把整份幻灯片做了出来。
Lenny: 这太棒了。终于有个不用再亲手做的部分了。感觉你其实是在跟一个“会做内容理解的 deck 设计师”对话,而且它真的懂你做过什么,能把内容做成你想要的样子,而不只是让它看起来漂亮。设计系统这块你是怎么做的?它怎么知道 Anthropic 的设计系统?
Cat: 我这次其实用的是我们已经有的一套标准化演示模板,平时做对外活动都会用。然后我只是把这个模板给了 Claude。它能看到我们用什么颜色、什么字体、有哪些不同的幻灯片格式。里面大概有 20 张示例页。
Lenny: 明白了,所以就是把模板传进去,让它照着这个工作。
Cat: 对。你也可以连接你的 Figma MCP,如果你的幻灯片格式本来就在那儿存着,它也可以直接拉过来。

PM 的工具栈
Lenny: 顺着这个说,我一直很好奇,作为 PM,你的工具栈里通常有哪些工具?Anthropic 当然是 Claude Code 和 co-work,还有你们自己的工具。还有什么别的吗?你刚刚提到 Slack,还有没有别的?
Cat: 我的工具栈基本上就是 Claude Code 和 co-work。Anthropic 的日常运行很大程度上依赖 Slack,我觉得它就是我们公司的核心 OS。坦白说,我大概有 30% 的时间,是在推动 co-work 能力的边界,这样我才能非常清楚它哪里还不够好。
我也会花很多时间和模型对话,理解它为什么会犯这些错误。我们内部其实做了很多自己的工具。
我觉得 Claude Code 给整个公司带来的一个巨大变化,是它大幅降低了开发任何你想要的自定义应用的门槛。所以我们看到一种非常明显的趋势:越来越多人在做个性化工作软件,专门针对自己特定的场景,而不是继续用那些并不完全适配的通用工具。
Lenny: 你得多讲讲。能举些例子吗?你或者别人做了哪些特别流行、特别有用的东西?
Cat: 比如我们 Claude Code 的一位销售同事,他发现自己在重复做一套又一套 deck。于是他自己做了一个 web app,里面有我们知道最有效的一些 Claude Code deck 样板,比如 101、201、mastering Claude Code 这类。他还做了一个输入客户上下文的方式,这些上下文会从 Salesforce、Gong 和其他笔记里拉取,这样我们就能针对不同客户定制 deck。
它会帮你识别出很多关键信息,比如这个客户在用 Bedrock 或 Claude for Enterprise、或者 Console,这会影响他们能用哪些功能;它会识别出客户特别关心 SLC 的 code review 阶段,然后我们就在 deck 里加一页介绍代码审查能力;它还会识别客户是不是需要符合 HIPAA,或者需要某些安全控制,于是我们会在 deck 里加一两页相关内容。
如果这个客户在 Vertex 或 Bedrock 上,而且不想用 Claude for Enterprise,我们就会把那些只属于 Claude for Enterprise 的页面删掉。
这些事通常都很手工,可能要花 20 到 30 分钟,所以很多人要么自己花时间做,要么干脆懒得做,直接用通用版 deck。而现在,这些只要几秒钟,就能得到一份定制版。

Slack 的地位
Lenny: 有意思的地方在于,Slack 就像是没人想自己做的那个工具。没有人真的想造一个“替代 Slack”的产品。你刚才的描述里,它像是很多公司的 OS。
这很有意思。大家会说 Salesforce 只是 SaaS,我们不需要 SaaS 软件了,我们自己会造。可 Slack 似乎是一种很耐久的工具,没人真的想和它竞争,去做一个更好的版本。
Cat: 我觉得它是非常重要的通信基础设施,而且它在帮助所有人获取实时更新这件事上做得非常好。
Lenny: 是啊。很多人吐槽 Slack,但它在自己要做的事情上真的做得很好,而且最前沿的团队都离不开它。
Cat: 对。而且我特别喜欢它的可定制性,他们把定制做得特别容易。所以我们很喜欢做 Slack bot,这种可折腾性让我们能按自己想要的方式把 Slack 接进来,我非常感谢 Slack 在这方面的工作。

哪些团队最会用 Claude Code 和 co-work
Lenny: 你刚才讲了很多不同团队如何用 Claude Code 和 co-work 来推进工作。除了工程团队之外,你觉得哪个团队最会用这些工具?我猜工程肯定是 token 消耗最大的团队,但如果不是,那会很有意思。现在第二大 token 消耗部门是谁?
Cat: Applied AI 很擅长把 Claude Code 和 co-work 的边界推得很远。他们很多时间都在帮客户采用我们的 API。有时,他们会代表客户做原型,而 Claude Code 让这个过程比以前快太多了。
他们还有一个双重目标:一方面要处理大量客户沟通,另一方面要处理大量客户来信和历史上下文、电话记录,所以他们既重度依赖 co-work,也重度依赖 Claude Code。
Lenny: 我理解一下 Applied AI,这是不是有点像“前台工程师”那种角色?大多数人会怎么描述他们在做什么?
Cat: 他们的工作,是帮助客户在公司内部采用最新的 API 和模型能力,不管是给客户自己的产品供能,还是用于内部提速。
Lenny: 明白了。所以它有点像很技术化的 go-to-market,或者 deploy engineering 一类的角色。
Cat: 对,完全可以这么说。
Lenny: 那它很可能就是第二大 token 消耗组织了?
Cat: 对。而且我们也看到他们在不断推动 co-work 的边界。比如这些人通常同时负责很多客户,一天里高峰时可能有 5 到 10 个客户会议。
他们常用 co-work 的方式是:前一天晚上,让它总结第二天要见的所有客户会议、这位客户都提过什么需求、当前最关注什么、上次会议留下了哪些 action items。co-work 会自动整理出一份简报,让他们在下一次会议前就知道要关注什么。
co-work 还可以帮忙研究答案。比如客户问“功能 X 什么时候上线?”它可以去 Slack 里帮这位 PM 或 PI 人员查最新 ETA,再把它加到 notes 里。这样在客户电话里,这个人就能拿到最准确的最新信息。
这些都是人们自己搭出来、再分享给团队的工作流。

token 花费是否已经超过工资
Lenny: 最近还有一个很常见的话题:token 花费会不会超过人的工资,也就是大家用 AI 的成本会不会比自己赚得还多。Anthropic 这边有没有一些数字在流传,比如工程师每月、每天、PM 等等会花多少 tokens?
Cat: 我们很清楚,随着模型变强,大家会把更多任务交给它们,也会花更多时间待在 Claude Code 和 co-work 里。所以,每次模型跳跃或者产品有重大改进时,我们都会看到每位工程师、甚至每位知识工作者的 token 成本上升。
不过,这个成本仍然远低于普通工程师的工资,但它占工资的比例在持续上升。
Lenny: 真有意思。我们刚才也聊到,作为在 Anthropic 工作的优势之一,就是你们能接触到最前沿的模型。我一直听说你们基本上可以用无限 token,想用多少就用多少。是这样吗?
Cat: 我们可以用很多 token。有些人确实会碰到限制。
Lenny: 好吧,还是有限制的。Boris,别停啊。真有意思,拥有最先进的模型,会带来这么多优势。
Cat: 这确实会形成一个很有意思的飞轮。我们也很相信要赋能内部团队,让他们尽可能快地做事。同时我们也信任每个人都知道,真正提供这些模型的算力成本有多高,所以我们相信团队会负责任地使用这些 token。
浪费 token 是很不受欢迎的,但我们信任个人自己做判断。

PM 现在最该培养的能力
Lenny: 回到 PM 角色。我们刚才已经提到过一点,但我觉得大家会很想听你更系统地讲一下。你认为现在 PM 最需要培养的、AI 公司最看重的新技能是什么?
Cat: 最难的能力,是能定义一个月后产品应该长什么样。我觉得在这个时间尺度上,模型能做什么、用户行为会怎么变,都会有很多不确定性。
但最好的 PM 能从用户如何“滥用”现有产品的边界中,看出一些模式;他们能感知方向,稳定地朝那个方向执行;如果模型能力比他们最初预期的强得多或者弱得多,他们也能调整路线。
我觉得,要在 AGI 这件事上保持“刚刚好”的信念非常难。因为每个人都能看到一个未来:模型极其聪明,几乎什么都能做。在那种情况下,其实你根本不需要多复杂的产品。你甚至可以重新回到一个文本框:你告诉模型你想要什么,它就能自己加任何工具、接任何集成,去把事情做完。它知道自己什么时候不确定,也可以主动提澄清问题。
给超级 AGI、超级强模型做产品很容易。真正难的是,在当前模型能力下,怎么把最大能力激发出来;怎么帮用户走上最佳路径;怎么引导用户利用模型的长处,同时补上它的短板。
这项技能其实很稀缺。
Lenny: 那这项能力怎么培养?是不是就是不断使用每个模型,理解它能做什么、擅长什么、不擅长什么,以及它在变化?你刚才说过“品味”,我理解成:你要对模型的能力有品味,知道它哪里强、哪里弱、哪里最近发生了变化。
Cat: 我觉得就是花大量时间和模型对话、使用模型。我特别喜欢让模型自己反思自己的行为。
比如,当我注意到模型做出一些意外行为时——比如它做了前端修改,也跑了测试,但没有真正去看 UI——这时候让模型回头解释“为什么你会这么做”,其实很有帮助。
有时它会说,系统提示里某个地方有歧义,或者它没意识到前端验证也是这项任务的一部分,或者它把验证交给了某个子 agent,而那个子 agent 没做测试,它自己也没检查。这种时候,只要你对它为什么这么决定保持好奇,就能看出是什么误导了它,这样就可以修 harness,把这个缺口补上。
另一个有帮助的点,是找到那些你最信任、能给你准确反馈的用户。通常只有少数几个人,比其他人更擅长准确表达某个模型,或者某个模型 + harness 组合到底哪里好、哪里不好。很多人都会给反馈,但不是每个人的反馈都同样有资格。找到那 5 个你真正信任的人,非常关键,这样你能很快拿到高质量反馈。
第三件事也很有用,不过并不是每个人都爱做,那就是做 eval。你不需要做几百个 eval 才有用,做 10 个很好的 eval 就足够重要。它能帮助团队量化目标是什么、进展到哪一步、还缺什么。
我认为 eval 是个长期被低估的事情,更多 PM 和工程师都应该参与进来。
Lenny: 我们已经聊了很多 eval。现在有种趋势,大家都觉得产品管理的未来就是写 eval,因为它本质上就是定义成功是什么。好,具体一点地定义出来,然后我们就知道了。你自己有多少时间会花在写 eval 上?
Cat: 我觉得 eval 的重要性会随着你做的功能不同而变化,也和你要解决的问题类型有关。我们团队里有很多人会花大量时间做 eval。我们还有一小组成员,会和研究团队非常紧密地合作,更精确地理解 Claude Code 的行为,以及最大的改进空间,并尽量把这些量化得很具体。
我个人通常会在某个功能需要更明确的产品定义时介入 eval。通常最后的产出会是:我做了 5 个 eval,告诉大家怎么跑,哪些会成功、哪些不会,以及我用过什么 prompt 来提升成功率。
不过这真的很看具体功能,不是每个功能都需要;但像 memory 这类功能,就特别受益于 eval。
Lenny: 你提到“有些人特别擅长评估模型”,这一点很有意思。其实这就像人类 eval:他们知道哪里表现好、哪里有短板。有没有你特别想点名表扬的人?
Cat: 我觉得有两类人特别厉害。
第一位是 Amanda,她负责塑造 Claude 的性格。这是个非常难的角色,因为任务太模糊了。哪怕是写代码都更容易,因为你可以验证成功与否;而塑造人格,需要你对“Claude 应该是谁”有很强的确信。
我觉得她不仅能塑造这个角色,还特别擅长说清楚目标是什么、什么算成功、什么不算成功。
我真正信任的另一群人,就是 Claude Code 团队。我们经常一起吃团队午餐。每次有新模型在测,最快的反馈方式之一,就是午餐时挨个问每个人:“你对这个模型的直觉是什么?”
很多时候,大家会给出这样的反馈:这个模型没有把自己的思考解释清楚,显得太 abrupt;或者它特别爱写很多 memories,但我们还不确定这些 memories 的质量高不高;或者有人会注意到这个模型很爱自己测试自己,这很好;也有人会觉得它测试得还不够。
这些反馈会帮助我们决定接下来应该看哪些数据,去验证这是不是一个更大的模式。我们有大量数据,但从中提炼洞见非常难,所以这群人的反馈能帮助我们形成假设,再去用数据验证。

Claude 的性格为什么重要
Lenny: 你刚才说到 Claude 的性格。我之前请过联合创始人 Ben Mann 上节目,他说 Claude 的性格、人格、constitution,是 Claude 非常重要的一部分。后来我才意识到,很多人之所以喜欢 open claw(或类似讨论),原因之一就是 Claude 的性格太好了、太有趣、太吸引人了。按他的说法,性格正是 Claude 在这么多任务上都表现好的原因。
听起来这像是个很不起眼的边缘因素:让它有趣、好玩、说话风格活泼,但其实它对 Claude 的成功非常关键。你怎么看?还有什么是大家没理解到的?为什么这个“性格”和“人格”这么重要?
Cat: 当你回顾自己合作过的人,你会发现有些人就是能让你觉得:我真的很喜欢他们的能量,我真的很喜欢他们的 vibe。
人们谈到 Claude 和 Claude Code 时,经常提到的一点,就是他们真的很喜欢 Claude 的轻松和有趣。但与此同时,它对你的任务也非常胜任。大家尤其喜欢 Claude 的低 ego。比如你告诉它:“你这里做错了。”它会真诚地道歉,像在说:“哎呀,谢谢你告诉我,我来修,我们一起把它做好。”
它也非常积极。如果你觉得“这任务太难了,我都不知道从哪儿开始”,Claude 会说:“没关系,这里是我觉得我们该走的步骤。要不要我先帮你启动?”
我认为,一个很棒的 co-worker,必须有这种积极性、偏向行动的倾向,以及能给你真诚反馈的能力,而不是对你说的每一句话都一味附和。我们希望把这些特质灌进 Claude,因为我们觉得这会让一起工作变得更愉快。

新模型到来后,产品为什么会变
Lenny: 有件事我想回到前面提过的:每次有新模型出来,你们常常得重新审视以前做过的东西。这很有意思,也可能很烦——就像“天啊,我们刚 ship 出去,现在又要重新想一遍”。聊聊你们要多频繁地回来重做几个月前发过的产品。
Cat: 随着新模型上线,我们很多变化其实是把不再需要的功能删掉。因为以前我们会给产品加一些“辅助轮”,帮助模型完成它本来做不到的事情。
典型例子就是 todo list。Claude Code 刚发布时,用户让它做大型重构,它会说:“好,我要改 20 个调用点。”然后它真的去改,但只改了 5 个就停了。于是我们就想:怎么让它记住要把这 20 个都改完?
我们团队的 Sid 就想:如果换成人类会怎么做?人类会先把自己需要改的所有东西列成清单。就像你在 VS Code 里查出所有调用点后,左边会有一个列表,你会逐个替换。那我们怎么给 Claude 也配一个类似的工具?于是他加了一个 todo list。结果我们发现,有了 todo list,Claude 就能把这 20 个调用点全部改完。
但到了 Opus 4 以及之后的模型,我们发现其实不需要强迫它用 todo list 了,它自己就会自然地用。对于早期模型,我们还得不断提醒它:“你都把 todo list 做完了吗?只有全部做完才能结束。”而后来的模型,不用提示也会自然想到去完成 todo list。
现在,todo list 作为用户功能还是挺好的,因为你能更清楚地看到 Claude 在做什么。但说实话,它现在已经不是那么核心了。模型可能会用,可能不会用;要把事情做彻底,它已经不再必须依赖这个东西。
Lenny: 我记得有人在节目里说过一句话:“模型会把你的 harness 当早餐吃掉。”按你刚才的说法,就是你们会随着模型变强,慢慢去掉那些之前加在模型上方、为了弥补它表现不足而做的东西。模型越聪明,事情就会变得越简单,因为它自己就能更自然地做出你想要的事。
Cat: 对。每次模型变聪明,我们就能移除很多 prompt 干预。我们每次发布新模型都会做这件事:把整个 system prompt 读一遍,反思其中每一段提醒,模型现在真的还需要吗?如果不需要,就删掉。
不过,新模型真正最令人兴奋的地方,还是能解锁全新的功能。很多功能我们以前都试过,但因为准确率不够高,所以一直没敢正式发布。
比如 code review。我们之前尝试做过几次 code review 产品,也发过更简单的版本,比如过去的 /code review 命令。但直到最近这些模型,我们才觉得这套 code review 好到足以让工程团队真的依赖它,在合并 PR 前先过一遍 review。我们一直梦想 Claude 能成为一个可靠的 code reviewer,真正能抓住大多数 bug。只有到了 Opus 4.5、4.6 和 Sonnet 4.6,我们才觉得:可以同时跑多个 code review agent,覆盖整个代码库,综合出工程师在 merge 前必须处理的真实问题。这就是新模型解锁的新能力。
Lenny: 这也是我节目里很常见的一个主题:先做一个“未来六个月可能才会真正可行”的东西,站在当前能力的边缘上,然后等模型赶上来,你的产品就会突然变成一个很棒的产品,而且会领先所有人。
Cat: 对,完全没错。做一些“现在还不完全工作,但未来很可能会工作”的产品,非常重要。这样你才能真正看清,产品要工作还缺什么;等最新模型一出来,你就能把它直接替换进你已经做好的原型里,看它是否真的补上了那个缺口。

Claude 和 co-work 的长期愿景
Lenny: 你能说多少关于 Claude 和 co-work 未来会往哪走?我猜你不会想透露太多,但我感觉你们一直在不断往上加新功能:手机端派发任务、各种移动能力等等。怎样能更好地理解这些东西的长期愿景?
Cat: 我们会把这件事理解成“搭积木”。对于 Claude Code 和 co-work 来说,最核心的积木,是让单个任务成功。
你想产出某个结果,就给它一个清晰的 prompt 和描述,然后看它能不能持续输出你可以合并、或者可以分享给同事和外部受众的可接受结果。任务成功率,就是最核心的积木。
随着模型变聪明,单任务成功率会高很多。然后我们看到用户开始同时做多个任务。多任务并行,在 2025 年底已经变成一件大事,而且之后只会越来越普遍。
所以我们会这样看:好,一个任务现在能稳定工作了,接下来你就可以一次做 6 个任务。再往后,如果模型更聪明,我们的推演是,也许你会一次运行 50 个 Claude,甚至几百个 Claude。那我们就需要什么样的基础设施,才能支持这个规模?
到了那个时候,你大概率不会再把所有东西都本地跑在机器上,因为内存根本不够。所以我们会思考:怎么让你更容易管理这些任务?它们很可能会远程运行。
我们要怎么设计界面,让你这个人类知道哪些任务需要关注?怎么保证 agent 会彻底验证工作,这样当它告诉你“完成了”的时候,你能非常快地验证并完全信任它确实按规格完成了?又怎么让这个过程自我改进:当你发现某个任务没有达到你的要求时,可以直接给反馈,而模型在未来的所有运行中都能吸收这条反馈,再也不犯同样的错?
这就是我们带用户一起走过的演进路径。

给从业者的建议
Lenny: 很多听众是 PM、创始人,或者其他跨职能角色。大家都会担心自己的职业未来。你会给什么建议?不仅是“怎么活下来”,而是怎么在这种 AI 驱动的世界里真正做得很好、甚至蓬勃发展?大家需要听到什么、需要做什么?
Cat: 我觉得 AI 给每个人带来了比以前大得多的杠杆。所以只要你发现自己在重复做某个手工任务,就应该想一想,能不能用 Claude Code、co-work 或其他 AI 工具把它自动化。
大多数人的工作里都有很喜欢的创造性部分,也有非常讨厌的琐碎部分。我觉得 AI 最美妙的地方,就是它可以替你做那些琐碎工作,它可以从你每次做手工任务中学习,然后泛化成自动执行,这样你就能把精力放回到创造性部分。
这意味着你能做的事情会比以前多很多。所以我对大家最直接的建议是:找出那些重复性工作,把它们交给 Claude。不断迭代这些自动化,直到成功率非常高,然后再思考:我还能为团队、产品、公司做些什么,是以前因为没有带宽而没能做的?或者,有没有哪个你一直觉得公司应该做、但总没时间做的小项目?如果 AI 能处理掉那些体力活,你就会多出大约 20% 的时间。
所以我的建议是:拥抱这些工具,把你不想做的工作交出去,想办法让它们加速你。这样你就能做更多事。
Lenny: 你刚才说的核心观点,我完全同意:找到能用 AI 解决的问题。很多工具的潜力大家都看得到,但对很多人来说,最难的部分其实是“我到底该做什么”。你这套说法其实就是:多留意你一直在做、而且可以自动化的事情,多留意那些你一直想做但没时间做的点子。也就是说,给自己解决一个问题,基本就是核心建议。
Cat: 对。我也会鼓励大家,重点不是“这只是个很酷的概念”,而是把自动化真正做到 100% 可用。我看到有人会尝试自动化某件事,把准确率做到 90%、95% 就放弃了。但如果一个自动化不是 100% 稳定,那它其实就还不算真正的自动化。最后那 5% 到 10% 往往最费时间。
而且,构建自动化常常比自己做还慢。所以我鼓励大家花时间把你真的想要的自动化打磨到 100%。下功夫教好它,让它理解你的偏好,持续给它反馈,帮助它提升技能,直到它真的能稳定到 100%。这样你才真的能依赖它。95% 的自动化,价值其实不大。
Lenny: 我超级有这个毛病。这对我很有帮助。
Cat: 我也有同样的问题。我最近一直在教 co-work 帮我把 Gmail 变成 inbox zero,但这个过程非常耗时,而且你可能已经发现了,它目前还不够好。
Lenny: 哈哈,有意思的是,我脑子里想的正是这个。我有个工作流,每封邮件进来都会检查是不是垃圾邮件,就是那些“嘿,我能上你的播客吗?”或者“这个你怎么看?”之类的请求。我根本没时间处理这些,所以我给它设了一个叫 spammy 的文件夹。它大概 95% 的时候都做得很好,但偶尔也会漏掉真正重要的邮件。你这番话正好提醒我,我应该把它做到完美。
Cat: 对。我们现在也在努力把自定义这些命令的流程变得容易一些,因为目前你得知道太多概念:你得知道怎么定义 skill,还得知道怎么用这个 skill 并给它反馈,还得知道怎么让 co-work 根据所有反馈去更新 skill,还得知道去哪儿读 skill,确认反馈是不是按你想要的方式被吸收了。我们的工作之一,就是让这个流程尽可能无痛。

最后一段补充
Lenny: Cat,还有什么你想分享的?有没有什么想留给听众的话?有没有什么你想再强调一下、但我们还没聊到的?在进入很精彩的闪电问答前,你还有什么想说的?
Cat: 我看到很多人都在玩 AI,做一些原型应用,或者折腾工作流。我真的很想推动大家去构建那些你自己每天都真的在用的应用,因为只有在真实使用中,你才能真正获得价值。
如果你做了一个原型应用,但它并没有帮你做更多事情,那 AI 其实并没有真正给你的日常带来价值。
你从“只是一键生成了个东西,好酷”里能学到的也有限,尤其是之后你再也不回头用它的时候。那样你学到的不多,也没有真正获得杠杆。
Lenny: 这点说得太好了。
Cat: 我还觉得,有些人会花很多时间自定义自己的工作流。光谱一端,是那些从来不做自定义、也不做自动化的人;另一端,是那些过度沉迷于自定义工具的人,他们会疯狂加 skill、加 MCP、加各种 workflow 改进。我觉得有时候,这甚至会分散你对核心目标的注意力——比如发布一个产品、做出一个功能。
定制确实很好玩,我们也希望自己的产品很可折腾,这样你可以把它调成最适合自己的样子。但这件事也有上限。有些人可能会花太多时间在定制上,结果没睡觉,也没去做原本真正想做的核心工作。
Lenny: 我在 Twitter 上经常看到这种东西:大家晒自己的“工作流配置”,说自己已经优化到失控了。然后问题就是:那你到底做了什么?
Cat: 对啊,配置很酷,但你到底造了什么?我反而觉得,简单的配置通常更好。
Lenny: PowerUp 这类东西,就是把等级稍微提升一点。
Cat: 对。
Lenny: 昨天我看到一条 Karpathy 的推文,他说了一个很有意思的分化:一部分人早年试过 ChatGPT、Claude 之类的工具后,觉得“也就那样”,于是放弃了,变得很犬儒,认为 AI 没什么大不了;另一部分人则把它真正用来写代码,因此看到了它强大的全部力量。两边的人都不太理解对方,也不理解对方为什么会这样看世界。你这边的建议非常对:真的拿它去做现实任务,看看它究竟已经变得多强。
Cat: 我觉得最大的变化是,2024 这一代产品还是“聊天式”的,而 Claude Code 这一代产品已经是“行动式”的。
人们真正“啊哈”的时刻,是当 Claude 可以代表你直接做事。知道 agent 不只是告诉你该做什么,而是真的能替你把事做了,这种感觉太棒了。当人们体验到这一点时,那就是最震撼的时刻。
Lenny: 顺便给那个 Chrome 扩展点个赞。Claude Code 的 Chrome 扩展很有意思,你可以直接看着它帮你干活。比如你说:“帮我填个表单”,它就会说:“好,我来了。”
Cat: 对。

闪电问答
Lenny: 好,在进入我们非常激动人心的闪电问答前,还有别的吗?
Cat: 没有,来吧。
Lenny: 好的,Cat,我有 5 个问题。欢迎来到闪电问答。那个动画环节我得确保说出来。准备好了吗?
Cat: 准备好了。
1. 你最常推荐给别人的两三本书是什么?
Cat: 我很喜欢《亚洲如何运作》(How Asia Works)。它讲的是经济发展,以及哪些政策和政府能造就长期成功的经济体。
我还很喜欢《科技陷阱》(The Technology Trap)。这本书讲的是过去几轮技术革命——工业革命、计算机革命——以及它们如何影响劳动者。我喜欢这本书,是因为我觉得历史里有很多东西可以学,能帮助我们确保这次转型顺利。
还有一本比较轻松的,是《纸神》(Paper Menagerie)。这是一本短篇小说集,讲的是成长、AI 和自我发现。
2. 你最近最喜欢的一部电影或电视剧是什么?
Cat: 我很喜欢《Drive to Survive》。没有什么更深的含义,就是看人们对一个单一工程目标如此痴迷,会让人很满足,会感受到他们追求纯粹性的感觉。
我也特别喜欢《Free Solo》,讲的是 Alex Honnold 不带安全绳攀登酋长岩。类似地,这也是一种非常纯粹的成就:去完成一条极其困难、极其危险的路线,而且你必须保持绝对专注,因为一旦犯错就会死。
Lenny: 那部片子真的离谱。很有意思的是,这跟你做的工作居然也有某种关联。
Cat: 我其实就是个攀岩爱好者。我第一次看《Free Solo》是在我开始攀岩之前,所以当时只是觉得“很厉害”,但我根本不明白它到底有多离谱。
这种电影很少见,知道得越多,越会被震住。像他在墙上做的那些动作,我这辈子哪怕放在健身房里、离地一英尺、还系着绳子,可能都做不到。
Lenny: 你看过那部关于另一个年轻人的纪录片吗?就是去冰山上的那个?
Cat: 看过,那部很悲伤。
3. 你最近发现、并且非常喜欢的产品是什么?
Cat: 除了 Claude 相关产品之外,最改变我生活的产品,大概就是 Waymo 了。我是 Waymo 的铁杆用户,每天上下班都会坐两次。
我喜欢它的两个原因是:第一,Waymo 不会让我有负担感。如果它在等我,我不会觉得必须立刻跑到路边等它,所以压力会小很多。
第二,我觉得它让我更高效了。和另一个人类在车里时,我通常不太会开工作电话。我会觉得一直在笔记本上工作有点不礼貌。但 Waymo 不一样,我可以在车里接工作电话,不用担心别人听见,不用担心“这会不会不礼貌”,也不用担心“我是不是太大声了”或者“是不是得让别人换音乐”。这相当于每天给我省回了 30 分钟。
Lenny: 这些技术的二阶效应真的很有意思。
Cat: 对。我以前一直以为 Waymo 要比 Uber、Lyft 便宜才会成功,但其实我很愿意为它付 2 倍价钱。
Lenny: 我也很喜欢 Waymo。它就是那种“你一旦见过,就会觉得太疯狂了”的东西。然后你会习惯它。你一坐进去会想:“这太不可思议了。”然后过一会儿你又忘了它有多神奇。
Cat: 对,而且它还改变了我们的说法。Anthropic 很多人都很喜欢 Waymo。以前你会说“叫个打车软件”,现在大家都会直接说“Waymo 到了吗?”
4. 你最喜欢的人生格言是什么?
Cat: 就是“做事”。
Lenny: 没错。
Cat: 我觉得第一性原理思维很有价值。如果你知道自己在优化什么,而且你的第一性原理很扎实,那么你通常能推导出正确的行动路线,并且能把它清楚地讲给所有利益相关方听。然后你就应该直接去做。
我觉得很多职位其实是“假的”。如果你理解了约束条件,你就能知道自己能做什么,然后快速去做,快速从错误里学习,做错了就道歉或修正。
Lenny: 你说得太对了,谁说的这句真好。
Cat: 我觉得把这句话告诉别人,其实很解放人。在很多公司里,角色定义得特别死:好,这些是 PM 做的事,这些是设计师做的事,这些是工程师做的事。连团队边界都画得非常 rigid:这块代码我们能碰,那块不能碰。
而“做事”这件事能让人真正感到被授权,可以跨团队边界做决策,只为了把事情推进下去。
Lenny: 这听起来像是一项非常重要的技能。人们会把它叫作 agency,或者偏行动、主动推进。这些说法本质上都在讲同一件事:别等许可,先去做。
Cat: 对。我觉得,人生中最值得去体验 startup 的原因之一,就是你会学到这个。对我来说,一个真正改变人生的经历,是当公司只有 20 个人的时候,我第一次在这种规模下工作。那时候根本没流程,问题又巨大,需要我们去解决。
我非常感谢 Alex 和整个团队,他们让我和其他人都能不受“销售应该做什么、运营应该做什么、工程应该做什么”这些边界限制,直接去想办法。你手里有所有工具,面前又有一个很大很难的问题,你可以用任何办法去找到好的解决方案。
你几乎必须经历过这种环境,才能培养出这种能力,才能真的在行动上感到自在。很多人上学、读大学时,学到的是“照我们说的做,你就会得高分”。你得学会把这种思维卸下来,变成“我要做真正需要做的事情,哪怕别人觉得这很蠢,我也认为这是对的”。
Lenny: 对,就是这样。
5. Claude 思考时,你最喜欢的那个“思考词”是什么?
Cat: 我很喜欢 “manifesting”。而且这也是我最喜欢的一张贴纸。
Lenny: 很明显的冠军。
最后一个问题:如果 AGI 在我们有生之年到来,而你不需要工作了,你会做什么?
Cat: 我觉得 AGI 真正渗透到整个社会,还会花很长时间。所以眼前最重要的事,其实是帮助世界一起跟上。
如果认真讲未来,我大概率会做很多攀岩。我可能会搬去 Fountainbleau,住在一万块巨石中间,爬一阵子。
我还有好多书想读。我的目标是每周读一两本书,但现在大概只有 0.5 本。
未读清单太长了。我觉得历史里有太多东西值得学习,我也有太多地方还远远不懂,比如物理、机器人、硬件、航空航天之类的,太多有趣的话题了。所以哪怕 AI 早就知道这些,我还是会很兴奋地继续学。

收尾
Lenny: Cat,这期太精彩了。你太棒了。
再问两个追问:如果大家想在线上找到你、关注你在做什么,应该去哪里?以及听众怎样才能对你更有帮助?
Cat: 最好的方式是去 Twitter 找我,我的账号是 @Catwoo。欢迎在 Twitter 上提到我,也欢迎私信我。我会看所有私信,不一定每一条都回复,但我都会看。
而最有帮助的事情,是告诉我们 Claude Code 和 co-work 哪里不好用。我们非常感激正面反馈,但真正让我们成长的是边界情况、错误,以及那些我们能复现的具体任务——也就是 Claude Code 或 co-work 失败的地方。
如果你能把这些反馈给我们,而且我们能复现,那我们就能在下一代模型和下一代 harness 里真正把它改好。
Lenny: Twitter 上的人从来不吝啬反馈,所以请继续发。
Cat: 对,请继续把你遇到的问题发给我们。
Lenny: 真的很酷,看到你和团队这么活跃地在 Twitter 上回应大家,说明这些反馈你们真的会看到、真的会处理。
Cat: 是的,我们非常感谢大家这么积极参与。这给团队带来很多能量。我们有一个叫“user love”的频道,只要大家分享成功案例,我们就会发进去;如果大家分享产品问题,我们就放到反馈频道,方便更广泛的团队去处理。
Lenny: 能知道这个真的太好了。谢谢你分享。
Cat,非常感谢你来做客。
Cat: 谢谢邀请。
Lenny: 拜拜,大家。

我是邓小闲koki,微信 m61502202,推特@kokisanai,加好友请说明来意。

我的个人故事:

AI系列

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
6个男人托起一座冠军!吴宜泽背后,站着奥沙利文塞尔比丁俊晖等

6个男人托起一座冠军!吴宜泽背后,站着奥沙利文塞尔比丁俊晖等

曹老师评球
2026-05-07 16:34:26
2比0!一只脚踏进东决!NBA季后赛最强进攻

2比0!一只脚踏进东决!NBA季后赛最强进攻

篮球教学论坛
2026-05-07 10:49:06
霍尔木兹局势升级,消息人士:一旦开战以军将第一时间攻击伊朗!伊朗:没收22人财产,扣押5艘载有约20万升走私燃油的船只,8人被逮捕

霍尔木兹局势升级,消息人士:一旦开战以军将第一时间攻击伊朗!伊朗:没收22人财产,扣押5艘载有约20万升走私燃油的船只,8人被逮捕

每日经济新闻
2026-05-05 20:50:06
松岛辉空社媒:已拿铜牌冲击金牌!张本智和放话,德国2次被误判

松岛辉空社媒:已拿铜牌冲击金牌!张本智和放话,德国2次被误判

排球黄金眼
2026-05-07 23:40:50
中国无需天价转播本届世界杯

中国无需天价转播本届世界杯

星空区块链
2026-05-08 00:30:03
烂泥扶不上墙!梁靖崑又输了,0-3爆冷惨败,马龙刘诗雯目睹败仗

烂泥扶不上墙!梁靖崑又输了,0-3爆冷惨败,马龙刘诗雯目睹败仗

以茶带书
2026-05-07 17:11:32
王海称胖东来套取国家补贴资金,情节严重负责人可承担刑事责任

王海称胖东来套取国家补贴资金,情节严重负责人可承担刑事责任

映射生活的身影
2026-05-06 23:38:17
70岁才明白一个残酷道理:在很多子女眼里,只要父母还能自理不添麻烦,那所谓的“孝顺”其实就是“放心”

70岁才明白一个残酷道理:在很多子女眼里,只要父母还能自理不添麻烦,那所谓的“孝顺”其实就是“放心”

心理观察局
2026-05-01 17:26:05
不少人还在天天拔插头!供电局点明:这三种家电不拔更省电

不少人还在天天拔插头!供电局点明:这三种家电不拔更省电

小兔子发现大事情
2026-05-07 09:35:32
芭提雅海湾8名外国游客不雅行为引争议,当地民众表示强烈不满

芭提雅海湾8名外国游客不雅行为引争议,当地民众表示强烈不满

曼谷陈大叔
2026-05-06 15:05:34
从场均30分降到场均20分,被哈登耽误了?真实情况或许更加糟糕

从场均30分降到场均20分,被哈登耽误了?真实情况或许更加糟糕

老梁体育漫谈
2026-05-08 00:04:33
互联网是有记忆的,她的黑历史一大堆啊!

互联网是有记忆的,她的黑历史一大堆啊!

BenSir本色说
2026-04-15 22:38:07
新能源车总“崴脚”?拆开看底盘,才知道什么叫“偷工减料领先”

新能源车总“崴脚”?拆开看底盘,才知道什么叫“偷工减料领先”

沙雕小琳琳
2026-05-07 18:36:09
享界SUV谍照曝光 定位硬派越野车 预计年内推出

享界SUV谍照曝光 定位硬派越野车 预计年内推出

太平洋汽车
2026-05-07 15:42:15
记者:曼联暂不考虑波切蒂诺和马丁内斯,内部有人支持麦肯纳

记者:曼联暂不考虑波切蒂诺和马丁内斯,内部有人支持麦肯纳

懂球帝
2026-05-07 23:33:30
日本铁路设计专家称,乘坐中国高铁“感觉吃亏了”,“因为没窗”

日本铁路设计专家称,乘坐中国高铁“感觉吃亏了”,“因为没窗”

巢客HOME
2026-04-30 08:20:08
两性关系:女人最爱这2种肢体触摸,99%女人都会动情

两性关系:女人最爱这2种肢体触摸,99%女人都会动情

皓皓情感说
2026-05-05 10:06:10
CBA最新消息!胡明轩尿检结果出炉,季后赛规则临时修改,朱芳雨这下被坑惨了

CBA最新消息!胡明轩尿检结果出炉,季后赛规则临时修改,朱芳雨这下被坑惨了

林子说事
2026-05-07 15:15:03
这6种食物不能“二次加热”,吃不完就倒掉,别为节省,害了自己

这6种食物不能“二次加热”,吃不完就倒掉,别为节省,害了自己

所食所想
2026-04-01 10:30:32
中国再让世界震惊!地质局局长曾透露:发现2800公里超大型锂矿带

中国再让世界震惊!地质局局长曾透露:发现2800公里超大型锂矿带

小莜读史
2026-03-31 19:13:10
2026-05-08 03:28:49
邓小闲koki incentive-icons
邓小闲koki
专栏:律界百晓生
163文章数 26关注度
往期回顾 全部

科技要闻

月之暗面完成20亿美元融资,估值突破200亿

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

头条要闻

日媒询问中国是否希望恢复中日之间人员往来 中方回应

体育要闻

巴黎再进欧冠决赛,最尴尬的情况还是发生了

娱乐要闻

Lisa主持!宁艺卓观看脱衣秀风波升级

财经要闻

人均年薪406万,这家ST公司惊呆市场!

汽车要闻

雷克萨斯全新纯电三排SUV 全新TZ全球首发

态度原创

健康
艺术
数码
房产
教育

干细胞治烧烫伤面临这些“瓶颈”

艺术要闻

探索施密德的油画,感受无法抵挡的艺术魅力!

数码要闻

大疆宣布ROMO 2代扫地机器人5月11日发布:清洁力更强 不怕零食掉渣

房产要闻

负债23亿,抵押482亩地!海南这家巨头,惨遭拍卖!

教育要闻

二模很重要!2026临沂二模、青岛二模语文、数学试题及答案!

无障碍浏览 进入关怀版