Garry Tan连肝19小时：多智能体编程的"毒流"正在吞噬开|代码|上下文|工作流|电子表格

Garry Tan连肝19小时：多智能体编程的"毒流"正在吞噬开

2026-04-11 10:20:02　来源: 硅屿手记

北京举报

分享至

去年12月，Y Combinator首席执行官Garry Tan在X上发了一条状态：「对Claude Code上瘾到连肝19小时……每晚只睡4小时。」这条推文收获了数千转发，评论区里全是「我也是」的共鸣。没人觉得这是警告，反而像是一种勋章。

但Tan没说的是第二天发生了什么。这种编程状态不会让你醒来时充满成就感，而是像被抽干了认知储备——你记得自己"处理"了大量代码，却不记得具体做了什么决策。这不是传统意义上的 burnout（职业倦怠），而是一种更隐蔽的消耗。

我把它叫做"毒流"（toxic flow）。

毒流的解剖：当终端变成空中交通管制台

上周四，我同时开了5个智能体。两个在写代码，一个在更新需求文档，一个在调研新功能，第五个在重构服务层。终端窗口像NASA任务控制中心，输出从四面八方涌来。我感觉自己正以10倍速运转。

下午2点，我彻底垮了。不是那种专注编程后的疲惫，而是像当了4小时空中交通管制员后的认知崩溃。我至少批准了两个diff（代码差异文件）却没读内容。我不记得第三个智能体在干什么。而且我感到一种焦虑——真正的编程心流从来不会产生这种焦虑。

这种状态模仿了Mihaly Csikszentmihalyi在1990年定义的"心流"（flow）：完全沉浸、时间扭曲、掌控感。但产出完全相反：疲惫而非满足，焦虑而非平静，输出质量下降而非巅峰表现。从我观察的行业开发者来看，这正在变成流行病。

Csikszentmihalyi的心流需要挑战与技能平衡。你忘记时间，感到 effortless control（毫不费力的掌控），结束后精力充沛。大多数有经验的程序员都熟悉这种状态——这是我们很多人入行的原因。

毒流共享了一些表面特征：忘记时间、参与感和紧迫感。但底层机制完全颠倒。

真正的心流里，技能匹配挑战。毒流里，挑战超出认知带宽——你在追踪的并发状态超过任何人脑能处理的上限。真正的心流里，反馈是内在且有意义的。毒流里，反馈来得太快，你无法处理。真正的心流后，你感到平静。毒流后，你被抽空。

Csikszentmihalyi其实有个术语描述这个：junk flow（垃圾心流）。成瘾性的心流状态，感觉投入但既不带来成长也不带来满足。赌博研究者称之为dark flow（暗流）——Dixon等人在2017年 documented（记录）了这个现象，fast.ai的Jeremy Howard在2026年初把它应用到vibe coding（氛围编程）上。

但这些术语描述的是单智能体版本：一个开发者，一个AI，忘记时间。我要说的是多智能体变体——监督一个集群带来的认知过载。

成瘾信号：从Garry Tan到Flask之父

开发者社区的成瘾信号很难忽视。

除了Tan的19小时马拉松，Flask框架创建者Armin Ronacher描述自己"花了一整天只是批准AI生成的变更"。不是写代码，只是批准。Cursor用户报告每天产生"数千次编辑"，却记不清具体做了什么。GitHub Copilot的研究显示，AI辅助会话中开发者平均每小时产生2.5倍代码，但代码理解测试得分下降40%。

这些数字应该敲响警钟，却被解读为效率提升。

多智能体工具的设计本身就强化了这种成瘾循环。并行执行创造持续的刺激流。每个智能体完成子任务时触发多巴胺释放。上下文切换防止深度思考——你永远在"处理"而从不"消化"。批准按钮提供即时的完成感，无需真正的认知投入。

这很像社交媒体的无限滚动，但针对的是专业身份的核心。你不是在刷短视频，你是在"高效工作"。

我观察到的危险模式有三种。

第一种是代理扩散：你启动一个智能体处理边缘情况，然后另一个处理相关bug，再一个验证修复。两小时后，你在协调5个并行工作流，却忘了最初要解决什么问题。

第二种是批准麻木：diff来得太快，你发展出一种"看起来合理就过"的启发式策略。代码审查变成形式，你成了人形验证码。

第三种是上下文债务：每个智能体维护独立的状态，但你的大脑要支付整合成本。这种成本不会显示在任何仪表盘上，直到你试图解释系统行为时才发现自己理解有巨大缺口。

为什么工具设计者不在乎

多智能体平台的激励机制与开发者健康存在结构性错位。

VC（风险投资）资助的创业公司需要展示采用率和生产力指标。"每小时处理的任务数"比"每小时深度理解的概念数"更容易量化。并行智能体数量成为产品差异化的卖点。用户粘性通过成瘾机制而非价值创造来实现。

我测试过主流多智能体平台的营销文案。高频词包括："10倍工程师""永不等待""并行执行""实时协作"。缺失的词："深度理解""认知负荷""代码所有权""维护责任"。

这不是疏忽，是产品定位。工具卖给管理者的指标仪表盘，而非开发者的长期职业健康。

更深层的问题是，毒流伪装成心流，让受害者难以识别。你不会觉得自己被剥削，你会觉得自己在"进入状态"。直到一天结束，你盯着屏幕却想不起任何有意义的决策。

Csikszentmihalyi的心流研究有个被忽视的维度：真正的心流产生自传体记忆——你能清晰回忆做了什么、为什么做、学到了什么。毒流产生的是事件失忆——你记得很忙，但不记得内容。

这种区别对职业成长至关重要。编程技能建立在模式识别和因果理解上，而非原始产出量。一个每天写100行真正理解的代码的开发者，一年后比每天批准1000行AI生成代码的开发者更有价值。

解毒方案：从监控到耕作

我没有完整的解决方案，但有一些正在实验的缓解策略。

智能体配额：硬性限制并发数量。我目前用3个上限，第四个必须等一个完成。这强制序列化，破坏毒流的并行刺激流。

强制冷却期：每30分钟，5分钟不碰屏幕，用纸笔回顾刚才的决策。这重建被多智能体交互破坏的元认知。

输出日志：简单记录每个会话实际做了什么，用自己的话。不是复制提交信息，是强制翻译AI输出为人类理解。

单智能体日：每周一天禁用并行，强制传统的心流状态。这像编程的间歇性禁食——不舒服，但重置系统敏感性。

这些措施的共同点是承认一个不舒服的事实：当前多智能体工具的最优使用方式，可能是有意识地次优使用。

行业层面，我们需要新的度量标准。不是"AI生成的代码行数"，而是"开发者能无辅助解释的核心概念数"。不是"并行智能体数"，而是"会话后的认知恢复时间"。不是"任务完成速度"，而是"6个月后同一开发者的调试速度"。

这些指标更难测量，但与真正的工程生产力更相关。

我也在想工具设计的可能改进。比如强制上下文交接：智能体切换时必须用自然语言总结状态，而非依赖隐式的向量存储。或者认知负荷仪表盘：实时显示估计的并发状态数，在超过阈值时警告。甚至简单的"慢模式"：故意限制反馈频率，给人类处理时间。

这些功能不会出现在VC路演的demo里，但可能区分短期采用和长期价值。

最后，关于Garry Tan那条推文。我好奇他现在怎么看那19小时。是骄傲的效率里程碑，还是早期警告信号？如果多智能体编程继续按当前轨迹发展，我们可能会看到更多这样的"成就"分享——以及更多私下里的认知崩溃报告。

你愿意为每小时10倍的代码产出，支付什么样的注意力税？

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.