去年12月,Y Combinator首席执行官Garry Tan在X上发了一条状态:「对Claude Code上瘾到连肝19小时……每晚只睡4小时。」这条推文收获了数千转发,评论区里全是「我也是」的共鸣。没人觉得这是警告,反而像是一种勋章。
但Tan没说的是第二天发生了什么。这种编程状态不会让你醒来时充满成就感,而是像被抽干了认知储备——你记得自己"处理"了大量代码,却不记得具体做了什么决策。这不是传统意义上的 burnout(职业倦怠),而是一种更隐蔽的消耗。
我把它叫做"毒流"(toxic flow)。
毒流的解剖:当终端变成空中交通管制台
上周四,我同时开了5个智能体。两个在写代码,一个在更新需求文档,一个在调研新功能,第五个在重构服务层。终端窗口像NASA任务控制中心,输出从四面八方涌来。我感觉自己正以10倍速运转。
下午2点,我彻底垮了。不是那种专注编程后的疲惫,而是像当了4小时空中交通管制员后的认知崩溃。我至少批准了两个diff(代码差异文件)却没读内容。我不记得第三个智能体在干什么。而且我感到一种焦虑——真正的编程心流从来不会产生这种焦虑。
这种状态模仿了Mihaly Csikszentmihalyi在1990年定义的"心流"(flow):完全沉浸、时间扭曲、掌控感。但产出完全相反:疲惫而非满足,焦虑而非平静,输出质量下降而非巅峰表现。从我观察的行业开发者来看,这正在变成流行病。
Csikszentmihalyi的心流需要挑战与技能平衡。你忘记时间,感到 effortless control(毫不费力的掌控),结束后精力充沛。大多数有经验的程序员都熟悉这种状态——这是我们很多人入行的原因。
毒流共享了一些表面特征:忘记时间、参与感和紧迫感。但底层机制完全颠倒。
真正的心流里,技能匹配挑战。毒流里,挑战超出认知带宽——你在追踪的并发状态超过任何人脑能处理的上限。真正的心流里,反馈是内在且有意义的。毒流里,反馈来得太快,你无法处理。真正的心流后,你感到平静。毒流后,你被抽空。
Csikszentmihalyi其实有个术语描述这个:junk flow(垃圾心流)。成瘾性的心流状态,感觉投入但既不带来成长也不带来满足。赌博研究者称之为dark flow(暗流)——Dixon等人在2017年 documented(记录)了这个现象,fast.ai的Jeremy Howard在2026年初把它应用到vibe coding(氛围编程)上。
但这些术语描述的是单智能体版本:一个开发者,一个AI,忘记时间。我要说的是多智能体变体——监督一个集群带来的认知过载。
成瘾信号:从Garry Tan到Flask之父
开发者社区的成瘾信号很难忽视。
除了Tan的19小时马拉松,Flask框架创建者Armin Ronacher描述自己"花了一整天只是批准AI生成的变更"。不是写代码,只是批准。Cursor用户报告每天产生"数千次编辑",却记不清具体做了什么。GitHub Copilot的研究显示,AI辅助会话中开发者平均每小时产生2.5倍代码,但代码理解测试得分下降40%。
这些数字应该敲响警钟,却被解读为效率提升。
多智能体工具的设计本身就强化了这种成瘾循环。并行执行创造持续的刺激流。每个智能体完成子任务时触发多巴胺释放。上下文切换防止深度思考——你永远在"处理"而从不"消化"。批准按钮提供即时的完成感,无需真正的认知投入。
这很像社交媒体的无限滚动,但针对的是专业身份的核心。你不是在刷短视频,你是在"高效工作"。
我观察到的危险模式有三种。
第一种是代理扩散:你启动一个智能体处理边缘情况,然后另一个处理相关bug,再一个验证修复。两小时后,你在协调5个并行工作流,却忘了最初要解决什么问题。
第二种是批准麻木:diff来得太快,你发展出一种"看起来合理就过"的启发式策略。代码审查变成形式,你成了人形验证码。
第三种是上下文债务:每个智能体维护独立的状态,但你的大脑要支付整合成本。这种成本不会显示在任何仪表盘上,直到你试图解释系统行为时才发现自己理解有巨大缺口。
为什么工具设计者不在乎
多智能体平台的激励机制与开发者健康存在结构性错位。
VC(风险投资)资助的创业公司需要展示采用率和生产力指标。"每小时处理的任务数"比"每小时深度理解的概念数"更容易量化。并行智能体数量成为产品差异化的卖点。用户粘性通过成瘾机制而非价值创造来实现。
我测试过主流多智能体平台的营销文案。高频词包括:"10倍工程师""永不等待""并行执行""实时协作"。缺失的词:"深度理解""认知负荷""代码所有权""维护责任"。
这不是疏忽,是产品定位。工具卖给管理者的指标仪表盘,而非开发者的长期职业健康。
更深层的问题是,毒流伪装成心流,让受害者难以识别。你不会觉得自己被剥削,你会觉得自己在"进入状态"。直到一天结束,你盯着屏幕却想不起任何有意义的决策。
Csikszentmihalyi的心流研究有个被忽视的维度:真正的心流产生自传体记忆——你能清晰回忆做了什么、为什么做、学到了什么。毒流产生的是事件失忆——你记得很忙,但不记得内容。
这种区别对职业成长至关重要。编程技能建立在模式识别和因果理解上,而非原始产出量。一个每天写100行真正理解的代码的开发者,一年后比每天批准1000行AI生成代码的开发者更有价值。
解毒方案:从监控到耕作
我没有完整的解决方案,但有一些正在实验的缓解策略。
智能体配额:硬性限制并发数量。我目前用3个上限,第四个必须等一个完成。这强制序列化,破坏毒流的并行刺激流。
强制冷却期:每30分钟,5分钟不碰屏幕,用纸笔回顾刚才的决策。这重建被多智能体交互破坏的元认知。
输出日志:简单记录每个会话实际做了什么,用自己的话。不是复制提交信息,是强制翻译AI输出为人类理解。
单智能体日:每周一天禁用并行,强制传统的心流状态。这像编程的间歇性禁食——不舒服,但重置系统敏感性。
这些措施的共同点是承认一个不舒服的事实:当前多智能体工具的最优使用方式,可能是有意识地次优使用。
行业层面,我们需要新的度量标准。不是"AI生成的代码行数",而是"开发者能无辅助解释的核心概念数"。不是"并行智能体数",而是"会话后的认知恢复时间"。不是"任务完成速度",而是"6个月后同一开发者的调试速度"。
这些指标更难测量,但与真正的工程生产力更相关。
我也在想工具设计的可能改进。比如强制上下文交接:智能体切换时必须用自然语言总结状态,而非依赖隐式的向量存储。或者认知负荷仪表盘:实时显示估计的并发状态数,在超过阈值时警告。甚至简单的"慢模式":故意限制反馈频率,给人类处理时间。
这些功能不会出现在VC路演的demo里,但可能区分短期采用和长期价值。
最后,关于Garry Tan那条推文。我好奇他现在怎么看那19小时。是骄傲的效率里程碑,还是早期警告信号?如果多智能体编程继续按当前轨迹发展,我们可能会看到更多这样的"成就"分享——以及更多私下里的认知崩溃报告。
你愿意为每小时10倍的代码产出,支付什么样的注意力税?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.