凌晨两点,斯德哥尔摩的工程师还在睡觉,他的AI代理却在疯狂燃烧算力——一天烧掉几百万token,比他本人打字快一万倍。这种"睡眠生产力"正在改写硅谷的薪酬规则。
从黄仁勋的夹克到全行业的算盘
本周英伟达GTC大会上,Jensen Huang(黄仁勋)抛出一个让全场安静的数字:工程师应该拿到约等于基础工资50%的AI token补贴。
按他的计算,顶尖工程师每年可能烧掉25万美元的AI算力。他把这定义为"招聘工具",并预言这会成为硅谷标配。
那件标志性的皮夹克还没脱下,话题已经炸开。
但故事起点其实更早。2月中旬,湾区知名VC Tomasz Tunguz就在讨论这个趋势。他管理的Theory Ventures专注AI、数据和SaaS,长期追踪工程师生产力数据。
他用Levels.fyi的薪酬数据算了一笔账:头部软件工程师年薪37.5万美元,加上10万美元token预算,总包冲到47.5万。这意味着每五块钱薪酬里,就有一块钱是算力。
他把这称为"工程薪酬的第四个组成部分"——继工资、股权、现金奖金之后。
OpenClaw点燃的消耗革命
真正让token消耗曲线陡峭起来的,是1月底发布的OpenClaw。
这是一个开源AI助手,设计目标是持续运行:处理任务、生成子代理、在用户睡觉时消化待办清单。它属于"代理型AI"(agentic AI)浪潮的一部分——这类系统不只响应指令,而是能自主执行一系列动作。
行为变了,成本结构跟着变。
过去写篇文章可能一下午烧1万token。现在工程师后台挂一群代理,一天自动消耗几百万token——零打字,纯后台。
《纽约时报》周末的报道捕捉到一个微妙信号:Meta和OpenAI的工程师正在内部排行榜上比拼token消耗量。慷慨的token预算正悄悄变成标准福利,就像曾经的牙科保险或免费午餐。
一位斯德哥尔摩的爱立信工程师告诉时报,他花在Claude上的钱可能超过自己的工资——当然,公司买单。
三种算账逻辑正在碰撞
token补贴不是简单的"给多给少",背后是三套完全不同的商业假设。
第一种是英伟达视角:算力即投资。黄仁勋的50%比例不是拍脑袋,而是把token定义为"人力资本杠杆"——更多算力→更高产出→更高人才估值。这和他卖芯片的立场完美对齐,但逻辑本身站得住脚。
第二种是创业公司视角:成本即竞争力。Tunguz追踪的初创公司把推理成本写进薪酬包,本质是抢人手段。当现金股权都打到天花板,token预算成了差异化筹码。一个能"无限用Claude"的offer,比多给五千美元现金更性感。
第三种是大厂视角:消耗即文化。Meta和OpenAI的排行榜说明,token正在变成内部度量衡——不是控制成本,而是鼓励消耗。这和传统IT部门的"省着用"逻辑完全相反。
三种逻辑指向同一个问题:token到底算费用,还是算资产?
薪酬结构的深层重构
如果把时间轴拉长,这件事的影响可能比"福利升级"更深远。
首先,工程师的"生产力定价"被重新定义。传统上,代码产出、项目交付、系统稳定性是可量化的。现在token消耗量正在成为代理——它暗示着"自动化深度"和"任务复杂度"。排行榜文化一旦形成,就会反向塑造行为:工程师会设计更激进的代理工作流来刷数据。
其次,公司成本结构出现分叉。固定成本(工资)和可变成本(token)的边界模糊。当token占薪酬20%,它到底是人力支出还是运营支出?财务团队需要重新建模。
更隐蔽的是权力转移。控制token预算的人——可能是CTO,也可能是采购部——获得了新杠杆。工程师的"工作自由度"和预算审批挂钩,这和云计算时代的"信用卡自助"文化形成张力。
谁在真正买单
一个被低估的细节:token补贴的受益者可能高度分层。
![]()
顶尖工程师确实能烧掉25万美元算力,但普通工程师呢?如果公司按职级分配token额度,实际上是在薪酬之外再造一套"算力阶级"。更懂 prompt engineering(提示词工程)的人,能从同样预算里榨出更多价值——这加剧了技能溢价。
还有地理套利。斯德哥尔摩那位爱立信工程师的案例说明,token预算的全球统一定价,在低成本地区制造了异常购买力。一个东欧工程师用公司token调用GPT-4,实际获得的"工具特权"可能远超当地工资水平。
反过来,高生活成本地区的工程师可能觉得token补贴"不够解渴"。当房租已经吃掉工资的一半,额外的算力福利更像是工作必需品,而非真正的增量收益。
代理型AI的隐性契约
token补贴的流行,本质是人和AI协作关系的正式化。
过去工程师用GitHub Copilot,公司买单;现在用Claude、Gemini、自定义代理,成本归属变得复杂。当代理能7×24小时运行,"工作时间"的概念失效,配套的成本核算也必须跟着改。
OpenClaw代表的"睡眠生产力"把问题推到极致:如果工程师睡觉时AI还在替他赚钱,这段算力消耗算谁的?考勤制度、绩效考核、甚至劳动法,都没有现成的答案。
更激进的场景是:工程师可能带着个人训练的代理跳槽。代理里沉淀了他的工作流、偏好、甚至部分"数字劳动成果"。token补贴是否包含这些资产的迁移成本?目前完全空白。
英伟达的真正算盘
回到黄仁勋的提议,不能忽略他的位置。
英伟达卖的是算力基础设施。token补贴越普及,终端消耗越旺盛,他的芯片越好卖。这不是阴谋,是公开的利益对齐。但这也意味着,他对"50%比例"的倡导,需要被放在产业推动力的框架下理解。
一个验证角度:如果token补贴真的成为硅谷标准,谁会受损?
可能是现金流紧张的初创公司——它们付不起高额token预算,在人才市场上进一步劣势。可能是非技术岗位——当工程师获得"算力福利",销售、市场、HR是否会要求同等待遇?也可能是中小云厂商——如果大厂把token补贴和自有基础设施绑定,第三方API的市场份额会被挤压。
从福利到基础设施
历史上有过类似的过渡。
手机补贴曾经是高薪职位的标志,后来变成普通员工的标配,最终演化为BYOD(自带设备)政策——公司不再买单,而是折现或报销。笔记本电脑、软件许可证、甚至健身会员,都走过这条路。
token补贴可能更快完成这个循环。因为算力价格是高度波动的,且和具体供应商强绑定。今天的"Claude无限额"福利,明天可能因为模型迭代或价格调整而贬值。
更可能的终局是:token变成和医疗保险类似的"基础包+升级包"结构。公司提供基础额度覆盖日常需求,超额部分按项目审批或员工自费。排行榜文化会降温,但消耗追踪会成为常态——不是为了鼓励浪费,而是为了优化代理配置。
给从业者的行动框架
如果你是工程师,正在评估offer或规划谈判策略:
第一,把token预算折现计算。不要只看"无限Claude"的标语,要估算自己的实际消耗模式。如果你主要用IDE内置的代码补全,token消耗可能很低;如果你在构建多代理系统,预算天花板就是硬约束。
第二,确认预算的灵活性。能否跨模型使用?能否用于个人项目?离职时是否有结转或补偿?这些细节在offer阶段就要问清楚。
第三,追踪内部排行榜的权重。如果token消耗量真的影响晋升或绩效,你需要重新设计工作流——不是为了刷数据,而是为了在正确的指标上证明自己。
如果你是管理者,正在设计团队政策:
区分"探索性消耗"和"生产性消耗"。前者是学习和实验,应该宽松;后者是规模化运行,需要成本意识。混在一起管理,会同时扼杀创新和效率。
建立代理审计机制。不是监控员工,而是识别哪些代理工作流真正创造了价值。token消耗和产出质量的关联分析,会成为新的管理科学。
预留模型迁移的弹性。今天的最优解是Claude,明天可能是Gemini或开源模型。把团队锁定在单一供应商的token福利,长期看是技术债务。
token补贴不是终点,是代理型AI普及过程中的一个临时驿站。它暴露了旧薪酬体系的裂缝,也预告了人机协作的新契约。当算力变成和氧气一样的基础资源,我们分配它的方式,就是在定义下一个十年的工作本身。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.