网易首页 > 网易号 > 正文 申请入驻

“如果你不用更多Token,就永远逃不出底层”:AI竞赛开始变成资源战争

0
分享至


整理|冬梅

如果把过去两年的 AI 叙事拆开来看,一个趋势已经越来越清晰:真正的瓶颈,正在从“模型能力”转向“资源分配”。

一边是推理成本持续下降、调用门槛几乎被抹平,另一边却是算力、带宽乃至组织内部认知结构的全面紧张——供给看似在爆炸,约束却变得更加隐性而复杂。

也正是在这种“表面过剩、内里稀缺”的张力之下,越来越多一线从业者开始重新审视一个问题:AI 到底在重塑什么,又在抬高什么。

在这样的背景中,一些来自实践一线的信号,比任何宏观判断都更具解释力。

在一档播客栏目中,SemiAnalysis 创始人 Dylan Patel 与主持人展开了一场对话,共同探讨 AI 革命中爆发式的供需动态。Dylan 分享了其公司的 Token 开销如何飙升至每年 700 万美元,这彻底改变了他们的生产力,并凸显了一个新时代的到来:在这个时代,执行的成本很低,但高质量的想法却价值连城。

他们深入探讨了 Anthropic 尖端模型(如 Opus 4.7 和 “Mythos”)的影响、半导体供应链中隐藏的瓶颈(包括内存、台积电和 CPU),以及“幻影 GDP”这一经济现象。最后,Dylan 对 AI 快速扩张带来的社会影响分享了大胆预测,包括为什么大规模的反 AI 抗议活动可能就在眼前。


以下为完整访谈内容,经由 InfoQ 翻译 & 整理:

1 Token 成本疯涨,即将超过员工薪资

主持人:过去很长一段时间里,真正稀缺的是执行力——执行非常非常困难,而想法却很廉价。但现在情况完全反过来了:想法变得廉价而且泛滥,执行却变得极其容易。所以,真正有价值的,只剩下那些能够证明自己“值得投入”的好想法。

你之前跟我讲过一个很惊人的故事,说你们团队今年在 AI token 使用上的变化非常剧烈。能不能再讲一遍?这件事让你对整个世界发生的变化有什么新的理解?

Dylan Patel:去年我们还觉得自己已经算是 AI 的重度用户了。大家都在用 ChatGPT、用各种云服务,公司也基本是“谁需要什么订阅就给什么订阅”,整体开销也就是几万美元量级。

但今年完全不一样了。真正的转折点大概是从 12 月底开始,随着 Anthropic 的 Opus 模型发布。我们公司总裁 Doug 带头推动了一件事——让非技术人员也开始用 AI 写代码。

一开始是工程师在用,但到了 1 月份,使用量开始爆发式增长,一路飙升。后来我们直接和 Anthropic 签了企业协议。到你上次跟我聊的时候,我们的 AI 开销年化大概是 500 万美元,但现在已经涨到 700 万美元了——而且那是上周的数据。

很多开销其实来自“使用本身”。比如一些从来没写过代码的人,现在也在用 Claude 写代码,有的人一天就能花掉几千美元的 token。整体算下来,我们现在一年大概花 700 万美元在 AI 上,而公司的薪资成本大概是 2500 万美元。

也就是说,我们在 AI 上的支出已经超过了薪资的 25%。如果这个趋势继续下去,到今年年底甚至可能超过 100%。这听起来确实有点可怕。

不过幸运的是,我们公司在快速增长,所以还不用在“雇人还是用 AI”之间做取舍。更现实的情况是:我们可以少招很多人,同时把钱投入 AI,然后增长得更快。

但我觉得,很快其他公司就会面对一个现实:如果一个人借助 AI 能完成原本 5 到 15 个人的工作,那企业就会开始考虑裁员。

主持人:你能不能举一些具体的例子?这些投入到底带来了什么样的变化?

Dylan Patel:有一个特别典型的例子。我们在俄勒冈州建了一个芯片逆向工程实验室,已经投入了一年半。里面有各种高端设备,比如扫描电子显微镜。我们会拆解芯片,分析它的结构和材料,这些数据是我们卖给客户的核心产品。

但这个分析过程本来是非常慢的。

现在,一个团队成员用几千美元的 token,做了一个 GPU 加速的应用,部署在 CoreWeave 的服务器上。现在只要上传一张芯片图片,这个系统就能自动识别出不同材料——比如哪里是铜、哪里是钽、哪里是锗、哪里是钴——并完成整个结构的有限元分析,还带可视化界面。

这个人之前在英特尔工作过,他说:这在以前是一个完整团队的工作,而且还需要长期维护。但现在,一个人就做出来了。把这种效率放大到整个公司层面,影响是非常夸张的。

还有一个我特别喜欢的例子。我们有个同事 Malcolm,他之前是大型银行的经济学家。那种机构的经济学团队通常有一两百人。

他一个人,用 AI 做了一件非常疯狂的事:他把 FRED 数据、就业报告等各种经济数据,通过 API 全部接入,然后开始跑回归分析,研究不同经济变量对通胀和通缩的影响。

更夸张的是,他还分析了美国劳工统计局(BLS)的 2000 项任务,判断哪些可以被 AI 完成,哪些不行,并建立了一套评估体系。目前大概只有 3% 的任务是 AI 可以完成的。

基于这些,他提出了一个概念,叫“幻影 GDP”(Phantom GDP):AI 会让产出增加,但由于成本下降得更快,理论上 GDP 反而可能下降。

他还顺手做了一整套语言模型评估体系,包含 2000 个评测任务。这些,全都是他一个人完成的。他自己也说,这在以前需要一个 200 人的团队干一年。

主持人:那作为公司经营者,你怎么看这种支出从接近 0 一路涨到 25%,甚至可能更高?你有没有想过什么时候该“踩刹车”?比如不用最顶级的模型,换便宜一点的?

Dylan Patel:从本质上讲,我们是在做信息生意——卖分析、做咨询、提供数据集。如果我不持续提升产品质量,这些东西很快就会被商品化(commoditized)。

比如我们最早做的数据产品,现在已经有很多人开始做类似的了。如果我们停在原地,很快就会失去竞争力。

AI 的确会让很多东西变成“商品”,就像它对软件行业做的那样。但关键在于:谁能更快迭代、谁能持续提升服务质量、谁能掌握客户,谁就能增长

那些不行动的“既得利益者”,一定会输。所以这其实是一个生存问题:如果我不用 AI,别人会用,然后打败我。

再举一个能源领域的例子。

我们之前有几位分析师,花了一年时间想做一个能源模型,但一直没做出来。能源数据服务市场大概有 9 亿美元规模,是一个很大的机会。

后来,我们有个负责数据中心能源业务的同事 Jeremy,“AI 上头”了。他连续几周每天花大概 6000 美元的 token。

在短短 3 周内,他做了这些事:抓取了美国所有发电厂、所有高压输电线路的数据,构建了整个美国电网的映射,还整合了大量需求侧数据。

最后做出了一个可视化系统,可以看到美国各个区域的电力供需情况。我们拿去给一些做能源交易的客户看,他们的反应是:“这东西你们做了多久?太强了,比某某公司还好。”

而那家公司,有 100 人团队,做了 10 年。当然,我们的系统还不够完善,但在某些方面已经更强了。

主持人:听起来,你描述的不只是效率提升,而是整个生产函数都被改写了。

Dylan Patel:完全是这样。现在的问题已经不是“能不能做”,而是“这个想法值不值得做”。因为执行成本已经低到几乎可以忽略不计了。

从你的角度来看,本质上你是在“商品化”这些能源数据服务公司。如果你不加快速度,那谁会来商品化你?所以问题就变成:作为一个企业经营者,你确实在大笔花钱,但这些投入到底带来了什么?是否真的带来了更多收入?

Dylan Patel:是的,确实带来了更多收入。

主持人:那你有没有担心过一个极限情况:那些掌握资本、负责投资的人——他们本来就是你的客户——会不会有一天说,“我们自己也有很聪明的分析师,那我们干脆自己做,不再买你的服务了”?如果一切变得这么容易,最终会不会所有能力都内收进这些投资机构内部?

Dylan Patel:首先,任何信息服务业务都有一个基本逻辑:我从信息中创造的价值,永远小于我的客户从中获得的价值。

举个简单的例子,如果我以 1 美元卖给你一条信息,你之所以愿意买,是因为这条信息能帮你赚超过 1 美元。所以,本质上你从我这里“套利”了,你赚得比我多。

像一些顶级投资机构,比如 Jane Street、Citadel,它们内部本来就有非常强的数据和研究能力。但即便如此,它们仍然会持续购买我们的数据,而且合作规模还在扩大。

原因很简单:我们有某种“优势因子”。我们更快、更灵活,是一个小团队,专注在一个非常具体的方向——AI 基础设施、token 经济,以及这场技术革命的演进路径。

我们对趋势的判断更前置,执行速度更快,产品迭代也更快。

当然,投资机构也会尝试自己构建一部分能力,但更多时候,他们会发现:直接买我们的数据更便宜。因为他们可以在我们的数据之上再做自己的分析,而不是从零开始构建整套体系。

不过,确实会有一部分人尝试自建,这是不可避免的。

2 Token 需求暴涨,但供给跟不上

主持人:我感觉每次跟你聊天,最后都会回到一个核心问题:token 的供需关系。这似乎是现在整个世界最关键的变量。从你亲身经历的这些变化来看,你对“需求侧”的判断有没有发生变化?

Dylan Patel:变化非常大。

如果我们从宏观角度看,比如 Anthropic,它的收入从大约 90 亿美元增长到现在的 350 亿到 400 亿美元年化水平——等这期播客播出时,可能已经到 400 亿到 450 亿美元了。

但关键是:它的算力并没有按同样比例增长。

如果你做一个简单的推算,并假设它没有减少研发算力(而事实上它不可能减少,因为它还在发布像 “Mythos” 和 Opus 4.7 这样的模型),那么可以得出一个结论:即使把所有新增算力都用于推理(inference),它的毛利率底线也在 72% 左右

而现实情况是,一部分新增算力还投入到了研发中,所以真实毛利率可能更高

要知道,在今年年初,有人泄露过他们融资文件中的数据,当时的毛利率只有 30% 多。这意味着什么?意味着 token 的需求增长速度,远远超过了供给增长。整个系统正在被需求侧“拉爆”。

主持人:也就是说,你看到的是一个需求远超预期、而供给跟不上的市场?

Dylan Patel:没错,而且这种失衡还在加剧。从我自己的公司就能感受到:一旦你真正把 AI 深度嵌入工作流,token 消耗会呈指数级增长。而且这种增长,不是“可选项”,而是“竞争所必需”

这才是最关键的变化。

主持人:像这样的公司,利润率是怎么能做到这么高的?这听起来几乎不现实。

Dylan Patel:本质原因很简单:需求太强了。

现在真正重要的,不是你用不用这些模型,而是你有没有“访问权”。比如,你有没有 Anthropic 的客户经理?有没有企业级合同?能不能提高你的 rate limit(调用速率限制)?

因为 token 本身已经变成一种高度稀缺资源。谁能付得起钱,谁就能用到更多。

这其实不是问题,而是资本主义的自然结果。Anthropic 现在一年大概有 400 亿美元的 token 收入,但关键是——这些 token 为客户创造的价值,远远超过 400 亿美元

不同企业,每个 token 能创造的价值不同。但随着模型越来越智能,真正重要的是:你是否能获取这些“最聪明的 token”,以及你如何使用它们。

最终,决定胜负的不是模型本身,而是人——你能不能把这些 token 用在最有价值的地方。

因为会有很多人使用 token,但并不是所有人都在创造价值。比如一些做 SaaS 的初创公司,用 Claude 生成代码,但如果他们的产品本身不创造足够价值,那他们很快就会被“挤出”市场——因为他们用不起这些 token

3 “Mythos 强大到让 Anthropic 不敢公开”

主持人:我今天刚好有个亲身体验:在飞机上我用模型的时候,被 rate limit 限制了。当我看到 4.7 发布后,我立刻就想用 4.7,甚至已经不想再用 4.6 了——尽管过去几周我一直用得很开心。你会不会觉得,大家对“最新、最贵模型”的执念,有点出乎意料?

Dylan Patel:完全不意外。我最近一个很好笑的经历是:我和朋友 Leopold,曾经“跪着求”一位 Anthropic 的联合创始人,让他给我们 Mythos 的访问权限——尽管他一直假装这个模型不存在。

但这恰恰说明了问题:大家都知道,更强的模型意味着更大的价值。

从目前流出的 benchmark 来看,Mythos 可能是过去两年里模型能力最大的一次跃迁。这一点非常关键。甚至可以说,它强到让 Anthropic 不敢完全公开发布。虽然他们已经给部分客户定了价格——大概是当前 token 成本的 5 到 10 倍——但他们仍然在犹豫,因为担心它对世界的影响。

现在对外发布的 Opus 4.7,其实是一个“刻意削弱”的版本,尤其是在某些敏感能力上。所以我的建议很直接:如果你有足够的资金,就应该尽早签一个 Anthropic 的企业级合同,按 token 付费,而不是用普通订阅。这样你才能避免被 rate limit 卡住。

然后,你必须解决一个核心问题:如何把这些 token 用在“最值钱”的任务上,并且从中赚钱。

从某种意义上讲,一两年之后,很多公司的本质,可能就是在“做 token 套利”:token 本身很强大,但关键在于你把它“指向哪里”。

再往后走三到四年,甚至连这个问题都不需要人来决定——模型自己就会知道,应该把算力用在哪些地方,来创造最大价值。

主持人:听起来像是一个完全不同的经济体系。

Dylan Patel:其实我们已经能从历史中看到这个趋势。

随便选一个能力基准来看:过去达到某个能力水平,可能需要非常高的成本;现在,成本可能已经降到原来的 1/100,甚至 1/1000。

比如一些新模型,在达到类似 GPT-4 能力时,成本已经下降了几个数量级。但有趣的是——没人真的在乎这些“旧一代能力”变便宜了。大家真正想要的,是最前沿的模型。因为只有前沿模型,才能创造真正有经济价值的东西

Dylan Patel:所以,驱动需求的,从来不是“成本下降”,而是“能力上限的提升”。

一年之后,今天的 Opus 4.6 或 4.7,可能成本只剩下现在的 1/100——比如我现在 700 万美元的开销,可能只需要 7 万美元。

但这不重要。

因为到那时候,我用的会是更强大得多的模型,能做更多、更复杂、更有价值的事情。

主持人:虽然 Mythos 这个模型单个 token 更贵,但因为它完成任务所需的 token 数量更少,所以在很多任务上反而比 Opus 4.6 更便宜,对吧?

Dylan Patel:没错。本质上是“单位 token 更聪明”。虽然单价更高,但效率提升太明显了,所以整体成本反而下降。

主持人:我记得上次见你的时候,Mythos 刚出来,你说这个模型好到让你有点“害怕”。你当时是什么意思?

Dylan Patel:Anthropic 在 2024 到 2025 年的一个核心目标,是让模型达到“L4 软件工程师”的水平——也就是一个比较初级但已经能独立工作的工程师。

基本上,他们用 Opus 4.6 做到了这一点。

但他们没明说的是:如果你看 Mythos 的 benchmark,它更接近“L6 工程师”——也就是一个经验相当丰富的高级工程师。更夸张的是,这个能力跃迁只用了两个月时间。他们内部大概在 2 月就已经有这个模型了。

所以问题就来了:接下来会发生什么?模型进步不仅没有放缓,反而在加速。无论是 Anthropic 还是 OpenAI,模型发布节奏都在明显压缩

原因其实很清楚:要做出更强的模型,需要三样东西——算力、研究人员、以及“实现能力”。

算力很贵,而且短期内基本是“锁定”的;顶级研究人员也极其稀缺,薪酬动辄上千万美元。但“实现能力”(implementation)这件事,过去一直是瓶颈,现在却被 AI 极大地降低了门槛。

以前你有一个好想法,但实现它很难;现在你有想法,实现变得很容易——虽然仍然需要花钱,但技术门槛已经大幅下降。

主持人:这会带来什么变化?

Dylan Patel:这会彻底改变“创新的节奏”。因为实现变容易了,你可以同时尝试更多想法,然后快速迭代。无论是在做模型研发,还是在做应用——都一样。

比如过去模型可能 6 个月发布一次,现在可能 2 个月就发布一次。再比如,你想建一个美国电网的供需模型——以前很难,现在也可以快速做出来。

问题变成了:你有那么多想法,但哪些想法值得投入 token 成本去实现

这其实是一个核心转变:过去,想法廉价,执行昂贵;现在,想法廉价且泛滥,执行变得便宜而容易。

所以,真正有价值的,只剩下“好想法”——那些能够证明自己值得被执行的想法。

主持人:那你说的“害怕”,更多是技术不确定性,还是别的?

Dylan Patel:不确定性肯定存在,但确实也带来了一种更深层的担忧——社会层面的。

我们正在进入一个世界:“你能不能执行”不再重要,真正重要的是——你能不能选对要做的事情。你的价值,变成了三件事:

1)选择正确的问题让 AI 去解决

2)把 AI 的产出转化为产品或价值

3)获取资源(资本、算力、token)来放大这一切

这也解释了为什么“最新模型的访问权”变得如此关键。

谁能用到最先进的模型?不再是所有人。

Anthropic 已经在做选择性开放,比如 Mythos 只提供给少数客户(目前主要用于网络安全场景)。未来这种趋势只会加强——模型不会全面开放,而是越来越“定向分发”。原因很现实:AI 太贵了。谁来为万亿美元级别的基础设施买单?一定是那些能用 AI 赚到钱的公司。同时,模型公司也不希望被“蒸馏”或复制,所以不会大规模开放最先进能力。

主持人:这听起来像是资源会越来越集中。是这样吗?

Dylan Patel:是的,这正是我在思考的问题:随着 token 的价值越来越高,这些资源和由此产生的收益,会不会集中在越来越少的公司手里?

比如我现在还拿不到 Mythos,但一些顶级银行已经在用了(虽然目前主要用于网络安全)。未来可能会出现这样一种情况:因为我有企业级合同、关系不错,我能稍微更早拿到新模型,或者获得更高的调用额度。我希望是这样——因为这本身就会成为新的竞争优势。

主持人:如果你的竞争对手拿不到这些最先进模型的访问权,而你能拿到,那基本上你就可以直接碾压他们,对吧?

Dylan Patel:完全可能。你可以想象一个极端但现实的场景:像 Ken Griffin 这样的人——既有钱又有关系——直接去跟模型公司谈一个协议,比如和 OpenAI 或 Anthropic 签约,说“我每年先买 100 亿美元的 token,你们的新模型优先给我用,等我用完第一批,其他人才可以用”。

如果这种事情发生,会怎样?

那他在市场上基本就是“降维打击”。这种优势可以体现在很多领域:可能是网络安全(Anthropic 目前就对这类场景高度敏感),也可能是信息服务(像我这样的业务),本质上都是一样的——谁先用上最强的模型,谁就能碾压别人。

更关键的是:我们其实并不知道这些模型真正的能力边界在哪里。

Anthropic 不知道,OpenAI 不知道,任何人都不知道。

真正去探索这些能力的,是“使用者”。是他们在不断尝试:这些 token 能用来做什么?能构建什么?

这件事本身,对人类生产力是极大的提升。但同时,也带来一个问题:资源和能力,会不会越来越集中到少数人手里?这些都需要时间来回答。

4 具身智能将成 AI 领域新的需求爆发点

主持人:那如果把视角拉远一点,比如机器人领域?现在机器人几乎不消耗 token,但未来会不会成为一个新的需求爆发点?

Dylan Patel:我认为会,而且非常快。现在有一个概念叫“软件奇点”(software-only singularity)——也就是说,AI 的爆发主要发生在软件世界。但现实是,绝大多数经济活动发生在物理世界。

所以,软件奇点只是一个阶段,而不是终点。一旦软件变得极其容易构建,下一步自然就是:把这些能力扩展到物理世界,也就是机器人。

现在机器人难在哪里?主要难在控制系统——比如微控制器、执行器、复杂的动作控制

而当前主流的机器人模型(比如 vision-language-action 模型)在数据效率上其实很低,没法像语言模型那样规模化。

但未来一定会出现新的路径:类似于“大规模预训练”的机器人模型,就像人类一样,通过大量经验学习,同时具备“样本高效性”(few-shot learning)

主持人:你觉得这个突破大概什么时候会发生?

Dylan Patel:我认为在未来 6 到 18 个月内,会出现真正有意义的突破。

比如你买一个机器人,只需要给它几个示例,它就能学会任务:让它叠衣服、搬东西、保持平衡,它都能很快掌握。到那个时候,机器人会变得高度专业化:可能会有专门擦黑板的机器人、叠衣服的机器人,甚至是一种“软件包”——你下载一个模型,它就让通用机器人具备某种能力。

这会带来两个结果:一是物理世界的生产效率大幅提升;二是通缩效应(deflation)进一步加强。同时,这也会让 token 的需求继续爆炸式增长。

我个人不认为 token 需求会放缓。

主持人:那回到模型本身,比如 Mythos,它的出现有没有让你对“规模法则”(scaling laws)有新的看法?

Dylan Patel:反而更确认了一点:规模法则仍然有效。Mythos 本质上是一个更大的模型——规模显著提升。这说明一件事:投入更多算力,模型就会变得更强

当然,不只是“堆算力”。整个过程中,还有大量“效率提升”——也就是说,达到同样能力的成本在持续下降。你可以这样理解:一方面,如果你不断扩大规模,会得到能力的巨大跃迁;另一方面,如果你维持同样能力水平,成本却在指数级下降。

5 Anthropic 已经领先了?

主持人:那从竞争格局来看,现在是不是 Anthropic 已经领先了?

Dylan Patel:表面上看是这样。他们在 2 月就有 Mythos,但甚至没有完全发布,因为需求已经爆满;现在又发布了 Opus 4.7。

很多人会说,那 OpenAI 是不是已经落后了?但事情没那么简单。Anthropic 的问题在于:算力受限。他们增长得很快,但扩张能力有限。

而 OpenAI 的策略完全不同——他们在算力上是“极端激进”的,大规模采购资源,从 Microsoft、Oracle,到 SoftBank,再到 Amazon 的 Trainium 芯片,全都在押注。

简单说:Anthropic 更克制,但现在也开始意识到算力不够;OpenAI 则是一开始就疯狂堆算力,现在反而有更大的扩展空间。

还有一个容易被忽视的点:技术的扩散是有“时间滞后”的。

你我可能第一时间用上新模型,但大多数企业需要时间去学习、适应、重构流程。

所以即使不考虑模型继续进步,仅仅是“现有能力的扩散”,到今年年底,一个类似 Opus 4.6 水平的模型,可能就能支撑起整个经济体数百亿美元的支出规模。

现在是 400 亿美元,这个数字继续增长,并不夸张。

主持人:所以你的意思是,现在的增长更像是“线性外推”,而不是指数增长?真正的指数级爆发,需要更强的模型?

Dylan Patel:没错。现在只是线性增长——真正的指数增长,取决于下一代模型能力的跃迁。

问题在于,Anthropic 可能没有足够的算力去推动那个跃迁。接下来更有可能是 OpenAI 或 Google 先达到那个层级

一旦有人先做到,就算他们的毛利率只有 50%,而不是 70%+,他们依然会吃掉几乎所有新增需求——而且很可能他们自己也没有足够算力去满足全部用户

你可以想象一个极端情况:如果算力完全充足,像 Mythos 这样的模型,理论上可以支撑 5000 亿美元级别的收入。

但现实是,算力严重受限。

我们已经看到,比如 NVIDIA H100 的价格在飙升,而且这些 GPU 的“使用寿命”也在被不断拉长。

这意味着什么?意味着不仅一线实验室(Anthropic、OpenAI)会“供不应求”,连二线、三线实验室也一样——大家都会把 token 卖光。

本质上,现在出现了一个越来越大的“剪刀差”:模型所能创造的经济价值,在飞速增长;但我们能提供的算力供给,增长得没那么快。这个差距会持续扩大。

而结果就是:模型公司的利润率会不断上升——直到硬件供应链开始“反向收割”,提高自己的利润

主持人:听起来你对需求侧的判断是:几乎爆炸式增长,而且这种增长还在加速。

Dylan Patel:是的,而且我觉得很多人还低估了这一点。我有一个比较极端的说法:如果你不使用更多 token,你会被困在一个“永久底层”(permanent underclass)。

主持人:这个说法挺激进的,展开讲讲。

Dylan Patel:这里其实有三个层次的问题:

第一,你要不要用更多 token;

第二,你能不能用这些 token 创造经济价值;

第三,你能不能把这些价值“抓在自己手里”。

很多人现在只做了第一步,甚至是以一种“偷懒”的方式——比如用 AI 把 8 小时工作压缩到 1 小时。但那只是最低级的用法。

更高级的方式是:你仍然工作 8 小时,但产出变成原来的 8 倍,收入可能变成 5 倍

这在传统“打工模式”下不一定成立,但对于创业者、自由职业者、多项目操盘的人来说,这是完全可能的。

关键是:现在还不是“标配阶段”(table stakes)。你还有窗口期,可以利用 AI 提前放大自己的产出。但一旦所有人都这么做,这种优势就会消失。如果你在这个阶段没有做到这三件事——

用 token、创造价值、捕获价值——那随着模型能力继续提升、资源进一步集中,你很可能会被甩在后面。

主持人:那我们聊聊供给侧。为了支撑这种需求爆发,整个技术栈在发生什么变化?

Dylan Patel:一句话总结:整个供应链都在“涨价 + 延长周期 + 预付款”。

首先是 GPU。像 NVIDIA 的产品,不仅价格在上涨,而且使用寿命也在延长。

过去很多人说 GPU 用 5 年就淘汰,现在看完全不成立——很多 3-4 年前的集群还在续约使用,甚至可能用到 7-8 年。这意味着云厂商的真实利润率,其实比表面看起来更高。

再往下看整个供应链:

  • 硬件层:像 NVIDIA,毛利率依然非常高

  • 内存:利润率已经大幅上升

  • 光学、逻辑芯片:通过“预付款”提升资本回报率

  • 光刻机:ASML 已经完全卖空,还依赖 Carl Zeiss 扩产

甚至更底层,比如 PCB 所需的铜箔,也开始供不应求,需要提前锁定产能。

你会看到一个非常一致的模式:整个链条上的每一个环节,要么已经售罄、在提价,要么在收预付款、提高资本效率。换句话说:只要是“有实体、有产能”的环节,现在都在被抢。这就是供给侧的现实。

主持人:从历史来看,需求爆发之后,供给通常会很快跟上,甚至出现过剩。但现在看起来,供给几乎不可能追上。你觉得当前最关键的瓶颈在哪里?

Dylan Patel:问题在于:这一次的供应链,比以往任何时候都更复杂。而且我们正在构建的系统,本身复杂度也极高,这直接拉长了交付周期(lead time)。

过去某些行业也有 18 个月的交付周期,但“扩产”本身不需要几年时间;而现在,即使你决定扩产,真正的新增供给也要等很久才会出现。

一个典型例子是内存。内存产能每年大概只能增长 20% 到 30%,这是物理极限。即使 2025 年底需求信号已经非常明确,厂商也开始扩产,但这些新增产能,真正落地可能要到 2027 年末甚至 2028 年。

这意味着什么?

意味着价格会持续上涨,而且还没结束。尤其是 DRAM,很可能还会再翻倍甚至翻三倍。很多人觉得“内存瓶颈已经被充分讨论了”,但实际上完全没有。真正的紧缺才刚开始。而在市场机制下,唯一的调节方式就是——涨价,通过“需求破坏”(demand destruction)来重新分配资源。

主持人:那除了内存,逻辑芯片这边呢?

Dylan Patel:逻辑芯片同样面临严重瓶颈。台积电(TSMC)一直在提高资本开支(capex),今年大概在 500 多亿美元,而且还在上调。

但问题是:建晶圆厂是需要时间的。

他们已经在尽可能压榨现有产能,但短期内不可能大幅提升供给。而且他们目前的涨价策略其实相对“温和”,只是个位数涨幅——不像内存那样激进。

这就带来一个问题:台积电当然是优质公司,但它未必能“吃掉”整个价值链的最大收益。

真正被低估的,是更上游的设备和材料供应链。比如:

  • ASML:已经完全卖空

  • Lam Research、Applied Materials:需求持续爆发

  • 更下游的供应商,比如 MKSI 等:同样受益于“订单外溢”

还有很多更细分的环节:铜箔、玻纤(PCB 材料)、激光器……这些都是“小而关键”的供应链,但现在全部处于极度紧张状态。

如果台积电在 2028 年真的做到 1000 亿美元资本开支(这不是幻想,而是现实可能),那整个供应链会被“鞭子效应”(bullwhip effect)不断放大冲击。

换句话说:越往上游,波动越剧烈,瓶颈越严重。

主持人:那除了 GPU,这一波 AI 还有哪些被忽视的瓶颈?

Dylan Patel:CPU 是一个被严重低估的瓶颈。现在大家都在讨论 GPU,但实际上 CPU 也已经“卖断货”了。

原因有两个:第一,强化学习(reinforcement learning)。模型训练现在不只是“喂数据”,而是要在环境中反复试错、评估结果。这些“环境”——无论是简单的文本校验,还是复杂的 CAD 仿真——都是运行在 CPU 上的。

第二,推理后的执行层。模型生成的代码、内容,并不会直接变成最终结果,而是要在各种应用环境中运行——这些环境,大量依赖 CPU。

换句话说:

  • GPU / ASIC:负责“思考”(模型推理)

  • CPU:负责“执行”(环境运行、应用落地)

随着 AI 生成的内容越来越多,CPU 需求也在同步爆发。

主持人:那从你的角度来看,最难判断的变量是什么?

Dylan Patel:不是供给,也不是成本,而是——“token 的经济学”。我们其实很清楚:

  • 训练成本是多少

  • 推理成本是多少

  • 模型公司大概赚多少钱

但最难的是:这些 token 被用来做什么?创造了多少真实价值?这些价值如何在经济中扩散?

比如我用 AI 提升了信息分析能力,然后把这些信息卖给客户,价格还比以前更便宜。这会带来什么结果?

  • 客户做出更好的投资决策

  • 企业做出更优的竞争策略

  • 整个经济效率提升

但这些价值,并不会完整体现在 GDP 统计里。这就是我说的“幻影 GDP”(Phantom GDP)问题:真实创造的价值,远远大于统计数据所反映的。但我们现在还没有一个很好的方法去衡量它。

6 少谈未来,多讲当下

主持人:最后一个问题。如果我们三个月后再聊,你觉得会发生什么?

Dylan Patel:我认为,会出现大规模的反 AI 抗议。

主持人:这么快?

Dylan Patel:是的。现在很多人其实是“反 AI”的,而且这种情绪在上升。随着 AI 收入快速增长、企业结构发生变化,人们会开始把各种问题归因于 AI。

再加上一些政治人物或社交媒体的推动,这种情绪很容易被放大。甚至已经有一些极端案例,比如针对 Sam Altman 的攻击事件,网上还有人表示支持。

这只是开始。

主持人:那 AI 行业应该怎么应对?

Dylan Patel:我觉得有三个关键点:第一,沟通方式需要彻底改变。像 Sam Altman 和 Dario Amodei 的对外表达,其实并没有很好地建立公众信任;第二,多展示“正面价值”,让普通人看到 AI 如何改善生活,而不是只谈“颠覆世界”;第三,少谈未来,多讲当下,如果一直强调“AI 将改变一切”,只会加剧恐惧感。

现在的问题是,大多数人既不了解这些公司,也不了解这些技术。他们看到的,是一个“神秘的小圈子”,在打造一个可能改变世界、甚至取代人类工作的系统。

如果这种认知不改变,反弹是必然的。

https://www.youtube.com/watch?app=desktop&v=LF3aUIM57uw

声明:本文为 InfoQ 整理,不代表平台观点,未经许可禁止转载。

会议推荐

世界模型的下一个突破在哪?Agent 从 Demo 到工程化还差什么?安全与可信这道坎怎么过?研发体系不重构,还能撑多久?

AICon 上海站 2026,4 大核心专题等你来:世界模型与多模态智能突破、Agent 架构与工程化实践、Agent 安全与可信治理、企业级研发体系重构。14 个专题全面开放征稿。

诚挚邀请你登台分享实战经验。AICon 2026,期待与你同行。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
高鑫夫妇给女儿过18岁生日,礼物收到手软是全家团宠,外貌像姥姥

高鑫夫妇给女儿过18岁生日,礼物收到手软是全家团宠,外貌像姥姥

白面书誏
2026-04-30 15:55:48
掘金2-4首轮出局,约基奇空砍准三双,卫冕冠军耻辱落幕

掘金2-4首轮出局,约基奇空砍准三双,卫冕冠军耻辱落幕

友谊第一
2026-05-01 14:40:33
脾气大却最旺夫的3个生肖女,有她在麻烦不来,带旺全家人财运!

脾气大却最旺夫的3个生肖女,有她在麻烦不来,带旺全家人财运!

毅谈生肖
2026-05-01 10:02:45
特朗普也没想到,一场战争把中国电车送到了新高度。。。

特朗普也没想到,一场战争把中国电车送到了新高度。。。

差评XPIN
2026-04-29 00:03:13
美国现任防长曾谈中美开战:11艘航母打击中国,20分钟后1艘不剩

美国现任防长曾谈中美开战:11艘航母打击中国,20分钟后1艘不剩

蜉蝣说
2026-04-28 11:14:47
男子将24岁女孩撞成高位截瘫,得知要赔200万,灵机一动将名下2套房过户给女儿,女孩去要钱,男子:要钱没有,要命一条!

男子将24岁女孩撞成高位截瘫,得知要赔200万,灵机一动将名下2套房过户给女儿,女孩去要钱,男子:要钱没有,要命一条!

大爱三湘
2026-04-28 19:39:24
医生建议:超过60岁的老人,宁可在家躺着,也别在5个时候散步

医生建议:超过60岁的老人,宁可在家躺着,也别在5个时候散步

芹姐说生活
2026-05-01 14:37:48
专业人士在气象卫星图像中发现马航MH370被重型导弹击落证据

专业人士在气象卫星图像中发现马航MH370被重型导弹击落证据

侃侃儿谈
2026-05-01 08:15:34
格林美(002340)2026年一季报简析:营收净利润同比双双增长,盈利能力上升

格林美(002340)2026年一季报简析:营收净利润同比双双增长,盈利能力上升

证券之星
2026-05-01 07:12:25
《妻旅8》伊能静3次救场,孙杨当导游,受累的不止张豆豆

《妻旅8》伊能静3次救场,孙杨当导游,受累的不止张豆豆

情感大头说说
2026-05-01 08:50:48
森林狼4-2掘金,穆雷被麦丹打爆,双约55分带不动拉胯队友

森林狼4-2掘金,穆雷被麦丹打爆,双约55分带不动拉胯队友

顺静自然
2026-05-01 14:19:36
不想访华了?美国联合27国,准备废除中国王牌,中国自爆家底

不想访华了?美国联合27国,准备废除中国王牌,中国自爆家底

生活魔术专家
2026-05-01 10:50:24
她是出卖江姐叛徒的妻子,98岁时却被国人敬重,她到底做了什么?

她是出卖江姐叛徒的妻子,98岁时却被国人敬重,她到底做了什么?

史之铭
2026-04-30 19:56:22
《蜜语纪》大结局!原来鲁贞贞坐牢,拆穿了许蜜语的真面目

《蜜语纪》大结局!原来鲁贞贞坐牢,拆穿了许蜜语的真面目

阿讯说天下
2026-05-01 11:00:01
1967年,宋美龄和蒋经国的合影,两人相差13岁,貌合神离!

1967年,宋美龄和蒋经国的合影,两人相差13岁,貌合神离!

云霄纪史观
2026-04-30 19:59:49
浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

魔都姐姐杂谈
2026-03-30 19:25:57
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
今天上午9点,环球中心!成都150所中学集结,等你来咨询

今天上午9点,环球中心!成都150所中学集结,等你来咨询

成都商报教育报道
2026-05-01 10:13:27
又打起来了,以色列军机被击落,特朗普恼羞成怒,英法德俄失声

又打起来了,以色列军机被击落,特朗普恼羞成怒,英法德俄失声

失我者永失qq
2026-05-01 11:42:55
油多到放不下,伊朗想拼一把,用铁路往中国运石油,特朗普拦不住

油多到放不下,伊朗想拼一把,用铁路往中国运石油,特朗普拦不住

共工之锚
2026-05-01 00:13:42
2026-05-01 15:35:00
InfoQ incentive-icons
InfoQ
有内容的技术社区媒体
12328文章数 51869关注度
往期回顾 全部

科技要闻

苹果上季在华收入继续大增 iPhone收入新高

头条要闻

山东舰遭日本侦察机抵近侦察 解放军一句警告将其喝退

头条要闻

山东舰遭日本侦察机抵近侦察 解放军一句警告将其喝退

体育要闻

季后赛场均5.4分,他凭啥在骑士打首发?

娱乐要闻

邓超在景德镇被偶遇,穿黑外套逛茶园

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

艺术
数码
家居
公开课
军事航空

艺术要闻

刘明华 2026油画新作(2024-2026)

数码要闻

三星停产LPDDR4/X内存,产能聚焦LPDDR5/X与HBM等AI产品

家居要闻

灵动实用 生活艺术场

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:持续推进海上封锁的行为不可容忍

无障碍浏览 进入关怀版