智能体AI(Agentic AI)正在将人工智能行业从成本叙事转向利润叙事。高盛认为,随着token消耗量即将出现跃升式增长,而底层算力成本的下降速度已超过token定价的降幅,超大规模云厂商和大模型提供商的毛利率拐点或将在未来3至12个月内到来。
据追风交易台,高盛5月5日发布报告称,该行预计到2030年,消费端和企业端AI代理合计将推动全球token消耗量较2026年水平增长24倍,达到每月约120千万亿个token;若以2040年企业端代理达到峰值采用率计算,这一数字将进一步扩大至55倍。
高盛的推断价格与成本曲线显示,主流大模型token定价已从此前每年约40%的降幅趋于稳定甚至小幅回升,而英伟达、AMD、谷歌TPU及Trainium等芯片驱动的每token算力成本仍在以每年60%至70%的速度持续下降,两条曲线的剪刀差正在为行业打开利润空间。AI基础设施的大规模资本开支,或将因利润率改善而获得更可持续的经济支撑。
高盛报告的核心论点在于,AI行业正从"推理经济不确定、可能摊薄利润"的阶段,迈向"token增量以具吸引力的边际利润落袋"的新阶段。
在AI周期的第一阶段,投资者普遍将算力和token视为成本驱动因素——更多使用意味着更多推理负载、更多加速器、更多电力和更高资本开支。但高盛的推断价格与成本曲线表明,这一逻辑正在发生转变。
主流大模型token定价虽已大幅下降,但目前已趋于稳定,部分情形下甚至出现回升;英伟达、谷歌TPU(博通)、AMD和Trainium(Marvell)的每token全成本仍在快速且持续地下降。若token定价稳定在高于token成本的水平,则智能体AI采用率的提升将带来正向利润扩张,而非仅仅是收入增长。
高盛估计,到2030年消费端AI代理可将全球token消耗量提升12倍,每月新增约60千万亿个token。
从模拟数据来看,普通LLM聊天机器人每次会话消耗约1,000个token,嵌入式Copilot每天消耗超过5,000个token,而常驻型代理每天的token消耗量可超过100,000个。
高盛预计,到2030年每日AI查询量将从2025年的约50亿次增至约230亿次,其中最多30%将流向搜索、购物、旅行、邮件及个人生产力等领域的代理。传统搜索引擎在查询量中的份额预计将从2025年的68%降至2030年的36%,LLM原生应用的份额则将从12%升至31%。
高盛预计,企业端AI代理将成为最大的token乘数,到2030年推动全球token消耗量增长24倍,到2040年峰值采用时进一步增至55倍,届时企业端工作负载将占全球token总使用量的70%以上。
高盛通过构建模拟代理对不同职业的token消耗进行了量化测算。
结果显示,编程代理每天消耗约700万个token,API成本约为13美元/天,远低于人工成本,这解释了为何软件开发领域的代理采用速度最快;呼叫中心代理每天消耗约200万个token,但若依赖实时语音处理,成本可高达92美元/天,使全面语音自动化在经济上仍不具竞争力;数据录入代理每天消耗约2,500万个token,成本约为60美元/天,仍低于人工成本。
高盛报告的一个关键投资结论是:超大规模云厂商利润率的改善,将使当前高企的基础设施投资更具可持续性,从而化解市场对AI资本开支回报的核心疑虑。
报告指出,目前运营商在满足当前及未来算力需求方面仍受供给约束,谷歌和Meta均已上调2026财年资本开支预期,亚马逊管理层在一季度财报后也重申了维持高资本开支的策略。高盛预计,随着利润拐点临近,投资者将越来越多地寻找回报可见性的证据。
在具体标的方面,高盛对亚马逊的核心逻辑在于AWS收入增速重新加速(一季度同比增长28%),并拥有3,640亿美元的收入积压订单;对谷歌的看法基于其云业务一季度同比增长63%、积压订单环比近乎翻倍至约4,600亿美元;对Meta的判断则基于其广告业务增速显著超越数字广告行业整体,以及AI算力在提升用户参与度和广告变现方面的持续贡献。
在软件领域,高盛认为更低的token成本使软件厂商更容易将代理嵌入现有产品而不显著影响毛利率,同时支持围绕成果、生产力或工作单元而非单纯席位数量进行定价,从而扩大软件可寻址市场。对于IT服务公司,随着代理将AI消费从独立工具转向企业级、高集成度的工作流改造,对集成、治理和托管编排的需求将大幅提升,Accenture被视为这一趋势的主要受益者。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.