![]()
4月22日,谷歌于拉斯维加斯召开Cloud Next 2026大会,大会首先展示,谷歌目前有75%的新增代码由AI生成(并由工程师审阅批准),谷歌已经进入了AI Agent时代,并推出Workspace Intelligence、Gemini企业级Agent平台等一系列AI Agent产品。
当然最吸引资本市场注意力的是,谷歌推出了第八代TPU——这是十年以来,谷歌首次将训练ASIC与推理ASIC拆分,推出面向训练的TPU 8t和面向推理的TPU 8i,搭配自研Axion Arm CPU,构建极致高效的算力体系。其中,尤其以TPU 8i推理ASIC,受到市场格外关注。
![]()
图片说明:谷歌TPU 8t与TPU 8i,数据来源于推特
推理像个无底洞,吞噬着一切算力
进入2026年,以OpenClaw为代表的AI Agent类产品、和以Seedance、Nano Banana为代表的多模态产品,均进入规模化应用阶段,驱动全球算力需求呈现爆发式增长。4月22日谷歌CEO表示,通过客户直接使用API的方式,谷歌的模型每分钟处理超过160亿token,而上季度是100亿token,环比增长60%,直观体现出人类对AI工具的需求正以超预期的速度增长。
而2026年仅仅是AI Agent的一个开端,是少数人初步使用Agent,Agent渗透率极低的初期;未来还将伴随Agent门槛降低、渗透率逐步提升、人与Agent共存的阶段;最后进入完全由Agent主导的阶段。毫无疑问,每跃升一个阶段,都将呈现Token消耗量的指数级增长。
![]()
图片说明:谷歌TPU 8t与TPU 8i,数据来源于腾讯开发者社区
然而,尽管目前AI Agent还处在一个非常早期的阶段,但作为一名普通消费者,即便你不是专业投资者,你也能够明显感受到:算力严重不够用了。
很简单,当你现在使用Gemini、Claude或者GPT的时候,你会发现这些大模型的智商越来越低了,远远不如以前好用了。例如回答问题时输出的Token越来越短了,回答越来越偷懒了,上下文也不记忆了,错误率越来越高了,幻觉也越来越严重了,更糟糕的是费用还越来越贵了。
当然,从专业投资者的角度,还需要用量化数据来审视这一现象。根据Ornn Compute的数据,今年以来,英伟达全系列GPU在云端数据中心的现货租赁价格均大幅上涨,Blackwell系列芯片单小时租金已达4.08美元,较两个月前的2.75美元上涨48%
SemiAnalysis的数据显示,H100的一年期租赁合约价格已由2025年10月的低点约1.70美元/小时/GPU提升至2026年3月的2.35美元/小时/GPU,涨幅近40%。
更夸张的是,甚至连“老古董”A100的租赁价格也在上涨,截止到3月底达1.48美元/小时/GPU,环比上涨+6.5%(相比之下,2月份环比上涨+3.7%,1月份环比上涨+1.5%),标志着环比涨幅连续第三个月加速。
![]()
图片说明:H100价格走势,数据来源于SemiAnalysis
当2020年发布的A100、2022年发布的H100还在因为供不应求而涨价时,那么最开心的一定是那些普遍采用5年直线折旧的NeoCloud企业,那些残值为“零”的老古董正在发光发热。
资本市场已经投出了这一票,无论是美股市场的CoreWeave、Nebius等等,还是A股市场的协创数据(300857.SZ)、宏景科技(301396.SZ)、利通电子(603629.SH)等等,其股价都走出了完全不逊于“光”的磅礴气势。
![]()
图片说明:年初至今,NeoCloud公司的股价完全不输于EML公司,数据来源于Wind
毫无疑问,推理需求正如同无底洞一样,吞噬着所有的算力产能,也难怪马斯克要发出“未来AI芯片将严重不足”的感慨了。
![]()
图片说明:特斯拉启动Terafab芯片工厂的原因,数据来源于新浪财经
把训练和推理分开做,正在成为行业共识
面对指数级增长的推理需求,英伟达从去年12月以200亿美元收购了Groq,LPU甚至被黄仁勋认为是重要性不亚于2019年收购Mellanox的里程碑事件,再到近日谷歌推出第八代TPU拆分训练ASIC和推理ASIC,两大巨头殊途同归,都指向了一件事情:推理ASIC的时代来了。
训练和推理,前者是在制造“硅基大脑”,后者是在使用“硅基大脑”,因此显而易见的是,训练和推理对于算力的需求并不完全相同:训练拼的是力大飞砖的单卡算力(比如每秒的浮点运算次数)、是极限的互联集群规模(几十万卡甚至上百万卡集群)等等;而推理拼的是内存访问效率(如SRAM做的更大,缓存更多数据就近使用)、ASIC间的通信速度(减少芯片间的通信延迟)等等。
![]()
图片说明:谷歌TPU 8t与TPU 8i的核心参数差异,数据来源于华泰证券
毫无疑问,推理需求将指数级增长,且其需求量终将是训练需求的很多倍,这一点已基本成为行业共识,在这一共识之下,推理ASIC的崛起也是水到渠成,GPU不会落幕,只是可预见的未来,GPU的行业增速很难高于推理ASIC。
最后,推理ASIC的崛起,除了利好资本市场耳熟能详的EML、光模块、NPO、MPO、OCS等光通信板块外,国产的一批优秀ASIC相关上市公司未来的业绩增速也非常值得期待。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.