数据中心的空调依旧轰鸣,但成排的GPU集群正在从前所未有的任务切换中醒来。过去数年,这些昼夜不息的算力巨兽只有一个使命——把万亿级参数的大语言模型从零“喂”成能写诗作画的天才。如今,它们调转枪口,以更快的响应速度接住每一次聊天窗口里的提问、每一次代码补全的请求。AI产业的轴心正从“训练”甩向“推理”,而这一甩,很可能甩出超越英伟达的新赢家。
如果只看过去五年的账本,英伟达的位置几乎不可动摇。从2022财年到今年1月刚刚结束的2026财年,这家全球最大的数据中心GPU厂商收入复合年增长率高达68%,每股收益的复合增速更是冲到89%。硬核增长推着股价走出超过1000%的狂飙曲线,把无数犹豫者留在了车下。更重要的是,英伟达用专有软件生态和广泛的模型优化适配,把OpenAI、谷歌、Meta等头部玩家牢牢圈在自己的算力板卡上。正方逻辑很直接:哪怕推理占比攀升,训练这头巨兽非但不会消失,还会随着更多模态、更大参数模型的诞生而继续大口吞噬通用GPU。灵活性能支撑从训练到推理的全链路,这恰好是英伟达的铠甲。
![]()
不过,推理繁荣的另一侧,超大规模厂商的算账逻辑已经变了。当一个问答模型全天候服务数亿用户,单次推理的电费与芯片折旧虽然微不足道,乘以亿兆级别的调用量就成了压在利润表上的巨石。于是,“什么都能干”的通用GPU开始让位于“只干一件事但干到极致”的专用集成电路——ASIC。这些定制芯片从设计之初就剔除所有与目标任务无关的电路模块,专攻特定模型的推理运算,从而在规模化部署中
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.