![]()
大家好,我是小圆。最近,芯片巨头英伟达悄悄办了一件事:它和一家名叫Groq的初创公司达成了技术授权协议,更关键的是,Groq的创始人兼CEO带着核心团队直接加入了英伟达。
业内普遍认为,这标志着那个由英伟达GPU一统AI算力江湖的时代,首次出现了结构性的裂痕。竞争的核心,正从“如何训练出更强大的模型”悄然转向“如何更便宜、更高效地使用这些模型”,也就是所谓的“推理”阶段。
而在这个新战场上,一个老对手的武器——谷歌的TPU,其设计思想正显示出惊人的威胁。AI硬件的游戏规则,真的要变了吗?
![]()
![]()
过去几年,我们见证了AI模型的狂飙突进。这些模型的“成长”需要海量的计算资源进行“训练”,而在这个过程中,英伟达的GPU凭借其强大的并行计算能力,成为了无可争议的“硬通货”。无论是OpenAI还是其他AI实验室,都在争先恐后地囤积GPU,这场“训练军备竞赛”让英伟达赚得盆满钵满。
![]()
这时,决策者的关注点就从“谁的算力最强”微妙地转向了“谁的算力最划算”。训练追求极致性能,可以不计成本;但推理直接关系到商业模式的可持续性,必须精打细算。客户开始认真审视长期的推理账单,对成本、能耗和效率变得异常敏感。
正是这个关键的转折点,为GPU的统治地位带来了前所未有的挑战。曾经在训练阶段被视为“标配”的GPU,其高功耗和高成本的模式,在需要7x24小时不间断运行的推理场景下,开始显得有些“奢侈”。新的战场规则,正在呼唤新的武器。
![]()
![]()
就在这个节骨眼上,谷歌的TPU从幕后走到了台前。TPU并非横空出世的新事物,它早在多年前就在谷歌内部为搜索等业务服务。但直到谷歌将其与自家的大模型深度绑定,并大力推进云服务时,外界才真正看清它的战略价值。
TPU与GPU的设计哲学有根本不同。GPU是“多面手”,擅长处理各种复杂的并行计算任务,图形渲染、科学计算、AI训练都能胜任,这种通用性是其成功的基石。而TPU从诞生起就是个“专才”,它是专门为神经网络计算定制的专用芯片。这种高度定制化带来了显著优势:在运行特定的AI计算时,TPU的能效比更高,延迟更可控,总体拥有成本更具吸引力。
![]()
对于谷歌而言,TPU不仅仅是一颗芯片,更是一种重塑云计算成本结构的战略武器。它让谷歌云在提供大模型推理服务时,能构建起一条基于自研硬件的、更低的成本曲线,从而形成区别于其他依赖英伟达GPU的云服务商的独特护城河。
![]()
![]()
面对谷歌TPU在推理领域带来的理念颠覆和现实威胁,英伟达显然不可能坐视不理。但以英伟达的技术实力,为何不自己从头研发一套对标TPU的架构,而是选择与Groq合作,甚至引入其核心团队呢?这恰恰是本次事件最值得玩味的地方。
Groq这家公司本身就是一个“TPU思想”的外部实践者。其创始人Jonathan Ross曾是谷歌TPU项目的核心成员之一。Groq研发的芯片,走的也不是GPU的通用并行路线,而是强调极致的低延迟和确定性执行效率,其设计理念与TPU同宗同源。
![]()
对英伟达来说,从头自研一套全新的张量计算架构,不仅耗时漫长,而且面临巨大的技术和生态不确定性。而通过技术授权和吸纳核心人才,相当于直接“嫁接”了已经被验证过的、与TPU同源的架构思想和工程经验,这是一条能最快缩短与竞争对手差距的“捷径”。
英伟达付出的代价,买的不是Groq当前的收入,而是无比宝贵的“时间”。这是一次典型的以防御为目的的战略性反击,标志着英伟达正式承认,在推理时代,仅靠强化GPU一条腿走路可能不够了,它需要将TPU的“专才”基因融入自己的产品体系,以应对多元化的算力需求。
![]()
![]()
英伟达与Groq的这次联手,无疑是AI硬件竞赛进入新阶段的一个标志性事件。 但这并不意味着GPU会很快被取代,在训练和许多复杂计算场景中,它仍将扮演核心角色。未来的格局更可能走向融合与异构,系统会根据任务的不同,智能调度GPU、TPU类芯片乃至其他加速器,以实现整体效率的最优。
英伟达此举,正是为了提前布局这个混合时代,确保自己在新的游戏规则下继续保持主导权。
无论结果如何,竞争对行业总是好事,它最终会推动算力变得更强大、更普惠,而这正是整个AI技术向前发展的根本动力。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.