![]()
本文由半导体产业纵横(ID:ICVIEWS)编译自eetimes
Groq在海湾合作委员会内外拥有主权AI交易,这是原因之一吗?
当圣诞前夕深夜传出英伟达近乎收购Groq的消息时,有两点变得显而易见。首先,公告发布的时间被特意安排在当天市场提前收盘之后,以便给市场时间在做出反应前理解发生了什么。其次,除了直接了解这笔交易的人之外,几乎没人搞得懂这到底是怎么回事。
在过去的两周里,社交媒体上出现了许多“业余分析师”,纷纷发表关于这家市场领导者、也是全球市值最高的公司为何要“变相收购”一家拥有完全不同硬件和软件架构的10年老牌芯片初创公司的推测。
其中一些“高论”纯属错误。最流行的说法把Groq拼成了“Grok”(差一点就对了!),使用了ChatGPT生成的关于SRAM和DRAM区别的“分析”,或者暗示这笔交易很大程度上是为了“人才收购”Groq的团队,特别是Groq首席执行官(前谷歌TPU架构师)Jonathan Ross。
如果情况真有那么清晰就好了。以下是我们已知情况的摘要以及我们自己的一些观点,必须承认的是,坦率地说,目前的问题仍然多于答案。
我们所知道的
两家公司的公告措辞都表示,英伟达获得了Groq技术的非独家许可,并聘用了Groq团队的关键成员。实际上,很明显Groq已被“掏空”;剩下的是一个维持GroqCloud基础设施运行的小团队,由Groq的首席财务官领导。
我们假设英伟达已经获得了Groq所有技术的许可(硬件IP、芯片和系统设计、包含其大部分核心机密的编译器堆栈,以及更上层的软件堆栈)。我们还假设Groq的硬件基础设施及其开发者社区已被保留在GroqCloud中。
最近当英伟达近乎收购网络芯片初创公司Enfabrica时,我们也看到了同样类型的交易,其动机似乎是为了避免监管审查或反垄断异议。我们假设GroqCloud的“空壳”不会试图将这部分技术许可给任何其他人,而且许可中“非独家”的措辞也是为了规避反垄断诉讼。英伟达在Arm收购案告吹时吃过大亏,肯定希望避免重蹈覆辙,尽管这次的情况截然不同。
在Enfabrica的案例中,传闻的交易金额是9亿美元;对于一家早期初创公司来说,这是一笔巨款,但在当今的环境下并非不合理。Groq是一家规模更大、更成熟的初创公司,但传闻中这笔“变相收购”的价格是惊人的200亿美元——是英伟达为Enfabrica支付价格的20倍以上。
这在数量级上有着本质区别。关于Enfabrica的主流说法表明,这笔交易至少部分是人才收购。由Rochan Sankar和Shrijeet Mukherjee领导的Enfabrica确实拥有一支由聪明人组成的顶尖团队。Groq首席执行官Jonathan Ross向来以只聘用最优秀的人才而自豪,为了做到这一点,他经常打破常规(甚至从行业外)招聘。但是,虽然Groq肯定也是一支由聪明人组成的团队,但200亿美元这个数字如果主要解释为对几百人的“人才收购”,这在逻辑上根本讲不通。
那么,Groq还有什么理由能吸引英伟达呢?
这不是转型
Groq由包括Ross在内的一群前谷歌TPU工程师于2016年创立。该公司构建并商业化了其第一代芯片,该芯片自2019年起上市。老读者都知道,在AI领域,六年基本上等于几个世纪。在推出第一代芯片后的这“几个世纪”里,Groq于2020年转向汽车领域(声称“不是转型”),并于2024年再次转向基础设施提供商(也声称“不是转型”),后来接受了大量风险投资以建立自己的基础设施,实际上变成了自己的超大规模云服务商(hyperscaler)。最后这一次转型促使许多人不再将Groq视为一家芯片公司,尤其是当消息传出Groq需要部署大约十个机架的芯片才能推理单个Llama-70B模型时。
尽管如此,Groq最近一直在与海湾合作委员会(GCC)国家的公司进行重大交易,在该地区部署其基础设施。它还在其他地区达成了主权AI交易,包括挪威。
硬件选项
英伟达会生产Groq芯片(无论是第一代还是第二代)吗?以下是我们掌握的线索。
据报道,英伟达首席执行官黄仁勋在给员工的一封电子邮件中直接提到了Groq的芯片。
“我们计划将Groq的低延迟处理器集成到英伟达AI工厂架构中,扩展该平台以服务于更广泛的AI推理和实时工作负载,”据报道他这样写道。
然而,黄仁勋在CES的媒体问答环节中证实,Groq的技术不会成为英伟达主要数据中心路线图的一部分。
“Groq非常、非常不同,我不指望那里有任何东西能取代我们在Vera Rubin和下一代产品上所做的工作,”黄仁勋说。“据我们所知,没有合理或好的方法能做得比Vera Rubin更好,这一点不会改变。然而,我们或许能够以某种方式加入他们的技术,让我们能够做一些增量式的、世界上尚未能做到的事情。”
注意他使用了“或许”这个词——听起来英伟达可能仍在规划如何处理Groq。很明显,Groq不会加入英伟达的主要数据中心路线图,但这项新技术将解决一些英伟达利用Vera Rubin尚未解决的用例;具体来说,就是实时用例。
以下是几种可能的结果。
一种可能性是,英伟达将制造并部署Groq基于SRAM的芯片,作为数据中心推理的独立产品。尽管黄仁勋提到了英伟达的AI工厂堆栈,但这似乎仍有点牵强,因为这意味着英伟达承认在某些情况下,GPU并不是解决方案。这意味着推翻英伟达多年来宣传的“GPU就是你所需要的一切”的说法,因为GPU的灵活性使其适合快速变化的工作负载。
当英伟达推出Rubin CPX——一款旨在与其他英伟达大型硬件配合进行解码的预填充专用GPU——时,它稍微削弱了自己的论点,因为这意味着承认对于某些工作负载,存在使用更专用硬件和/或灵活性较低的GPU的理由。承认Groq具有性能优势将是更糟糕的事情。
Groq显然拥有一个可用的软件堆栈,但它好到足以将Groq芯片作为产品部署吗?怀疑论者认为,这可能是像Groq和Cerebras这样的公司最初转向为一部分流行的基础模型提供token服务的部分原因。因此,我们假设要将Groq芯片作为英伟达的芯片级或系统级产品重新推出,需要大量的软件工作。
更现实的情况可能是将Groq芯粒(chiplet)与大型GPU芯粒放在一起,以处理工作负载的某些部分,但同样,软件将是一个症结所在。将Groq硬件集成到CUDA生态系统中并非易事。忘掉CUDA内核吧——Groq的架构根本不使用内核。
那么,Groq的硬件提供了什么英伟达所没有的东西呢?
答案不仅仅是SRAM。英伟达GPU也使用SRAM。许多类型的逻辑芯片,包括市场上的大多数AI ASIC,都使用SRAM。Groq不使用DRAM是因为它不能用。它确实没有DRAM接口,因为其芯片设计于2017年左右,当时的大型AI意味着2500万参数,而不是数千亿参数,所以当时不需要DRAM。它无法使用HBM(高带宽内存)或任何DRAM,这意味着Groq必须使用成排成排的芯片机架来适应当前中型模型的单个实例。
答案可能是单用户token延迟——即原始速度——但另一种基于SRAM的架构Cerebras速度更快。即使有这些好处,如上所述,将Groq架构集成到英伟达的数据中心硬件和软件路线图中的挑战似乎也是巨大的。
一个冷门的答案可能是确定性——这是Groq架构的一个有趣的副作用,它曾在2020年试图向汽车行业推广这一点。确定性对于需要功能安全的应用(包括机器人技术)具有重大意义(黄仁勋在上面的邮件中提到了“实时”应用)。之前的GTC主题演讲曾强调物理AI是英伟达的一个巨大潜在市场。同样,这意味着承认GPU并不擅长所有事情,但这种情况更容易想象,即使这需要英伟达调整其宣传口径,承认边缘计算是一个截然不同的用例。
最终,英伟达是一家拥有海量资源和自己的一流人才团队的大公司。如果它想制造一款完全基于SRAM的芯片,它可以做到;如果它想制造一种不是GPU的东西,它也可以做到,而且成本远低于200亿美元。它也可以以远低于200亿美元的价格“变相收购”像D-Matrix甚至SambaNova这样的公司(报告显示SambaNova被英特尔收购的意向书金额在10亿至20亿美元之间)。
商业因素
笔者怀疑,除了纯粹为了技术或架构而收购Groq之外,还有重大的商业因素在起作用。
Groq与财大气粗的海湾合作委员会(GCC)公司有着重要的合作伙伴关系,并且已经在该地区部署了大型集群。它还在海湾合作委员会内外拥有主权AI交易,这可能对英伟达看起来很有吸引力。话虽如此,Groq迄今为止最大的卖点之一是它不是英伟达——它是一个可行且廉价的主权AI基础设施第二供应源。这现在可能已经不复存在,未来的主权买家无论如何都将受制于英伟达的谈判策略和供应链限制。
英伟达最大的恐惧是其超大规模客户将设计和构建自己的芯片和系统,并达到这些内部芯片和系统足够好、以至于他们不需要在相同程度上依赖昂贵的英伟达GPU的地步。英伟达“变相收购”Groq的动机可能包括希望阻止其中一家超大规模客户收购Groq,无论是为了其硬件IP还是为了其已经部署的基础设施。像Groq这样规模和成熟度的硬件、软件及已部署资产,对于Meta、微软甚至OpenAI来说可能会产生重大影响,因为这些公司的内部硬件计划仍处于流片前阶段,或者迄今为止仅取得了有限的成功。
英伟达是否真的仍然相信GPU可以做任何事情?这笔200亿美元的交易是否意味着AI是一个泡沫,或者不是泡沫?这个数字对于该领域的其他初创公司和新进入者的估值意味着什么?Cerebras即将进行的IPO将会发生什么?GroqCloud将会发生什么?我们的问题仍然多于答案,并将在2026年密切关注。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.