网易首页 > 网易号 > 正文 申请入驻

TPU惹急黄仁勋,200亿美元拿下「TPU之父」核心团队、技术授权

0
分享至



编辑|张倩、+0

在被谷歌 TPU 挑战霸主地位后,英伟达终于急了?

今天,人工智能芯片初创公司 Groq 发布了一则重磅消息,他们已经与英伟达就 Groq 的推理技术达成了非排他性许可协议。



这个协议并不是说英伟达要把 Groq 买下来,而是挖走 Groq 的几员大将 —— 创始人兼 CEO Jonathan Ross、总裁 Sunny Madra 及多名核心工程师。要知道,Jonathan Ross 曾在谷歌主导 TPU 的开发。2016 年底,他从谷歌离职,并带走了当时 TPU 核心 10 人团队中的 7 位 。这批人带走了 TPU 最核心的技术理念和设计经验,在加州山景城共同创办了 AI 芯片公司 Groq。

这批人和他们的知识产权有多值钱?看看交易额就知道了。据 Groq 投资者、Disruptive Technology Advisers 的首席执行官 Alex Davis 透露,这笔交易价值约 200 亿美元,这比该初创公司 9 月份的估值还高出 131 亿美元。

交易过后,Groq 将继续作为独立公司运营,由首席财务官 Simon Edwards 接任 CEO,其 GroqCloud 云服务也将正常运行。

通过这种方式,英伟达可以在不直接购买的情况下获得初创企业的人才和技术,被称为 Reverse Acquihire(反向收购雇佣)。这种方式避免了与传统收购相关的反垄断审查。在过去三年中,微软、Meta 等科技巨头已经达成了多项此类交易,以推进其人工智能发展路线图。

Groq 最引人注目的是其自主研发的 LPU(语言处理单元)芯片。与英伟达主导的 GPU 不同,LPU 专为 AI 推理场景设计,号称运行大语言模型的速度可达 GPU 的 10 倍,能耗却只有十分之一。而这正是英伟达所需要的,因为 TPU 之所以能挑战英伟达的霸主地位,「能耗、延迟方面能打」是一个关键优势。

英伟达 CEO 黄仁勋在内部邮件中表示,计划将 Groq 的低延迟处理器整合到英伟达 AI 工厂架构中,以支持更广泛的 AI 推理和实时工作负载。

TPU 之父带队

Groq 用 LPU 闯出一片天

Groq 成立于 2016 年,其诞生源于对传统计算架构的深刻反思。创始人 Jonathan Ross 曾师从 Yann LeCun,后来在 Google 任职。他参与了谷歌 TPU 项目(当时为 20% 项目),负责设计和实现第一代 TPU 芯片的核心组件。TPU 的成功证明了专用架构在 AI 计算上的巨大潜力,也成为了 Groq 技术的起点。



Google 有一个著名的「20% 自由时间」文化,允许工程师用工作时间的 20% 去做自己感兴趣、但并非老板指派的「私活」或「创新项目」。

Ross 认为,传统的 CPU 和 GPU 架构为了兼顾图形渲染和通用计算,保留了复杂的缓存管理、分支预测及动态硬件调度。这些设计虽然提高了通用性,但导致了计算性能的不可预测性,并非 AI 推理的必要组件。基于此,Groq 确立了「软件定义的确定性」这一核心理念。

LPU(Language Processing Unit)摒弃了传统的硬件调度器,改由编译器在编译阶段精确计算每一步数据的流动和时序。这种设计消除了「缓存未命中」和「分支预测失败」的风险,核心计算单元 TSP(Tensor Streaming Processor)采用流式处理模式,确保数据如流水线般处理,没有任何闲置周期。





在存储方案上,Groq 未采用 Nvidia GPU 常用的高带宽内存(HBM),而是将静态随机存取存储器(SRAM)直接集成在芯片内部。这种设计使单芯片内存带宽高达 80TB/s,是传统 HBM 方案的 20 倍以上。尽管 SRAM 占地面积大导致单芯片容量极小(约 230MB),但其极高的带宽允许 LPU 在 Batch Size 为 1(即单次处理一个请求)的情况下依然保持计算单元满载,从而实现极低的延迟。

由于单芯片内存有限,运行 Llama 3 70B 这样的大模型通常需要数百张芯片级联。为此,Groq 研发了 RealScale 互联技术。该技术不依赖传统的网络交换机,而是通过直接线缆连接,并解决了「晶振漂移」导致的时钟不同步问题。在这一架构下,整个集群实现了全局时钟同步,数百张芯片宛如一枚巨大的虚拟芯片协同工作。

得益于上述设计,Groq 在处理大语言模型时展现出差异化的性能优势:在 Llama 系列模型的推理中,其响应速度可达每秒 500 Tokens(相比之下 ChatGPT 约为 40 Tokens/s),且几乎没有延迟抖动,在实时交互场景中建立了独特的竞争壁垒。

但为了换取这种极致速度,Groq 方案在物理空间和功耗上付出了代价:一个标准机架满载功耗约为 26kW 至 30kW,且需要比 GPU 方案更多的机架数量来承载同等规模的模型参数。

TPU 步步紧逼

英伟达急了?

英伟达这次的大手笔属于形势所迫,因为他们的 AI 芯片霸主地位正面临严峻挑战。

目前,AI 算力市场的需求正从训练转向推理。预计到 2030 年,推理将占 AI 计算总量的 75%,市场规模达 2550 亿美元。但在推理方面,英伟达的芯片并不具备绝对优势,面临谷歌 TPU、Groq LPU 等多方面竞争。

先来说谷歌 TPU。此前,SemiAnalysis 的一篇文章报道称,谷歌新出的 TPU v7 实现了很高的实际模型算力利用率,总体拥有成本比英伟达 GB200 系统低约 30%~40%。也就是说,用上 TPU 之后,企业可以省一大笔钱。而且,谷歌的 TPU 不再局限于自家使用,而是开始大规模出货,预计 2027 年实现年产 500 万颗的目标。

市场的反应也能说明一切:2025 年 10 月,Anthropic 协议通过多达 100 万个 TPU 获取超过 10 亿瓦的谷歌算力;11 月,Meta 开始洽谈于 2027 年在其数据中心使用谷歌 TPU。这样的转向足以给英伟达带来压力。

除了谷歌,Groq 也是不容小觑的竞争对手。早期 Groq 保持相对低调。但随着 2023 年至 2024 年生成式 AI 市场的爆发,行业重心从训练端向推理端延伸,Groq 凭借在模型推理上的速度优势受到关注,资本市场随即跟进。

最引人注目的是,今年 2 月,Groq 与沙特阿美数字公司签订 15 亿美元协议,合作建设全球最大 AI 推理数据中心,初期部署 19000 个 LPU 处理器。2025 年 12 月,Groq 又签署协议加入美国 AI「创世纪计划」,成为 24 家签署公司之一。

今年 9 月,Groq 刚刚完成 7.5 亿美元融资,估值达到 69 亿美元。公司透露,其平台已服务超过 200 万名开发者,较去年的 35.6 万人增长了五倍多。

这些重要事件彰显了 Groq 在 AI 芯片领域的潜力以及团队的硬核研发能力,足以让英伟达动心。

在这场交易之后,英伟达的霸主地位是否可以巩固?我们拭目以待。

https://groq.com/blog/the-groq-lpu-explained

https://news.ycombinator.com/item?id=39431989

https://groq.com/blog/the-groq-lpu-explained

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

终于知道广东人为啥不抑郁了!网友:西医叫抑郁,中医叫郁结

另子维爱读史
2026-03-25 22:34:08
很多中字头工程局都发不出工资了!

很多中字头工程局都发不出工资了!

黯泉
2026-03-25 21:14:53
中国外长判断出现和平曙光,中东大战终于进入尾声?

中国外长判断出现和平曙光,中东大战终于进入尾声?

小嵩
2026-03-26 18:19:20
王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

王毅判断没错,短短三天中方见识了:比利时的虚伪、西班牙的真诚

快看张同学
2026-03-26 10:19:39
张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

张雪峰心源性猝死多严重,那个最快护士就有多“牛逼”(张雪峰的惯用词)

天山箴言录
2026-03-26 16:45:50
20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

柴狗夫斯基
2026-03-26 11:44:33
即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

即将沦为“穷人房”的5种房子,不好住不好卖,聪明人已逐渐转手

猫叔东山再起
2026-03-26 09:10:08
伊朗导弹砸向美国航母:伊朗打出了开战以来最强一拳

伊朗导弹砸向美国航母:伊朗打出了开战以来最强一拳

阿芒娱乐说
2026-03-26 12:37:49
四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

四天619次进攻、6090人伤亡:俄春季攻势为何高伤亡低战果?

高博新视野
2026-03-25 08:00:28
爆涨50倍比黄金还猛!二手手机成 “香饽饽”,3部破手机能换一台iPhone...

爆涨50倍比黄金还猛!二手手机成 “香饽饽”,3部破手机能换一台iPhone...

极果酷玩
2026-03-26 16:58:41
张雪峰经典语录:句句都是人间清醒

张雪峰经典语录:句句都是人间清醒

山东教育
2026-03-26 08:07:56
加图索:有些球员几乎站都站不稳但是没回家,而是留在了这里

加图索:有些球员几乎站都站不稳但是没回家,而是留在了这里

懂球帝
2026-03-26 04:09:06
以色列没水没药没人管,导弹炸完基地瘫痪,世界集体装瞎

以色列没水没药没人管,导弹炸完基地瘫痪,世界集体装瞎

网络易不易
2026-03-26 15:05:07
NBA董事会官宣批准:扩军仅限赌城西雅图 每队预计出70-100亿美元

NBA董事会官宣批准:扩军仅限赌城西雅图 每队预计出70-100亿美元

醉卧浮生
2026-03-25 23:03:44
心眼坏的人,最爱问这3件事,别傻乎乎全说!

心眼坏的人,最爱问这3件事,别傻乎乎全说!

唯晨说
2026-03-25 13:12:14
出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

霹雳炮
2026-03-14 22:49:47
问界M6预售24小时订单突破6万,26.98万起剑指Model Y

问界M6预售24小时订单突破6万,26.98万起剑指Model Y

泡泡网
2026-03-24 17:26:07
凌晨4点 22亿对决!时隔10年巴西再战法国:熊皇vs姆巴佩

凌晨4点 22亿对决!时隔10年巴西再战法国:熊皇vs姆巴佩

叶青足球世界
2026-03-26 10:18:34
连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

连蔡依林都在玩,“雪山救狐狸”到底是什么梗?对话视频原创作者:最初只是为了卖酱板鸭,特意设置反转剧情,没想到会这么火

极目新闻
2026-03-25 19:37:57
巨亏36.8亿!中国光刻机突围,没想到最先顶不住的竟是日本?

巨亏36.8亿!中国光刻机突围,没想到最先顶不住的竟是日本?

百科密码
2026-03-26 14:50:58
2026-03-26 19:40:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12606文章数 142594关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
教育
游戏
健康
军事航空

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

教育要闻

2026人工智能时代下的教育课堂变革

《迷你金属2》4月开启开发版测试 军事题材战略模拟

转头就晕的耳石症,能开车上班吗?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版