![]()
——这是一场以“金钱换时间”的防御性清场,标志着 AI 计算范式从“暴力并行的训练时代”向“极致延迟的推理时代”彻底转型的里程碑。
1. 引言:为何英伟达不计代价锁定 LPU?
2025年末,英伟达(NVIDIA)以约 200 亿美元的对价(现金+股权激励)与 AI 推理初创公司 Groq 达成深度技术许可协议,并以“Acqui-hire(收购式招聘)”模式收编了其超过 80% 的核心工程团队。这笔交易的价格高出 Groq 此前估值的近 3 倍。
深层逻辑探究:
英伟达为何急于“吞噬”一个曾经的挑战者?答案不在于算力(TOPS),而在于“确定性(Determinism)”。
战略防御:Groq 的 LPU(语言处理单元)是目前唯一在物理架构上能对 GPU 推理形成“代差”威胁的技术。英伟达必须封锁任何让 AMD、谷歌或亚马逊通过收购此类架构实现“推理侧弯道超车”的可能性。
范式补完: 传统的 GPU 擅长“吞吐量(Throughput)”,即一次性处理多少数据;而未来的 Agentic AI(智能体)要求的是“延迟(Latency)”,即 AI 反应有多快。收编 Groq,意味着英伟达完成了从“算力重工厂”向“实时神经中枢”的属性进化。
大模型推理中出现的“打字机式”卡顿,本质上是由于传统 GPU 架构在处理逐个 Token 生成时遇到了“内存墙(Memory Wall)”。
2.1 SRAM vs. HBM:物理维度的降维打击
英伟达Blackwell 架构依赖 HBM(高带宽内存),数据需在片外显存与计算核心间往返。而Groq LPU 采用的是 SRAM(静态随机存取存储器) 片上集成。
维度
NVIDIA GPU (HBM3e)
Groq LPU (集成 SRAM)
对推理的影响
内存带宽
~3.5 TB/s
~80 TB/s
消除数据搬运等待,实现“秒回”
调度方式
硬件动态调度(非确定性)
软件编译器调度(确定性)
消除延迟抖动,提供极速稳定的 Token 流
首 Token 延迟
~500ms+
<200ms (感知极限以下)
让 AI 对话不再有“非人类”的停顿感
2.2 “确定性计算”的魔力
核心追问:为什么 GPU 的延迟会有“抖动”? 传统 GPU 内部存在复杂的硬件调度器和分支预测,数据流向像随机的交通流量。而 LPU 通过编译器在编译阶段就精确规划了每一比特数据在芯片内每一纳秒的位置。 结论: 这种“时态指令集(TISC)”让计算过程透明化。整合该技术后,英伟达能在未来的 Rubin 架构 中引入“GPU(存权重)+ LPU(处理流)”的混合设计,彻底抹平 AI 的“思考感”。3. 战略版图:从数据中心到边缘侧的“毫秒级霸权”
英伟达此举并非孤立的补强,而是其2025-2026 战略蓝图(智能体、实时 AI、主权 AI)的核心支撑。
3.1 具身智能的“反射弧”革命
对于搭载 Jetson Thor 平台的机器人(物理 AI)而言,延迟是“生死线”。
应用场景: 机器人的避障、抓取和语音交互需要亚毫秒级的确定性反馈。
整合效益: 通过 LPU 技术,英伟达赋予了机器人接近生物本能的反应速度,使其能实时理解复杂物理环境并做出决策,而非等待云端返回。
在全球贸易不确定性下,HBM 与 CoWoS 封装是极其脆弱的瓶颈。
解耦意图: Groq 的 SRAM 架构不依赖顶尖的 HBM 产能,甚至可在更成熟的工艺节点上实现极高性能。
主权赋能: 英伟达借此可向对供应链敏感的国家提供“不依赖核心存储进口”的高性能推理卡,从而加速全球“主权 AI 工厂”的建设。
英伟达进入“确定性计算”赛道,是对竞争格局的一次重新洗牌。
4.1 对竞争对手的冲击
AMD MI300/400: AMD 试图通过拼 HBM 容量来对抗英伟达,但英伟达通过 LPU 直接跳出了 HBM 竞赛,开辟了“确定性延迟”的新维度。
云厂商自研芯片(TPU/Inferentia): 云厂商原本通过低成本 ASIC 寻找生存空间,但英伟达现在不仅拥有生态(CUDA),还拥有了比自研芯片更快的推理内核。
具身智能: 毫秒级闭环控制成为标配。
实时金融: 在高频交易中,利用深度学习模型进行“确定的”微秒级策略推演。
智能体工业化: 赋能能够独立思考、反思并瞬间执行的多步推理智能体。
通过这笔 200 亿美元的交易,英伟达完成了其商业版图的最后一次大拼图。
专家观点: 英伟达不再仅仅是提供算力的“重工业基地”,而是正在进化为定义“实时交互标准”的全球神经中枢。
当计算不再有抖动,当 AI 的响应速度超越人类神经传导,英伟达便确立了其在未来十年“实时 AI 霸权”的绝对统治地位。这场交易宣告了 AI 芯片竞争的终局:上半场比拼谁能算得准,下半场比拼谁能回得快。而英伟达,已经同时掌握了这两张底牌。
*本文依据网络搜集数据整理,由AI工具辅助完成
All rights reserved. Copyright © 2025
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.