网易首页 > 网易号 > 正文 申请入驻

GPU英伟达发布LPU芯片:AI推理的「加速器」来了

0
分享至

当地时间 3 月 16 日,英伟达在加州举办了 GTC 2026 大会,发布了全新的 Vera Rubin 平台。虽然算力再破纪录的 Rubin GPU 依旧是全场焦点,但在雷科技看来,Vera Rubin 中的 LPU(Language Processing Unit,语言处理单元),同样值得大家的关注。



图片来源:NVIDIA

我们先简单回顾一下 LPU 的「前世今生」:

严格来说, LPU 这一概念并非英伟达自己的创意。2016 年,前谷歌 TPU(张量处理单元)团队的核心成员创立了 Groq,后者在 2020 年就推出了用于大语言模型的 LPU 芯片。2025 年 12 月,英伟达收购了 Groq 的核心技术和技术团队,并在 2026 年的 GTC 上正式发布了英伟达的 LPU 芯片,用于 AI 推理加速。

那么是什么,让英伟达决定斥 200 亿美元巨资买下 Groq 呢?这还得从 LPU 芯片的功能和定位说起。

业内首个专为「推理」设计的协处理器,强在哪?

在大多数人的认知里,AI 芯片功能都差不多,毕竟 GPU、NPU 甚至是 CPU 都能跑推理,英伟达的 GPU 长期以来也是这种「全能型」选手。但在Vera Rubin 平台,LPU 并不直接用于通用计算。

简单来说,LPU 是大模型的「推理加速器」,它要用 SRAM 极高的显存带宽,解决大模型在生成回复时慢的问题。



图片来源:NVIDIA

要知道在大模型的技术逻辑中,「AI 推理」的瓶颈往往不在于计算核心的算力上限,而在于显存带宽。以当前主流的 HBM(高带宽内存)方案为例,虽然 HBM 的带宽本身就比标准 DDR、GDDR 这些内存、显存要快,但其本质上是堆叠 DRAM,而 DRAM 的工作模式决定了其在读写延迟方面的短板。

相比之下,LPU 采用的是 SRAM 方案,从数据结构上绕开了 HBM 方案较高的延迟,让模型可以直接在缓存中进行推理。尽管 SRAM 在空间表现上不如 HBM,但对于 AI 推理这一应用场景,SRAM 的优势足以弥补其短板。

Agent 时代为什么英伟达急需 LPU

根据英伟达的介绍,基于 SRAM 方案的 LPU 每秒带宽高达 150 TB/s,能让 AI 之间通信的吞吐量从每秒 100 个 Token 提升到了 1500 个以上。这种源自数据传输底层的技术升级,就像给 AI 开了专门的「5G 网络」,让模型「直播」(边推理边输出)成为可能。

当然了,LPU 架构也有自己的短板。作为「空间换时间」的技术代表,SRAM 虽然读写速度极快、带宽极高,但其数据结构和成本决定了它不可能像 HBM 那样动不动就堆叠几百 GB 的容量。这也意味着 LPU 必须与 Rubin GPU 配合工作,无法独立运行大规模模型。



图片来源:NVIDIA

但从另一个角度想,LPU 的出现其实就像当年的 NPU 一样,利用异构单元「各取所长」,让大模型知道哪些任务交给 GPU 去算,哪些实时交互交给 LPU 去跑。在雷科技看来,这种算力分流的模式,才是 LPU 最有价值的地方,也是前几年英伟达愿意重金买下 Groq 的关键原因。

可能有人觉得奇怪,就全球市场来说,英伟达早已控制了「头部算力」,GTC 2026 上也发布了 Rubin GPU,那为什么不继续走「绝对算力」的路线,要用 LPU 进行加速分流呢?

在雷科技看来,这种算力结构的变化,其诞生也和 Agent 时代的 AI 交互模式有关。以往我们用 ChatGPT、Gemini 或千问等 AI 服务,本质上都是单线操作的「回合制 AI」;在 AI 给出结果之前,我们不需要、也不能做下一个操作。

但在 Agent 时代,AI 需要在多个应用间执行超长的任务链,而这种「AI 间通讯」对延迟有着极高的要求。如果用传统的 GPU 跑推理,Token 生成速度可能只有每秒几十个。

在一个需要跨越数十步决策的长任务链中,这种延迟会成倍增加。而 LPU 的加入,将部分推理前置,用低延迟换来了「连续响应」的能力。也正因如此,雷科技认为 LPU 的出现,必然会推动 AI 算力体系搭建的新一轮转型。

国产厂商如何突围

从性能表现来看,Vera Rubin 平台、LPU 等概念的出现,确实又一次奠定了英伟达在 AI 领域的领先地位。但对于国内 AI 巨头来说,在短时间内跟进 LPU 架构其实并不现实——LPU 核心的高速 SRAM 颗粒高度对封装技术有较高的要求,在芯片行业产量朝着英伟达倾斜的背景下,国产芯片企业想建立自己的 SRAM 推理生态,从成本的角度看并不简单。

但这并不代表国产厂商在推理端无路可走。以阿里平头哥在 2026 年初上线的真武 810E 为例,真武 810E 采用了阿里自研的并行计算架构和 ICN 片间互联技术,将片间互联带宽提升至 700BG/s。



图片来源:平头哥

百度的昆仑芯则从 XPU 架构上入手,将计算和通信并行处理,在上一组数据计算时就提前请求下一组数据。摩尔线程则选择了全功能 GPU 的路线,用一站式方案降低企业部署成本,提高 AI 服务器的综合性价比。

虽然在绝对吞吐量上,这些「曲线救国」的国产方案距离英伟达的 LPU 还有一定的差距,但凭借更好的 AI 用例适配,平头哥和昆仑芯在国内算力市场的影响力同样不容忽视。

从行业发展的角度看,英伟达 LPU 的面世,固然推动了 AI 架构优化的进程。但对于国产算力企业而言,凭借更低的网络延迟和更好的本地化,依旧有超车的机会。毕竟对 AI 这样典型的「黑箱用例」来说,用户其实并不关心 AI 背后的算力结构和运行逻辑。一个好用、易用、低成本的综合体验,才是国内 AI 市场真正看重的核心竞争力。

3月12日-3月15日,AWE(中国家电及消费电子博览会) 2026 盛大开幕!
海信、海尔、美的、TCL、创维、华为、追觅、石头、MOVA、雷鸟、韶音、小熊、九号等AI科技巨头,将在上海滩围绕“AI科技·慧享未来”主题,呈现AI与硬件特别是家电融合的新潮流。人人“养龙虾”,家电如何融入Agent能力?机器人到家,家电无人化走到了哪一阶段?全场景融合,“人车家”生态会碰撞出哪些火花?AI硬件大爆发,硬件厂商又整出了哪些花活儿?
在雷科技MCN总编辑罗超、核心主播“阿雷”领衔下,雷科技AWE报道团(10+人)奔赴上海展开现场报道,现已凯旋。欢迎在雷科技全平台获取相关内容。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

他活埋近5000红军,逃往国外安享晚年,如今国内竟还有人纪念他!

兴趣知识
2026-05-08 00:23:54
乌克兰的“机器狗”们已实战,单次俘虏多名俄士兵,摧毁俄军坦克

乌克兰的“机器狗”们已实战,单次俘虏多名俄士兵,摧毁俄军坦克

网易新闻出品
2026-05-09 11:37:34
我国目前仍有两个机场公安局实行垂直管理,其中一个设在高校内

我国目前仍有两个机场公安局实行垂直管理,其中一个设在高校内

小圣杂谈原创
2026-05-09 15:58:24
难以饶恕!榴莲仅退款女孩过分言论曝光:脸真大,不知羞耻的东西

难以饶恕!榴莲仅退款女孩过分言论曝光:脸真大,不知羞耻的东西

小徐讲八卦
2026-05-09 10:31:23
U17国足1-2日本 亚洲杯2连败濒临出局 万项助攻 赵松源破门难救主

U17国足1-2日本 亚洲杯2连败濒临出局 万项助攻 赵松源破门难救主

我爱英超
2026-05-10 01:59:23
粉碎质疑!哈登关键7分+制胜一防救赎 达成1000板+300断连创纪录

粉碎质疑!哈登关键7分+制胜一防救赎 达成1000板+300断连创纪录

醉卧浮生
2026-05-10 06:09:34
伦敦世乒赛今晚落幕!5月10日赛程公布:中日巅峰对决争夺2项冠军

伦敦世乒赛今晚落幕!5月10日赛程公布:中日巅峰对决争夺2项冠军

全言作品
2026-05-10 06:21:22
无缘16强!郑钦文被扣325分 世界排名跌至第53 错失法网种子席位

无缘16强!郑钦文被扣325分 世界排名跌至第53 错失法网种子席位

我爱英超
2026-05-10 00:26:51
我穿便装到妻子家过年,被厅长大舅哥使唤,警卫员送来文件他愣了

我穿便装到妻子家过年,被厅长大舅哥使唤,警卫员送来文件他愣了

千秋文化
2026-05-08 10:29:06
普京:伊朗战事让俄罗斯“处境复杂”

普京:伊朗战事让俄罗斯“处境复杂”

环球网资讯
2026-05-10 06:56:42
马斯克:每年休息两三天,试过睡不到6小时结果脑子很痛效率很低

马斯克:每年休息两三天,试过睡不到6小时结果脑子很痛效率很低

顶级大佬思维
2026-05-09 14:23:20
深圳6岁男童吃生菜包烤肉后,全身出现大片青斑、血肿

深圳6岁男童吃生菜包烤肉后,全身出现大片青斑、血肿

听心堂
2026-05-09 18:11:29
“我们绝不向朋友的船开火” 伊朗驻华大使表态

“我们绝不向朋友的船开火” 伊朗驻华大使表态

看看新闻Knews
2026-05-09 23:24:04
为啥我国有两个中央军委

为啥我国有两个中央军委

袁老师说历史
2026-05-10 08:18:05
伦敦世乒赛:日本男团3:0晋级决赛!张本智和3:1林昀儒,冲击冠军

伦敦世乒赛:日本男团3:0晋级决赛!张本智和3:1林昀儒,冲击冠军

国乒二三事
2026-05-10 01:42:56
37死51伤!浏阳烟花厂爆炸原因查明,公司实际控制人被扒,后续!

37死51伤!浏阳烟花厂爆炸原因查明,公司实际控制人被扒,后续!

眼光很亮
2026-05-10 05:50:27
全网疯传的“八段锦神话”破灭了,网友:太毒了……

全网疯传的“八段锦神话”破灭了,网友:太毒了……

人格志
2026-05-09 20:17:27
太心酸!国乒女团3-0横扫罗马尼亚,斯佐科斯赛后发言句句戳心!

太心酸!国乒女团3-0横扫罗马尼亚,斯佐科斯赛后发言句句戳心!

田先生篮球
2026-05-09 22:47:39
张皓嘉三分绝杀,谁注意赵睿?下意识不防,赛后开心祝贺其绝杀!

张皓嘉三分绝杀,谁注意赵睿?下意识不防,赛后开心祝贺其绝杀!

篮球资讯达人
2026-05-10 00:14:53
伊朗宣布:没收262处“叛国者”房产!霍梅尼之孙:最高领袖正全面掌握国家事务;美军称继续对伊海上封锁,英国将派遣舰艇参加护航行动

伊朗宣布:没收262处“叛国者”房产!霍梅尼之孙:最高领袖正全面掌握国家事务;美军称继续对伊海上封锁,英国将派遣舰艇参加护航行动

每日经济新闻
2026-05-10 00:12:09
2026-05-10 10:55:00
雷科技 incentive-icons
雷科技
专注AI硬科技
36852文章数 812087关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

媒体:高市要建日版"中情局" 不仅是为重启"军国主义"

头条要闻

媒体:高市要建日版"中情局" 不仅是为重启"军国主义"

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

消失已久的陈宝国,近况曝光惹人揪心

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

数码
手机
亲子
教育
军事航空

数码要闻

“分手”五年后,苹果又回头找Intel造芯片,图什么?

手机要闻

荣耀MagicOS五月更新来了,大揭秘后,细节都清晰了!

亲子要闻

母亲节,当我厚着脸皮,去找宝宝要惊喜

教育要闻

特级教师陈红梅:打造一间“具身交互”的读写教室

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版