网易首页 > 网易号 > 正文 申请入驻

英伟达200亿收购Groq,LPU解码超GPU但扩展效率不足

0
分享至

在人工智能分散化的世界中,英伟达既可以是朋友,也可以是敌人。

人工智能的应用正迎来转折点,其关注点从训练新模型转向服务现有模型。对于那些渴望从英伟达手中分一杯羹的人工智能初创公司来说,现在是千载难逢的机会。

与训练相比,推理的工作负载更加多样化,这为芯片初创公司开辟了新的市场空间。大规模批量推理所需的计算能力、内存和带宽组合与人工智能助手或代码代理截然不同。

因此,推理变得越来越多样化,其中某些方面可能更适合 GPU 和其他更专业的硬件。

英伟达去年12月斥资200亿美元收购Groq就是一个典型的例子。这家初创公司采用大量SRAM的芯片架构,这意味着只要数量足够,Groq的LPU就能比任何GPU更快地生成代币。由于其有限的计算能力和老化的芯片技术,它们的扩展效率并不高。

Nvidia通过将推理管道中计算密集型的预填充部分转移到其 GPU 来规避这个问题,同时将带宽受限的解码操作保留在其崭新的 LPU 上。

这种组合并非英伟达独有。GTC大会结束后一周,AWS也发布了自己的解耦计算平台,该平台使用其定制的Trainium加速器进行预填充,并使用Cerebras Systems的餐盘大小的晶圆级加速器进行解码。

就连英特尔也加入了这场狂欢,宣布了一项参考设计,该设计将使用 GPU(大概是他们在去年北半球秋季预告的那款)进行预填充,并使用 AI 芯片初创公司 SambaNova 的新型 RDU进行解码。

到目前为止,大多数人工智能芯片初创公司的成功都体现在解码方面。SRAM虽然容量不大,但速度极快。因此,只要芯片数量足够多,或者至少像Cerebras那样使用足够大的芯片,它们就非常适合加速解码操作,但芯片初创公司的应用范围并不局限于此。

本周,Lumai详细介绍了其光学推理加速器,该加速器使用光而不是电子来执行大多数机器学习工作负载核心的矩阵乘法运算,而功耗仅为纯数字架构的一小部分。

Lumai 预计其下一代 Iris Tetra 系统到 2029 年将在 10kW 的功率预算内实现 exaOPS 的 AI 性能。

从技术上讲,这些芯片采用混合电光架构,但推理过程中大部分计算是由芯片的光张量核心处理的。

该公司最初将这款芯片定位为GPU的独立替代方案,用于计算密集型推理工作负载,例如批量处理。从长远来看,该公司还计划将其光加速器用作预填充处理器。

该架构仍处于起步阶段,目前能够运行像 Llama 3.1 8B 或 70B 这样的数十亿参数模型,但它已经发展到足以让这家总部位于英国的初创公司向云新用户和超大规模用户开放其芯片进行评估的程度。

话虽如此,并非所有人工智能芯片初创公司都热衷于使用不同的芯片进行预填充和解码。本周早些时候,Tenstorrent发布了基于 RISC-V 的 Galaxy Blackhole 计算平台,该公司首席执行官 Jim Keller 对这种分散式推理方法并不感冒。

“业内每家公司都在联手打造加速器的加速器。CPU 运行代码,GPU 加速 CPU,TPU 加速 GPU,LPU 加速 TPU,以此类推。这导致了复杂的解决方案,而这些方案不太可能与 AI 模型和应用的变化兼容。在 Tenstorrent,我们认为更通用、更简单的方案会更有效。”他在一份声明中说道。

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
向导掐人中救醒高反昏迷女子反遭掌掴,有网友称其“装晕想免费下山”,女子否认:已报警;被打向导发声:她严重高反或因幻觉打人,已道歉

向导掐人中救醒高反昏迷女子反遭掌掴,有网友称其“装晕想免费下山”,女子否认:已报警;被打向导发声:她严重高反或因幻觉打人,已道歉

都市快报橙柿互动
2026-05-08 12:27:22
本田上市以来首次营业亏损,预计2025财年巨亏4000亿日元

本田上市以来首次营业亏损,预计2025财年巨亏4000亿日元

IT之家
2026-05-08 16:42:08
达利欧:未来5年美国将发生巨变,此后世界将面目全非,建议配置5%-15%黄金对冲乱局

达利欧:未来5年美国将发生巨变,此后世界将面目全非,建议配置5%-15%黄金对冲乱局

投资作业本Pro
2026-05-08 14:52:35
深圳又一小区贴出“吵”字,有业主受不了想卖房!网友:“忍忍吧,深圳哪儿没噪音呢?”

深圳又一小区贴出“吵”字,有业主受不了想卖房!网友:“忍忍吧,深圳哪儿没噪音呢?”

深圳买房计划
2026-05-08 21:32:45
任何一艘美航母上,都要带足大量女兵?她们在航母上有又何作用?

任何一艘美航母上,都要带足大量女兵?她们在航母上有又何作用?

跳跳历史
2026-05-09 04:01:41
一场4-0!让英超保级又生变数:热刺有2对手要争六,全输或降级

一场4-0!让英超保级又生变数:热刺有2对手要争六,全输或降级

体育知多少
2026-05-08 09:00:37
任敏连搭“顶流”6连扑:被强捧的“小花”们,会成为资本弃儿吗

任敏连搭“顶流”6连扑:被强捧的“小花”们,会成为资本弃儿吗

扒点半吃瓜
2026-05-08 07:00:12
章子怡也没想到,清空账号、划清界限的森林北,印证了她当初的话

章子怡也没想到,清空账号、划清界限的森林北,印证了她当初的话

阿凫爱吐槽
2026-05-08 21:55:56
A股突发!688496,将强制退市

A股突发!688496,将强制退市

中国基金报
2026-05-08 21:33:50
宁德市委组织部发布任前公示,6名干部拟任新职

宁德市委组织部发布任前公示,6名干部拟任新职

海峡网
2026-05-06 21:26:16
赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

赵祥松|14岁“神童”手搓涡喷发动机,一场漏洞百出的包装表演

祥松谈
2026-05-02 15:01:46
当伊朗亮出海底光缆底牌时,全世界才发现,中国藏了一手更绝的

当伊朗亮出海底光缆底牌时,全世界才发现,中国藏了一手更绝的

闻识
2026-05-06 21:50:14
要6选秀签+24岁DPOY!字母哥交易索要天价,雄鹿老板首谈字母未来

要6选秀签+24岁DPOY!字母哥交易索要天价,雄鹿老板首谈字母未来

你的篮球频道
2026-05-08 08:44:24
果然中华文明没有断代过!网友:其实很多方言和土语都是有典故的

果然中华文明没有断代过!网友:其实很多方言和土语都是有典故的

夜深爱杂谈
2026-05-08 10:49:58
宫导钦点扛旗人重回国家队!张曼曼中看不中用,1号位还得靠她?

宫导钦点扛旗人重回国家队!张曼曼中看不中用,1号位还得靠她?

弄月公子
2026-05-08 20:34:23
赵继伟真要走?空降新疆这步绝棋,简直是要让全联盟直接大结局!

赵继伟真要走?空降新疆这步绝棋,简直是要让全联盟直接大结局!

刘哥谈体育
2026-05-08 18:40:01
万万没想到!国际足联主动降价三次,央视咬死6200万绝不松口

万万没想到!国际足联主动降价三次,央视咬死6200万绝不松口

落雪听梅a
2026-05-08 20:13:20
张豆豆教会我们一个道理:女人太能吃苦,就有吃不完的苦

张豆豆教会我们一个道理:女人太能吃苦,就有吃不完的苦

八卦南风
2026-05-08 17:33:48
弗赖堡在对阵阿斯顿维拉的欧联杯决赛前遭遇重大打击

弗赖堡在对阵阿斯顿维拉的欧联杯决赛前遭遇重大打击

绿茵情报局
2026-05-08 19:20:55
肝喜欢的一种果子,立夏后要常吃,滋养肝肾,整个夏天肝舒服!

肝喜欢的一种果子,立夏后要常吃,滋养肝肾,整个夏天肝舒服!

江江食研社
2026-05-07 23:30:04
2026-05-09 06:44:49
像风走了八万里不问归期
像风走了八万里不问归期
像风走了八万里不问归期
561文章数 215关注度
往期回顾 全部

科技要闻

SK海力士平均奖金600万 工服成相亲神器

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

头条要闻

美公布首批UFO文件 视频公开:阿联酋现水母状物体

体育要闻

他把首胜让给队友,然后用一年时间还清账单

娱乐要闻

古天乐被曝隐婚生子,新娘竟是她

财经要闻

估值3000亿 DeepSeek寻求500亿元融资

汽车要闻

MG 4X实车亮相 将于5月11日开启盲订

态度原创

家居
亲子
时尚
教育
军事航空

家居要闻

流动的尺度 打破家的形式主义

亲子要闻

小锐锐会走路后笑得很开心

衣服其实没有必要买很贵,准备这三件基础款,百搭实用又不挑人

教育要闻

太乖的孩子在AI时代没有出头之日

军事要闻

伊朗:最高领袖穆杰塔巴全面掌控局势

无障碍浏览 进入关怀版