网易首页 > 网易号 > 正文 申请入驻

计算速度超越英伟达的Groq,凭什么这么惊奇?

0
分享至

今天国内AI科技圈、AI炒股圈,都被一则消息振奋了,“大模型最快推理芯片的一哥换人了,不再是英伟达了”。

海外公司Groq基于自研芯片推出的推理加速方案,速度比英伟达的GPU快了十倍,成本却降低为十分之一,一来一去,百倍提升。难怪大家会兴奋。

由于Groq不再采用HBM,而是利用SRAM来加速,于是资本市场也把SRAM当了宝贝,相关上市公司股价快速上涨。

那么,Groq凭什么这么惊奇呢?SRAM就这么好用?

我翻看了Groq发布的论文,凭着仅存一点点的计算机原理,大概理了一点思绪。

1、首先,Groq的产品设计场景,主要是“推理”阶段,而英伟达目前产品在大模型训练阶段更好用。因此,Groq的方案更突出“实时”。

2、其次,这还是一个“专用VS通用”的故事。

在AI领域,为什么GPU能打败CPU呢?因为CPU就像一位教授,懂得多、能写会算做事讲逻辑;而GPU呢,就像高中生,虽然懂得不多,但架不住人多、又能并行运行。如果只是解二元方程的话,那一百个高中生、同时计算,肯定比一个教授要高效得多。

于是,GPU在AI领域,利用并行计算的优势,大获全胜。

但是,GPU也还算个多面手。从下游客户就能看出来,游戏宅男们希望买到英伟达的显卡,数字货币的矿工们也希望买到英伟达显卡,搞气象科学的、搞AI的也都希望买到英伟达的显卡。多需求也必然会带来一些功能设计、计算资源的冗余浪费。

那么,再来一个专门、只用于机器学习的芯片,岂不是更加高效?

这就是谷歌TPU(Tensor Processing Unit)芯片的思路。Tensor来自于谷歌TensorFlow深度学习框架,突出了TPU为深度学习而生。

Groq的创始人就来自于谷歌,设计并实现了第一代TPU芯片的核心元件。他们团队根据TPU的经验进行了进一步优化,于是有了LPU(Language Processing Unit),专为AI计算提供高确定性的低延迟和高性能。

我看到他们这个介绍的时候,仿佛面前站着一排人在说:就是要让你牛逼,谁也拦不住。

3、核心问题是,为什么LPU会更高效呢?这里就涉及到指令调取等知识了。复杂的我不讲,主要也是已经不懂了。说些大致的原理。

A、计算有两个必不可少的步骤:读取数据+执行指令。

而LPU就是为机器学习设计的。所以,预先就把机器学习高频需要的指令,进行了定制,有一套适用于机器学习的指令集架构ISA。

知道客户要什么就准备什么,肯定比什么都准备要高效。

B、其次,把深度学习的数据操作流程,拆解为了更微小的操作,并通过不同的硬件排列,实现了功能交替。

主要功能硬件包括矩阵单元MXM、用于逐点运算的vector单元、用于数据重塑的SXM单元、以及存储器单元。而这里的存储用的是SRAM。

Groq将这个方式称之为“链条化(chaining)”。可以粗暴理解为,GPU还要解二元方程,LPU把二次方程进一步拆解,有人专门做合并、有人做计算。或者说,像福特汽车设计了流水线一样,效率大幅提升。

相比而言,英伟达的GPU采用的HBM技术,也是为了加快读取数据、处理数据的速度。但数据存在DRAM里,再调取到GPU里,就会产生时延。

C、LPU采用的SRAM,比英伟达采用的DRAM要快得多。

SRAM中文是静态随机存取存储器,DRAM就是动态存储器。SRAM是用触发器来存储信息,而且不需要对数据进行刷新,也可以同时送“行、列”地址。而DRAM是用电容存储数据,需要刷新来保持数据,不然数据会丢失。行、列地址也是分两次送的。

所以,结果就是,SRAM运行速度要显著快于DRAM。

为什么LPU采用SRAM,而英伟达采用DRAM呢?我的理解是,还得回到开头的那句话:场景不一样啊。

Groq面向未来AI大爆发后的“推理”阶段,用户是实时交互的,数据也是实时的,数据进、数据出的,采用高速存储合适。

而英伟达目前是应用于训练,训练必然有大量数据,且对实时要求没那么高。那用成本更低的DRAM也是合适的。

D、Groq强调,友商是通过“Hardware-defined硬件定义”的方法来实现大规模互联网络,而我们是靠“Software-defined软件定义”的思路,基于tensor streaming processing (TSP) 实现大规模互联。通过软件预先设计,可以使得硬件更高效、可控。

E、所以最终效果就是,Groq的芯片,相当于多个功能单元组成一个大的计算单元;而友商则是把小型计算单元,复制多次。

还是用造车举例子就是,LPU就是流水线工厂,100个员工分几组,每个组、每个人职能明确、配合娴熟;而友商是100个员工,每个人都擅长多个环节、都会造一辆车。福特流水线,已经证明了专业、细分、分工的有效性。

因此,LPU对于LLM大语言模型而言,非常适合。

4、LPU引起的热烈讨论,是不是也反映了一个趋势:简单、专用的,打败复杂、通用的。把一件事情做到极致,就已经完美了。

计算,越来越专业、垂直;但大模型,却又是在往通用、多模态发展。未来如何演绎,应该会非常精彩。希望中国玩家们不缺席、上舞台,也有机会站C位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中央批准!中国工程院院士,任985大学校长

中央批准!中国工程院院士,任985大学校长

TOP大学来了
2026-02-06 10:39:40
香港“最乖富二代”邓兆尊,27年不动本金,利息滚到17亿,太清醒

香港“最乖富二代”邓兆尊,27年不动本金,利息滚到17亿,太清醒

娱说瑜悦
2026-01-23 19:23:09
萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

萝莉岛,是进入核心圈层的投名状,你猜他们为什么都穿红皮鞋

月满大江流
2026-02-06 09:25:07
1946年,方虎山将3000日军俘虏投河喂鱼,为何回国后下落不明?

1946年,方虎山将3000日军俘虏投河喂鱼,为何回国后下落不明?

大运河时空
2026-02-06 11:50:03
固始老师新娘道歉!承认5大罪行,男方娶她花上百万,同学曝猛料

固始老师新娘道歉!承认5大罪行,男方娶她花上百万,同学曝猛料

不似少年游
2026-02-07 11:37:43
拒绝进口!华为昇腾中标大单

拒绝进口!华为昇腾中标大单

EETOP半导体社区
2026-02-07 11:19:56
猎德电鸡被拖走!广州,开始进村抓“鸡”了

猎德电鸡被拖走!广州,开始进村抓“鸡”了

广州楼市发布
2026-02-06 20:11:09
北大才女李天乐:赴美留学,入职顶尖药企,用金属铊毒杀清华丈夫

北大才女李天乐:赴美留学,入职顶尖药企,用金属铊毒杀清华丈夫

谈史论天地
2026-02-07 08:20:07
张靓颖,丝袜这么可爱呀

张靓颖,丝袜这么可爱呀

陈意小可爱
2026-02-04 12:51:16
官方:喀麦隆球员恩加德乌正式加盟重庆铜梁龙

官方:喀麦隆球员恩加德乌正式加盟重庆铜梁龙

体坛周报
2026-02-07 11:27:19
第一次和男友同住,我彻底懵了:原来男生私下这么“反差萌”!

第一次和男友同住,我彻底懵了:原来男生私下这么“反差萌”!

千秋历史
2026-02-06 21:27:29
勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

勇士送上大礼!湖人1日内5喜临门,詹姆斯的第五冠真的有戏了

小路看球
2026-02-06 18:49:35
库里全家福:37岁全明星首发,5960万年薪NBA第一,4个娃都像他

库里全家福:37岁全明星首发,5960万年薪NBA第一,4个娃都像他

大西体育
2026-02-07 11:03:01
具俊晔洗白失败!葛斯齐曝猛料,韩国综艺实锤 S家让大S背1年黑锅

具俊晔洗白失败!葛斯齐曝猛料,韩国综艺实锤 S家让大S背1年黑锅

TVB的四小花
2026-02-06 20:41:33
加拿大人彻底破防!超六成喊话:快把中国车卖给我

加拿大人彻底破防!超六成喊话:快把中国车卖给我

娱乐洞察点点
2026-02-07 06:09:15
前世界第一卡费尔尼科夫:为什么费德勒不是GOAT?

前世界第一卡费尔尼科夫:为什么费德勒不是GOAT?

网球之家
2026-02-07 12:43:46
2月6日俄乌最新:最后通牒

2月6日俄乌最新:最后通牒

西楼饮月
2026-02-06 16:28:37
近40岁的金刻羽,为何甘愿被浙江土豪围猎而非婚生女?

近40岁的金刻羽,为何甘愿被浙江土豪围猎而非婚生女?

波哥看楼市
2026-02-05 23:51:51
深夜,全线大涨!道指飙升850点创新高,半导体大爆发,英伟达狂飙7%!中概股、黄金集体拉升

深夜,全线大涨!道指飙升850点创新高,半导体大爆发,英伟达狂飙7%!中概股、黄金集体拉升

每日经济新闻
2026-02-07 01:07:04
吴佩慈悼念完大S发言惹争议,没给汪小菲一点体面,大小s真没说错

吴佩慈悼念完大S发言惹争议,没给汪小菲一点体面,大小s真没说错

乡野小珥
2026-02-07 04:14:37
2026-02-07 13:23:00
钛媒体APP incentive-icons
钛媒体APP
独立财经科技媒体
129312文章数 861748关注度
往期回顾 全部

科技要闻

小米千匹马力新车亮相!问界M6双动力齐报

头条要闻

牛弹琴:特朗普这次麻烦大了 美国人看得目瞪口呆

头条要闻

牛弹琴:特朗普这次麻烦大了 美国人看得目瞪口呆

体育要闻

中国体育代表团亮相米兰冬奥会开幕式

娱乐要闻

何超欣说和何猷君没竞争,实力遭质疑

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

AITO问界与Abu Dhabi Motors达成战略合作

态度原创

游戏
艺术
旅游
公开课
军事航空

索尼对《马拉松》信心十足:能否干翻《Arc Raiders》?

艺术要闻

江西省美协 | 2026年度作品展油画选刊

旅游要闻

灯影映水乡 枫泾古镇年味浓

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

重大转变 特朗普签令调整军售排序

无障碍浏览 进入关怀版