网易首页 > 网易号 > 正文 申请入驻

深度丨Groq新品发布预测:推理是人工智能领域的下一个赛点

0
分享至

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发

前言

对于运用人工智能技术的厂商而言,推理成本日益成为一个亟待解决的问题。这是因为随着使用其产品的客户数量增多,运行相应模型的成本也随之攀升。

随着大模型在更多场景中的应用,推理将成为关键环节。

作者| 方文三

图片来源 |网 络

谷歌TPU创业公司Groq迎来推理业务机会

Groq是一家源于谷歌TPU团队的创业公司,其主要业务领域为云端推理市场。

2016年底,谷歌TPU核心团队的十个人中,有八人悄悄组队离职,合伙创办了新公司Groq。

主张[软件定义硬件]核心理念,采用单一核配置计算和存储单元,所有操作均预先通过软件设定。

2019年Groq发布了其芯片架构,声称具备1POS/s的算力。该架构名为Tensor Stream。

从硬件层面来看,其设计相对简洁,去除了所有非必需的控制逻辑,将所有控制交由软件编译器完成,从而优化芯片面积分配,实现更高的单位面积算力。

Groq革命性的TSP架构提供业界领先的性能和亚毫秒级延迟,为计算密集型应用程序提供高效的软件驱动解决方案。

公司成立后推出首款云端推理芯片GroqChip,支持16个芯片互连,配置230 MB SRAM,算力可达750 TOPS。

该公司已与亚马逊、谷歌等云服务提供商建立合作关系,将其芯片部署在云端,为客户提供高性能AI计算服务。

与使用英伟达GPU相比,Groq LPU集群将为LLM推理提供更高的吞吐量、更低的延迟和更低的成本。

此外,Groq LPU不依赖HBM3和CoWoS封装产能,避免产能瓶颈。

英伟达和AMD对GPU的高需求和相对低的供应量为Groq及其他矩阵数学引擎供应商提供了他们一直在等待的机会。

2021年4月,Groq宣布获得3亿美元融资,由Tiger Global Management和亿万富翁Dan Sundheim投资,资金将用于自动驾驶领域和数据库的发展。

公司成立后,推出了GroqChip,该芯片能连接16个芯片,配备230MB SRAM,性能高达750 TOPS。

Groq正积极扩大语言处理单元(LPUs)的生产,预计其性能将可替代AI推理领域的英伟达GPU。

该公司计划在未来两年内交付100万个LPUs,以缓解市场对GPU的高需求和供应短缺。

随着大型语言模型推理演示的推进,Groq受到市场热捧,已有40个机架的硬件计划分配完毕,未来十二个月内计划部署相当于OpenAI每秒令牌总数的硬件。

由于工艺缩小、架构增强以及芯片结构的进步,其尺寸将进一步扩大。

Groq正加速研发下一代GroqChip,预计2025年推出,采用三星4纳米工艺,将提高功耗效率,使任务在更小空间内完成。

厂商成本压力越大,Groq架构优势越明显

许多客户使用或微调已经被训练过的模型,而不是从头开始构建一个新模型。

高推理成本正对包括OpenAI在内的大模型及生成式AI公司们产生压力。

Groq芯片是一款通用深度学习推理芯片,适用于高性能、低延迟和计算密集型任务,堪称理想平台。

Groq突破传统观念,致力于研发批量仅为[1]的芯片,即一次性处理单个样本。

据Groq称,此种架构几乎可实现瞬时推理,而不牺牲性能,对时间敏感型应用如自动驾驶汽车至关重要。

2022年5月,Groq宣布其芯片实现每秒1万亿次运算速度。通过独特的单核架构,Groq重新定义计算技术,以推动人工智能和机器学习平台的发展。

这些平台在提供两倍推理性能的同时,大幅降低基础设施成本。

其高性能架构的愿景立足于三个关键技术创新领域:

①软件定义的硬件:Groq借鉴了软件优先的理念,将执行控制和数据流控制从硬件迁移至编译器。

②芯片创新:Groq的简化架构摒弃了无益于AI处理的冗余电路,从而实现更高效的芯片设计,性能每平方毫米均有提升。

③提升开发速度:Groq系统架构的简洁性消除了手工优化、配置文件以及传统硬件为中心设计方法所需的专业设备知识。

芯片制造的主战场将由[训练]转向[推理]

相较于AI训练,AI推理领域与消费电子等大规模应用终端的需求联系更为紧密,因此,业界发展重点有望从[训练]全面转向[推理]。

2020年,人工智能推理芯片市场份额已超过训练芯片,占比超过50%,这标志着随着算力的提升,人工智能正式步入认知时代。

在CES2024上,英特尔和AMD这两大PC端CPU芯片领导者,纷纷发布了集成AI推理模块的台式或笔记本电脑中央处理器新品。

专注于AI训练领域的英伟达也试图在AI PC市场中分得一杯羹,并在CES上推出了覆盖高画质游戏及AI应用软件的GPU新品GeForce RTX4080 SUPER。

随着2024年AI PC、AI智能手机等全新融合AI的消费电子产品的涌现,[AI+万物]的趋势已势不可挡。

在这一背景下,端侧AI大模型及AI软件大规模应用趋势将日益显现,广泛应用于PC、智能手机、智能手表等消费电子终端。

这也意味着AI推理的重要性日益凸显,成为高效运行端侧大模型及AI软件背后的核心技术。

随着消费类边缘设备在数据处理、存储和电池续航方面的显著提升,边缘AI这一细分领域将在2024年迎来更多的发展契机,AI行业的发展重心将从[训练]全面转向[推理]。

云端/终端推理芯片增长势头可预见

当前人工智能技术基于深度学习神经网络,首先需要大量数据进行训练,然后训练完成后,神经网络模型可根据输入数据进行推理计算。云端数据中心的训练和推理均需AI芯片加速。

然而,GPU的算力增长无法满足企业用户对神经网络算力的需求,且GPU的高功耗对云端数据中心构成挑战,因此云端数据中心一直期待新一代加速芯片的出现。

在大模型时代,AI推理芯片成为关键的应用承载载体。

传统算法开发与芯片难以满足新一代人工智能边缘计算场景的产品化需求,大模型的出现为行业提供了算法层面的解决途径。

然而,要在边缘计算场景中使大模型面向实战发挥作用,离不开AI大模型推理芯片的支持。

随着大规模地方性数据中心建设的逐步完成,云端训练芯片的增长速度逐渐放缓。

然而,随着各领域市场需求的释放,云端推理芯片及终端推理芯片市场增长速度呈现上升趋势。

下游推理端更贴近终端应用,侧重于响应时间而非吞吐量,需求更为细化。

自动驾驶领域对芯片算力要求极高,受限于时延和可靠性,相关计算无法在云端进行,因此终端推理芯片的升级至关重要。

据IDC研究发现,2020年我国数据中心用于推理的芯片市场份额已超过50%,预计到2025年,用于推理的工作负载芯片占比将提升至60.8%。

预计2023年推理芯片市场规模将达到110亿元,由于推理阶段所需算力与模型参数量、网站日访问量、每次访问问题长度及问题数量正相关。

结尾:

对于AI芯片而言,大模型带来了全新的计算泛式和计算要求。为在边缘端运行巨量参数的大模型,芯片需具备更强大的算力、内存带宽和内存容量。

同时,AI边缘推理芯片肩负着[落地应用最后一公里]的使命,这意味着它不仅要支持AI计算任务如大模型等,还需具备较强的通用算力。

部分资料参考:OneFlow:《Groq:从头设计一个张量流式处理器架构》,半导体行业观察:《推理芯片市场,Groq重磅宣布》,StarryHeavensAbove:《Groq,[软件定义硬件]概念的背后》,芯潮:《撬走谷歌TPU核心团队的4/5,这家AI芯片创企在酝酿什么大招?》,摩尔芯闻:《如何正确选择AI推理芯片?》,芯东西:《AI芯片创企Groq融资3亿美元,由谷歌TPU核心团队离职创立》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。

请务必注明:

「姓名 + 公司 + 合作需求」

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南房企老板谭小朋去世!年仅38岁,楼盘销冠,妻子悲痛发声

河南房企老板谭小朋去世!年仅38岁,楼盘销冠,妻子悲痛发声

小鋭有话说
2026-06-03 12:11:54
90岁父亲的哭诉:儿子的退休金有上万块,但我却希望他能早点走。

90岁父亲的哭诉:儿子的退休金有上万块,但我却希望他能早点走。

烙任情感
2026-06-02 14:49:44
中东,突传大消息!特朗普,最新发声!美伊谈判,新变数!

中东,突传大消息!特朗普,最新发声!美伊谈判,新变数!

证券时报e公司
2026-06-03 19:39:36
国足官宣三位王牌无缘踢新加坡,两位国脚直接退队,只有他在坚守

国足官宣三位王牌无缘踢新加坡,两位国脚直接退队,只有他在坚守

懂个球
2026-06-04 00:31:26
新闻联播刚刚报道了A股,背后发人深思!

新闻联播刚刚报道了A股,背后发人深思!

财经要参
2026-06-03 23:09:32
中方驱逐美记者后,美吊销新华社记者许可

中方驱逐美记者后,美吊销新华社记者许可

风雨与阳光
2026-06-03 13:17:23
斯科特·福斯特执法NBA总决赛第一场,令马刺和尼克斯球迷担忧

斯科特·福斯特执法NBA总决赛第一场,令马刺和尼克斯球迷担忧

好火子
2026-06-04 01:29:04
香港“演艺界教父”钟景辉今晨在睡梦中安详离世……他是周润发等巨星的恩师,曾参演《赌神3》《算死草》《使徒行者》

香港“演艺界教父”钟景辉今晨在睡梦中安详离世……他是周润发等巨星的恩师,曾参演《赌神3》《算死草》《使徒行者》

都市快报橙柿互动
2026-06-03 14:08:56
记者:莫德里奇倾向离开米兰,并回归皇马担任管理层

记者:莫德里奇倾向离开米兰,并回归皇马担任管理层

懂球帝
2026-06-03 21:58:16
太惨了!商场80%店关门,武汉一商场从开业爆火到8成空置,引热议

太惨了!商场80%店关门,武汉一商场从开业爆火到8成空置,引热议

火山詩话
2026-06-03 11:47:35
梅德韦杰夫向欧洲和乌克兰发出升级战争的威胁,包括核威胁

梅德韦杰夫向欧洲和乌克兰发出升级战争的威胁,包括核威胁

山河路口
2026-05-31 23:39:57
徐志胜女友曝光,长相漂亮学历高,见父母婚期将至,还是他的初恋

徐志胜女友曝光,长相漂亮学历高,见父母婚期将至,还是他的初恋

庭小娱
2026-06-01 15:20:06
瞒了整整三个月!伊朗终于官宣大事,局势已彻底尘埃落定?

瞒了整整三个月!伊朗终于官宣大事,局势已彻底尘埃落定?

一网打尽全球焦点
2026-06-03 02:53:45
120年无冠魔咒终结!格拉斯纳缔造三冠神迹,成队史最伟大主帅!

120年无冠魔咒终结!格拉斯纳缔造三冠神迹,成队史最伟大主帅!

田先生篮球
2026-05-28 09:11:46
疑打井纠纷,小学教师杀害33岁邻居,涉嫌故意伤害罪被立案,死者留下两未成年儿子;教体局:警方正侦办

疑打井纠纷,小学教师杀害33岁邻居,涉嫌故意伤害罪被立案,死者留下两未成年儿子;教体局:警方正侦办

大风新闻
2026-06-02 17:38:34
贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

贵州女子16岁被家人送到湖南嫁给大18岁男子,逃离后与他人生子被判重婚

封面新闻
2026-06-03 11:14:33
不要忙着打日本,中国应该去全国各地的武器仓库突击大检查

不要忙着打日本,中国应该去全国各地的武器仓库突击大检查

阿七说史
2026-05-21 15:45:10
比开塞露还管用!这3种“推屎”食物,每天吃一点,清空宿便

比开塞露还管用!这3种“推屎”食物,每天吃一点,清空宿便

白宸侃片
2026-05-19 11:56:50
全线失守!克里米亚制空权被乌军强势夺走了

全线失守!克里米亚制空权被乌军强势夺走了

知兵
2026-06-02 08:00:16
今年山茶油为啥卖不动?曾经的“油中黄金”,如今没人买单了?

今年山茶油为啥卖不动?曾经的“油中黄金”,如今没人买单了?

农夫也疯狂
2026-05-09 17:41:51
2026-06-04 02:03:00
AI芯天下 incentive-icons
AI芯天下
从芯出发,用心服务
6755文章数 169关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

旅游
手机
健康
数码
军事航空

旅游要闻

“一票跨两省”还游客完整壶口 | 新京报社论

手机要闻

华为Mate90系列重磅爆料:全新Deco设计登场,三大梯队排名曝光!

违规干细胞抗衰美容,为何肆无忌惮

数码要闻

影石Luna Ultra官宣首创头追模块:耳挂形态,号称“看哪拍哪”

军事要闻

媒体:美伊和谈以方却从中作梗 内塔尼亚胡有私人算计

无障碍浏览 进入关怀版