网易首页 > 网易号 > 正文 申请入驻

芯片初创公司,攻破内存墙

0
分享至

公众号记得加星标⭐️,第一时间看推送不会错过。

来源 :内容 编译自 hpcwire 。

人工智能革命催生了对训练前沿模型的处理能力的巨大需求,而英伟达正用其高端 GPU 来满足这一需求。然而,2025 年人工智能突然转向推理和代理人工智能,暴露出内存管道方面的缺口,d-Matrix 希望通过其创新的 3D 堆叠数字内存计算 (3DIMC) 架构来解决这个问题,该架构已于上周在 Hot Chips 大会上进行了展示。

该公司由首席执行官 Sid Sheth 和首席技术官 Sudeep Bhoja 于 2019 年创立,两人均曾担任高速互连开发商 Inphi Corp 的高管,该公司于 2020 年被 Marvell 以 100 亿美元收购。其目标是开发内存计算芯片级技术,为 AI 推理带来比传统 DRAM 带宽更大的内存,且成本远低于高带宽内存(HBM)。

Sheth 在领英上发帖称:“我们相信,AI 推理的未来不仅取决于对计算的重新思考,也取决于对内存本身的重新思考。我们正在为新的内存计算范式 (3DIMC) 铺平道路,该范式使我们的 DIMC 平台能够持续扩展,突破内存瓶颈,同时又不牺牲内存容量和带宽。通过三维堆叠内存并将其与计算更紧密地集成,我们显著降低了延迟,提升了带宽,并实现了新的效率提升。”

d-Matrix 技术采用LPDDR5内存,并通过中介层将数字内存计算 (DIMC) 硬件连接到内存。DIMC 引擎使用经过改进的 SRAM 单元,并增强了用于执行乘法运算的晶体管,在内存阵列内部执行计算。它采用 chiplet 架构构建,并针对矩阵向量乘法(一种基于 Transformer 的模型中使用的运算)进行了优化。Apollo 计算核心包含八个 DIMC 单元,可并行执行 64×64 矩阵乘法,支持各种数值格式(例如 INT8、INT4 和块浮点)。


“我们预计 3DIMC 将使 AI 推理工作负载的内存带宽和容量提高几个数量级,并确保随着新模型和新应用的出现,服务提供商和企业能够高效且经济地大规模运行它们。”

我们的下一代架构 Raptor 将在其设计中融入 3DIMC——这得益于我们和客户在 Pavehawk 测试中积累的经验。通过垂直堆叠内存并与计算芯片紧密集成,Raptor 有望突破内存壁垒,实现全新的性能和总拥有成本 (TCO)。

我们的目标是在使用 3DIMC 而非 HBM4 运行 AI 推理工作负载时,实现 10 倍内存带宽和 10 倍能效提升。这些并非渐进式的提升,而是阶跃式的改进,重新定义了大规模推理的可能性。

甚至在2022 年底ChatGPT 的推出引发人工智能革命之前, d-Matrix的人们就已经发现了对更大、更快内存的需求,以满足大型语言模型 (LLM) 的需求。d-Matrix 首席执行官兼联合创始人 Sid Sheth 已经预测,由于OpenAI和谷歌的 LLM 项目前景光明,人工智能推理工作负载将激增,这些项目已经在人工智能领域及其他领域引起了关注。

“我们认为这将会持续很长一段时间,”Sheth在 2022 年 4 月接受BigDATAwire采访时谈到了大模型 (LLM) 的变革潜力。“我们认为,未来 5 到 10 年,人们基本上会倾向于使用 Transformer,而这将成为未来 5 到 10 年 AI 计算的主要工作。”

Sheth 不仅准确预测了 Transformer 模型的变革性影响,还预见到它最终将导致 AI 推理工作负载激增。这为 Sheth 和 d-Matrix 带来了商机。问题在于,基于 GPU 的高性能计算架构虽然能够很好地训练规模越来越大的 LLM 和前沿模型,但却并非运行 AI 推理工作负载的理想之选。事实上,d-Matrix 发现,这个问题一直延伸到 DRAM,它无法高效地以所需的高速传输数据来支持即将到来的 AI 推理工作负载。

d-Matrix 的解决方案是专注于内存层的创新。虽然 DRAM 无法满足 AI 推理的需求,但一种速度更快、价格更昂贵的内存——SRAM(静态随机存取存储器)——却能胜任这项任务。

d-Matrix 采用数字内存计算 (DMIC) 技术,将处理器直接融合到 SRAM 模块中。其 Nighthawk 架构利用直接嵌入 SRAM 卡的 DMIC 芯片,这些 SRAM 卡可直接插入 PCI 总线,而其 Jayhawk 架构则提供 die-to-die 功能,以实现横向扩展处理。这两种架构均已融入该公司的旗舰产品 Corsair,该产品目前采用最新的 PCIe Gen5 规格,并具有 150 TB/s 的超高内存带宽。

快进到2025年,Sheth的许多预测都已成真。我们正处于从AI训练到AI推理的重大转变之中,代理AI将在未来几年推动巨额投资。d-Matrix一直紧跟新兴AI工作负载的需求,并于本周宣布其采用三维堆叠DMIC技术(或3DMIC)的下一代Pavehawk架构目前正在实验室中运行。

Sheth 相信 3DMIC 将提供性能提升,帮助 AI 推理突破内存壁垒。

Sheth在 LinkedIn 的一篇博文中写道: “AI 推理的瓶颈在于内存,而不仅仅是 FLOP(浮点运算)。模型发展迅速,传统的 HBM 内存系统成本高昂、功耗高且带宽受限。3DIMC改变了游戏规则。通过三维堆叠内存并将其与计算更紧密地集成,我们显著降低了延迟,提高了带宽,并释放了新的效率提升。”

内存壁垒问题多年来一直存在,其根源在于内存和处理器技术进步的不匹配。d-Matrix 创始人兼首席技术官 Sudeep Bhoja 在本周的一篇博客文章中写道:“行业基准测试显示,计算性能每两年增长约 3 倍,而内存带宽却仅落后 1.6 倍。结果就是差距越来越大,昂贵的处理器只能闲置,等待数据到来。”

Bhoja写道,虽然3DMIC技术无法完全弥补与最新GPU的差距,但它有望缩小差距。随着Pavehawk的上市,该公司目前正在开发利用3DMIC的下一代内存处理架构,名为Raptor。

Bhoja写道:“Raptor……将把3DIMC融入其设计中——这将受益于我们和客户在Pavehawk测试中积累的经验。通过垂直堆叠内存并与计算芯片紧密集成,Raptor有望突破内存壁垒,并释放全新的性能和TCO水平。”

究竟好多少?据 Bhoja 称,d-Matrix 希望在使用 3DIMC 运行 AI 推理工作负载时,与 HBM4 相比,内存带宽和能效分别提高 10 倍和 10 倍。

Bhoja 写道:“这些并非渐进式的提升,而是阶跃式的改进,重新定义了大规模推理的可能性。” 通过将内存需求置于我们设计的核心——从 Corsair 到 Raptor 乃至更远的未来——我们确保推理速度更快、更经济,并且在大规模下更具可持续性。

https://www.hpcwire.com/2025/09/02/d-matrix-takes-on-ai-memory-wall-with-3d-stacked-in-memory-compute/

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4145期内容,欢迎关注。

加星标⭐️第一时间看推送,小号防走丢


求推荐

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大暴乱席卷法国,欧洲巨婴们傻眼了

大暴乱席卷法国,欧洲巨婴们傻眼了

一个坏土豆
2025-09-14 18:48:03
短短72小时内,以色列连炸6国,中方开始介入,战场转到联合国

短短72小时内,以色列连炸6国,中方开始介入,战场转到联合国

文雅笔墨
2025-09-14 01:52:35
突发!今天上午9时许,台媒惊呼:解放军大举出动,四面包围台岛

突发!今天上午9时许,台媒惊呼:解放军大举出动,四面包围台岛

大道无形我有型
2025-09-14 16:43:44
上海下周初还是热,周四开始要降温了

上海下周初还是热,周四开始要降温了

澎湃新闻
2025-09-14 18:22:27
普京:莫斯科经济规模在全球最大城市中排名第二

普京:莫斯科经济规模在全球最大城市中排名第二

俄罗斯卫星通讯社
2025-09-14 16:08:14
为给8岁患瘤儿子治病,妈妈剃光头直播跳舞赚医药费,“儿子今日凌晨去世,他不会再那么痛了”

为给8岁患瘤儿子治病,妈妈剃光头直播跳舞赚医药费,“儿子今日凌晨去世,他不会再那么痛了”

极目新闻
2025-09-14 16:51:49
《灼灼韶华》被观众强烈要求下架,理由很一致:挂羊头卖狗肉

《灼灼韶华》被观众强烈要求下架,理由很一致:挂羊头卖狗肉

古木之草记
2025-09-14 16:10:41
于东来惨了!被央媒表扬不到两天,却三次力挺西贝,口碑迅速崩盘

于东来惨了!被央媒表扬不到两天,却三次力挺西贝,口碑迅速崩盘

奇思妙想草叶君
2025-09-14 13:56:12
WTT澳门赛孙颖莎夺冠之路:连胜5位劲敌卫冕,5场比赛仅丢7局

WTT澳门赛孙颖莎夺冠之路:连胜5位劲敌卫冕,5场比赛仅丢7局

乒谈
2025-09-14 19:50:36
英国重磅消息:25w英镑一张永居卡,将大规模驱逐60w移民!

英国重磅消息:25w英镑一张永居卡,将大规模驱逐60w移民!

英国大学申请中心
2025-09-13 22:35:06
马德里会谈生变,中方或退出中美经贸谈判,美国等来四字冰冷质问

马德里会谈生变,中方或退出中美经贸谈判,美国等来四字冰冷质问

时尚的弄潮
2025-09-14 16:42:56
西贝事件再升级!袋装食品曝光,于东来下场,西贝后续操作惹争议

西贝事件再升级!袋装食品曝光,于东来下场,西贝后续操作惹争议

以茶带书
2025-09-13 14:36:58
突发!北约两架F16击落俄军机!泽连斯基:俄方正在扩大战争

突发!北约两架F16击落俄军机!泽连斯基:俄方正在扩大战争

影孖看世界
2025-09-14 12:39:34
央视曝光,六部门彻查新能源车黑嘴,排除四车企,雷军恐又要憔悴

央视曝光,六部门彻查新能源车黑嘴,排除四车企,雷军恐又要憔悴

奇思妙想草叶君
2025-09-13 23:36:38
“表情包女神”花泽香菜官宣离婚,结束与老公长达5年婚姻

“表情包女神”花泽香菜官宣离婚,结束与老公长达5年婚姻

扒虾侃娱
2025-09-14 19:02:37
梁晓声:中国富豪家庭92%将子女送往英美私校,既规避教育内卷...

梁晓声:中国富豪家庭92%将子女送往英美私校,既规避教育内卷...

清风拂心
2025-09-14 13:15:08
预制菜之王萨莉亚逆袭热搜,网友为何纷纷力挺?

预制菜之王萨莉亚逆袭热搜,网友为何纷纷力挺?

椰青美食分享
2025-09-14 13:08:03
李谷一不再沉默,揭晓宋祖英“消失”的真相,观众:原来是这样

李谷一不再沉默,揭晓宋祖英“消失”的真相,观众:原来是这样

查尔菲的笔记
2025-09-02 16:01:14
65张活久未见的照片,太神奇了!

65张活久未见的照片,太神奇了!

中国艺术家
2025-09-14 05:26:31
3-4惜败!痛失澳门站女单冠军,王曼昱赛后采访如此评价孙颖莎!

3-4惜败!痛失澳门站女单冠军,王曼昱赛后采访如此评价孙颖莎!

田先生篮球
2025-09-14 20:05:07
2025-09-14 22:35:00
半导体行业观察 incentive-icons
半导体行业观察
专注观察全球半导体行业资讯
11742文章数 34647关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

美政府突袭抓人后 韩企表示将延迟投产:缺人缺设备

头条要闻

美政府突袭抓人后 韩企表示将延迟投产:缺人缺设备

体育要闻

3次遭争议判罚!皇马向FIFA投诉西甲裁判

娱乐要闻

花泽香菜官宣离婚 结束与老公5年婚姻

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

家居
游戏
教育
旅游
军事航空

家居要闻

原木风格 温馨舒适氛围

IG告别季后赛,解说直言Rookie状态差!wei采访承认:打野差距大

教育要闻

三年级奥数,根据前面的排列规律,填上合适的数

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版