网易首页 > 网易号 > 正文 申请入驻

清华+华为+字节联合发布存内计算芯片,重塑推荐系统能效边界

0
分享至

电子发烧友网报道(文 / 吴子鹏)作为全球集成电路设计领域的顶级盛会,ISSCC 自 1953 年创办以来,一直是世界最前沿固态电路技术的首发阵地,被誉为 “芯片设计国际奥林匹克会议”。ISSCC 2026 上,清华大学、华为与字节跳动联合团队在会上发布论文《HYDAR: A Hybrid In-Memory Computing Framework for Efficient Recommendation System Acceleration》(HYDAR:面向高效推荐系统加速的混合存内计算框架),首次提出基于 28nm 工艺的混合存内计算(Compute-in-Memory, CiM)芯片,为 AI 推荐系统(RecSys)的能效瓶颈带来革命性突破。

这款芯片的核心突破在于,通过创新架构设计,将推荐系统核心运算的效率和能效提升 1–2 个数量级(QPS 提升 66 倍,QPS/W 提升 181 倍),为打破困扰行业多年的 “存储墙” 提供了全新路径。




痛点攻坚:推荐系统硬件困局亟待破局

在数字经济时代,推荐系统已成为连接用户与内容、产品的核心枢纽。无论是短视频分发、电商推荐还是智能搜索,背后都依赖海量用户行为数据的实时分析与精准匹配,而这一过程的核心运算单元是相似向量检索(SVS)—— 通过计算查询向量与大规模向量库之间的距离,检索出 Top-K 最邻近向量,进而实现个性化推荐。

然而,SVS 运算长期面临 “高耗低效” 的行业痛点。据联合团队论文披露,传统基于 CPU 或 GPU 的架构中,数据需要在处理器和内存之间频繁搬运,SVS 占据了推荐系统绝大部分的计算时间与功耗。核心症结在于外部存储器访问(EMA)的高昂开销:采用混合键合技术的 DRAM 加速器成本居高不下,难以大规模普及;基于 NAND TCAM 的加速器则存在读取延迟高、数据与距离表示精度有限等问题,无法满足实时推荐需求。

SVS 的现有困境,为新型计算架构的诞生留下了空间。

HYDAR 框架:三大创新协同破局

HYDAR 芯片的创新之处,在于采用基于电阻式随机存储器(RRAM)的混合模数存内计算架构。与传统计算架构 “数据存储与计算分离” 不同,基于 RRAM 的存内计算(Compute-in-RRAM, CiR)将计算单元与存储单元深度融合,能最大限度减少数据移动,具备存储密度高、并行度极大的优势,被公认为深度学习加速极具前景的技术路线。

不过,在此之前将 CiR 应用于 SVS 仍面临多重挑战:随着向量库规模扩大,能耗与延迟会急剧增加,同时会降低处理单元(PE)利用率与吞吐量,还可能导致检索精度下降。如何解决这些矛盾,成为全球芯片设计领域的研究热点。

针对上述痛点,清华、华为、字节跳动联合团队提出的 HYDAR 框架,通过 “硬件架构 + 数据流调度 + 检索策略” 三维协同优化,成功实现了 CiR 技术在推荐系统加速器中的高效应用。基于该框架,团队采用 28nm 工艺流片实现了一款 CiR 原型芯片,包含 36M RRAM 单元,分为 16 个并行 PE,每个 PE 包含一个 288×4096 阵列。

根据论文,HYDAR 芯片集成三大核心技术以应对实际应用挑战:

动态延迟模数转换器(DL-ADC):实现非 Top-K 计算的早期终止。在向量检索过程中,芯片能提前将计算出的距离与阈值比较,直接跳过不可能成为最优结果的向量,大幅降低不必要的计算延迟与功耗。

基于预测的预取调度流水线(PPSP)数据流:针对推荐系统中常见的非规则、动态变化的工作负载,该技术能智能预测数据访问模式、优化调度,显著提升系统吞吐量。

由粗到精(Coarse-to-Fine)检索架构:该设计在保证系统召回精度的前提下,实现检索任务的高效分层处理,使得系统能够轻松扩展至百万甚至更大规模的向量库,满足商业级推荐系统需求。



据联合团队在 ISSCC 2026 上披露的实测数据,这款基于 HYDAR 框架的 28nm CiR 芯片表现亮眼:单芯片可实现 390K QPS 的吞吐率与 1574K QPS/W 的能效比,其构建的多芯片系统可支撑百万级实时端到端推荐系统。在实际推荐系统任务中,当芯片扩展至 576M 规模的多芯片系统时,QPS 较传统方案提升 66 倍,QPS/W 提升 181 倍,而检索准确率与 CPU 方案相当,实现 “高效、节能、精准” 三重目标。

HYDAR 芯片的成功验证,不仅为推荐系统这一特定场景带来革命性的能效提升,其混合模数存内计算的设计思路更具普适意义。随着大模型向端侧部署、边缘计算需求爆发,对高能效、低延迟 AI 计算硬件的需求日益迫切。HYDAR 芯片能够以极低功耗,支撑电商、内容平台等所需的百万级实时端到端推荐系统,有望将相关数据中心的算力成本降低一个数量级。

未来展望:从存内计算到存内智能

此次清华、华为、字节跳动的联合突破,不仅为推荐系统硬件加速提供全新路径,更对我国集成电路产业与 AI 生态发展具有深远意义。从技术层面看,该成果填补了存内计算技术在推荐系统专用加速器领域的空白,验证了 28nm 工艺下 CiR 技术的商业化可行性 ——28nm 工艺兼具性能与成本优势,相较于先进制程更易实现规模化量产,为后续技术落地奠定基础。

对于产业而言,HYDAR 框架的成功,为存内计算技术在特定应用领域的深化应用指明方向。未来发展趋势可能包括:

·技术路径分化与融合:存内计算领域存在基于 SRAM 的极速能效路径与基于新兴存储(RRAM)的大容量端侧路径。HYDAR 代表了后者,未来两条路径可能在不同应用场景中各自发展,也可能出现融合架构。

·从存内计算到存内智能:随着技术成熟,计算可能不再是 “存内计算”,而是 “存内智能”—— 存储器不仅是计算单元,更是智能决策单元。HYDAR 中的预测调度、自适应阈值等技术,已经展现出这种 “存内智能” 的雏形。

·生态系统构建:技术突破需要配套的软件栈、开发工具和标准支持。未来可能出现针对存内计算架构优化的编程模型、算法库和开发框架,降低开发者使用门槛。

·新材料新器件探索:RRAM 作为新型存储器件,其非线性等特性曾是应用障碍,HYDAR 通过补偿算法等克服了这些挑战。未来可能出现更适合存内计算的新材料新器件,进一步提升性能。

多位行业专家分析认为,随着存内计算技术不断成熟,其有望成为下一代 AI 硬件的核心架构之一。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
内贾德死亡真相

内贾德死亡真相

哲空空
2026-03-02 07:50:14
美军560人含6名CIA高官伤亡,伊朗如何发动攻击

美军560人含6名CIA高官伤亡,伊朗如何发动攻击

风雨与阳光
2026-03-03 02:50:10
社死:日本19岁少年偷了阳台上的性感丁字裤,被捕后警方告知丁字裤主人是男的……

社死:日本19岁少年偷了阳台上的性感丁字裤,被捕后警方告知丁字裤主人是男的……

日本物语
2026-03-02 20:35:15
美以伊最新发声

美以伊最新发声

看看新闻Knews
2026-03-02 16:59:09
凌晨2点浦东机场!4个女孩差点飞泰国,再晚2分钟怕是救不回来了

凌晨2点浦东机场!4个女孩差点飞泰国,再晚2分钟怕是救不回来了

生活魔术专家
2026-03-02 16:22:28
面对霍尔姆茨海峡的封锁,中国准备好了吗?

面对霍尔姆茨海峡的封锁,中国准备好了吗?

胜研集
2026-03-02 12:20:33
突发,美国国防部出手了!

突发,美国国防部出手了!

君临财富
2026-03-02 11:40:17
迪拜国际机场遭到袭击,导致航班停飞大量旅客滞留,浙江游客称,他加入了一个近300人的游客滞留群

迪拜国际机场遭到袭击,导致航班停飞大量旅客滞留,浙江游客称,他加入了一个近300人的游客滞留群

观威海
2026-03-02 09:43:04
参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

参宿四爆炸后,地球夜空会亮如白昼,至少半年不用开灯了

观察宇宙
2026-03-02 19:09:35
“看到新家,整个人都懵了!”上海小伙动迁分房“不喜反忧”,相关部门回应→

“看到新家,整个人都懵了!”上海小伙动迁分房“不喜反忧”,相关部门回应→

新民晚报
2026-03-02 18:59:35
河南洛阳一女子过年离家,智能马桶17天耗水超200吨,当事人:马桶昼夜不停自动工作

河南洛阳一女子过年离家,智能马桶17天耗水超200吨,当事人:马桶昼夜不停自动工作

黄河新闻网吕梁
2026-02-28 14:27:42
40万周薪引爆争议!31岁队长7球13助,1亿欧报价逼曼联两难

40万周薪引爆争议!31岁队长7球13助,1亿欧报价逼曼联两难

卿子书
2026-03-02 09:47:30
47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

47岁保姆坦言:可以做有偿陪伴保姆,但必须要遵守3个约定

孢木情感
2026-02-22 11:24:44
永远不要向任何人,包括你的亲戚和好友,透露你真实的财务状况

永远不要向任何人,包括你的亲戚和好友,透露你真实的财务状况

流苏晚晴
2026-02-27 18:09:29
以军称投下超2500枚炸弹 摧毁约600个伊朗目标

以军称投下超2500枚炸弹 摧毁约600个伊朗目标

财联社
2026-03-02 21:18:08
绕道阿曼!迪拜机场关闭后,滞留游客曲线回国:转机3次,耗时四五十个小时

绕道阿曼!迪拜机场关闭后,滞留游客曲线回国:转机3次,耗时四五十个小时

每日经济新闻
2026-03-02 18:10:27
美国为什么突然打伊朗?一篇文讲清楚

美国为什么突然打伊朗?一篇文讲清楚

李月亮
2026-03-02 20:46:25
2026元宵遇罕见红月!老祖宗传下4大禁忌,别不当回事!

2026元宵遇罕见红月!老祖宗传下4大禁忌,别不当回事!

老特有话说
2026-02-27 16:55:35
一个美国人在网上发帖:为什么中国人觉得美国才是他们的家呢

一个美国人在网上发帖:为什么中国人觉得美国才是他们的家呢

贱议你读史
2026-02-23 00:35:40
AVN 2026获奖名单, 粉丝才是真评委

AVN 2026获奖名单, 粉丝才是真评委

吃瓜党二号头目
2026-03-02 11:17:42
2026-03-03 04:51:00
粤语音乐喷泉
粤语音乐喷泉
来听音乐吧
172文章数 11445关注度
往期回顾 全部

科技要闻

苹果中国官网上线iPhone 17e,4499元起

头条要闻

特朗普:对伊朗打击或持续4至5周 已击沉其10艘舰艇

头条要闻

特朗普:对伊朗打击或持续4至5周 已击沉其10艘舰艇

体育要闻

“想要我签名吗” 梅西逆转后嘲讽对手主帅

娱乐要闻

李亚鹏与哥哥和解 只有一条真心话短信

财经要闻

油价飙升 美伊冲突将如何搅动全球经济

汽车要闻

国民SUV再添一员 瑞虎7L静态体验

态度原创

家居
房产
亲子
健康
军事航空

家居要闻

万物互联 享科技福祉

房产要闻

方案突然曝光!海口北师大附校,又有书包大盘杀出!

亲子要闻

开学了!珠海香洲:筑牢安全防线,保障托育机构顺利开园复托

转头就晕的耳石症,能开车上班吗?

军事要闻

美国中央司令部透露对伊朗动武全部武器装备清单

无障碍浏览 进入关怀版