![]()
·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发
前言:
当AI大模型的参数规模迈向万亿级,上下文窗口突破百万token,HBM(高带宽内存)虽快,但容量有限且成本高昂;NAND闪存虽大,但带宽不足。在这个算力与存储的断层之间,一种名为HBF(高带宽闪存)的新型存储技术正从实验室走向产业前台。
作者| 方文三
图片来源 |网 络
![]()
从HBM到HBF的“升级”逻辑
HBF(High Bandwidth Flash,高带宽闪存)并非HBM的简单替代,而是以NAND堆叠之躯,实现接近HBM的带宽,试图在AI推理时代扮演“二级缓存”的战略角色。一场围绕HBF的技术竞赛,已在存储巨头之间悄然打响。其核心设计理念是:在GPU或AI加速器旁,部署一层容量远超HBM、带宽又远高于传统SSD的“中间层”存储。
![]()
从技术实现看,HBM堆叠的是DRAM,而HBF堆叠的是NAND闪存。第一代HBF产品预计将堆叠16层32GB NAND闪存,总容量可达512GB,带宽则有望超过1638GB/s(相当于PCIe 6.0×4的50倍)。在AI计算架构中,HBF扮演的是HBM的“容量扩展”角色。
AI推理时代的“内存墙”困局
HBF的诞生,直指当前AI计算体系中最棘手的矛盾——HBM的容量增长远跟不上模型参数的膨胀速度。在AI大模型的推理阶段,特别是长上下文、多轮对话、智能体调用等场景中,系统需要频繁读写键值缓存(KV cache)来维持上下文记忆。当上下文窗口达到百万token级别时,HBM很快被这些缓存数据占满,进而影响核心计算任务的效率。
![]()
传统解决方案是通过向量重计算或访问远端SSD来应对溢出数据,但这两种方式都会引入显著的延迟开销。HBF的介入,正是为了填补HBM与SSD之间的巨大空白。SK海力士提出的H3(HBM+HBF)混合存储架构,将HBF作为HBM的“二级扩展”,专门存储只读数据或键值缓存。经过模拟表明,以前需要32个GPU才能完成的工作负载,在HBF的辅助下仅需2个GPU即可完成。这意味着HBF不仅能突破容量瓶颈,更可能从根本上改变AI算力集群的经济模型。
![]()
技术特征:容量、带宽与成本的再平衡
HBF之所以被寄予厚望,源于其在容量、带宽和成本三个维度上实现了独特的再平衡。其中,容量优势最为突出。HBF的存储容量可达HBM的8至16倍。这意味着原本需要多个GPU分摊的模型参数和缓存数据,可以更集中地由单个GPU配合HBF处理,大幅降低系统复杂度和互连开销。
![]()
带宽表现上,HBF能够实现HBM约80%至90% 的传输速度。虽然仍有一定差距,但考虑到其容量优势,这一带宽水平已足以支撑绝大多数推理场景的数据供给需求。功耗方面与HBM相比,HBF的功耗可降低约40%。这对于功耗密度日益失控的AI集群而言,意义重大。
成本上,基于NAND闪存的HBF,其单位容量的成本远低于基于DRAM的HBM。广发证券分析认为,HBF有望将GPU的存储容量扩展至4TB,成为满足AI大模型内存容量要求的最佳方案。
![]()
当然,HBF也存在先天短板:由于NAND闪存的物理特性,其写入耐久性较差,访问延迟高于DRAM。因此,当前的主流设计思路是将HBF用于只读数据或低频写入的键值缓存,而将频繁读写的动态数据留在HBM中。
全球巨头入局竞争,韩系双雄领跑
面对HBF的战略价值,全球存储巨头已纷纷入局,其中韩国厂商占据领跑位置。SK海力士是当前HBF研发最为积极的厂商,计划最早于2026年推出HBF1样品,目标是在2027年实现量产。在战略路径上,SK海力士采取HBM中心策略,将HBF作为HBM的补充而非替代,通过两者的协同配置优化AI推理能效。
三星电子则展现出更宏大的野心,依托其在逻辑代工领域的优势,三星正在探索通过自家4nm工艺生产HBF控制逻辑,并优化下一代NAND方案的能效与控制性能。三星的目标是将HBF整合进更广泛的AI内存层级重构中,其与闪迪的合作正向2027年底至2028年初应用于英伟达、AMD、谷歌实际产品的目标迈进。
![]()
闪迪(SanDisk) 是HBF技术的最早倡导者之一,公司与韩国KAIST金正浩教授团队紧密合作,推动HBF的技术标准化。闪迪认为,HBF是解决GPU HBM内存墙问题的关键答案,但其成功需要行业标准的确立和英伟达等主流客户的采纳。
值得注意的是,三大厂商已就HBF标准化展开合作。继SK海力士之后,三星电子也加入了闪迪首创的HBF技术阵营,三方正共同推动HBF成为行业通用标准。
从“HBM附庸”到“AI内存新支柱”的未来展望
尽管前景广阔,HBF的产业化仍面临多重挑战。技术层面,HBF需要GPU制造商重新设计架构,开发者需要修改软件以优化软硬件协同,这些涉及大量半导体级别的复杂工作。
![]()
生态层面,英伟达的态度至关重要。目前,英伟达尚未对HBF表达公开兴趣,而是开发了ICMSP技术作为替代方案,使用DPU连接的NVMe SSD处理溢出数据。不过,随着SK海力士、三星等核心供应商持续推动,以及HBF在仿真测试中展现的惊人能效提升,英伟达的态度可能出现转变。
证券机构预测,HBF市场规模将从2027年的10亿美元增长至2030年的120亿美元。金正浩教授更预测,从2038年起,HBF的需求将超过HBM。在商业化时间表上,SK海力士有望在本月晚些时候展示HBF早期测试版本,而HBF的广泛应用预计将等到HBM6时代——届时单个基础裸片将集成多组存储堆栈。
结语
在推理成为AI算力新主战场的2026年,谁能率先构建HBM+HBF的混合存储体系,谁就可能在这场算力效率的终极竞赛中占得先机,开启 AI算力的下一个 黄金 十年 。
网络援引:
搜狐网:《SK海力士探索H3存储:发挥HBM、HBF各自优势,优化推理能效 》
中关村在线:《全球存储巨头加速AI驱动产能扩张,美光2000亿美元建最大洁净室》
IT之家:《消息称美光痛失英伟达HBM4 大单,韩系双雄 SK 海力士、三星瓜分市场》
本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。
请务必注明:
「姓名 + 公司 + 合作需求」
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.