英伟达与亚马逊正联手推进新一代存储架构研发,通过创新技术实现 GPU 直接控制 SSD 等存储设备,跳过传统 CPU 调度环节,有望破解当前 AI 算力发展的核心瓶颈。英伟达计划在下一代 Vera Rubin AI 平台,率先导入 “GPU 发起直接存储访问”(GIDS)技术,开启算力架构全新变革。
![]()
AI生成
当前计算机沿用的冯・诺依曼架构,存在明显的数据传输短板。所有数据都需经过 CPU 中转、DRAM 缓存后,才能输送至 GPU,CPU 有限的线程处理能力,难以匹配 GPU 数万级并行算力,数据搬运效率低下,成为制约 AI 模型训练与推理速度提升的关键难题。
GIDS 技术的核心突破,便是打通 GPU 与存储设备的直接通路。该技术可让 GPU 直接向 SSD、高速闪存下发访问指令,全程绕开 CPU 与 DRAM,省去多层调度流程,大幅降低数据传输延迟,释放 GPU 算力潜力。
为适配这一全新架构,高带宽闪存(HBF)应运而生,有效弥补传统 HBM 容量不足的短板。延世大学宋基焕教授团队测试数据显示,6 颗 HBF 搭配 2 颗 HBM,可将 GPU 存储容量从 192GB 提升至 3120GB,扩容幅度超 16 倍。技术应用上,HBF 更适配 AI 推理场景下固定模型参数存储,高频训练场景依旧依赖 HBM 发挥性能优势。
目前该技术赛道已迎来多方巨头布局。英伟达主导 GIDS 技术标准制定,亚马逊优先在云端算力集群落地应用;微软、AMD 同步推进自研方案,三星发力 Z‑NAND 闪存抢占硬件市场。
业内人士表示,GPU 直连存储技术的落地,将重构 AI 算力底层架构,不仅能提升云端大模型运行效率,也将推动 AI 产业向更高性能、更低延迟方向迭代,成为未来算力竞争的重要突破口。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.