2月25日,DeepSeek发布开源周的第二款产品——DeepEP通信库。
据介绍,这是全球首个专为MoE(混合专家)模型打造的开源通信解决方案,能够显著提升大模型训练与推理效率。
DeepEP通信库的核心创新亮点有:
1、高效优化的All-to-All通信;
2、支持NVLink/RDMA的节点内/跨节点通信;
3、高吞吐量内核,提升训练与推理预填充性能;
4、低延迟内核,优化推理解码速度;
5、原生FP8调度支持;
6、灵活的GPU资源控制,支持计算与通信的重叠。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。
