网易首页 > 网易号 > 正文 申请入驻

DeepSeek公开致谢腾讯:对DeepEP的优化是开源通信框架性能显著提升,最高达100%

0
分享至

DeepSeek 公开致谢腾讯:腾讯优化让 DeepEP 开源通信框架性能显著提升近日,DeepSeek 公开对腾讯技术团队表达诚挚感谢,腾讯对 DeepSeek 开源的 DeepEP 通信框架进行深度优化,促使其在多样网络环境下性能实现大幅跃升,为企业开展 AI 大模型训练工作提供了更具效率的解决思路。

DeepEP 作为全球首个专为 MoE(混合专家)模型设计的开源通信库,于今年 2 月由 DeepSeek 在开源活动中重磅推出,开源地址为 https://github.com/deepseek-ai/DeepEP 。其主要应用于芯片间通信,在 AI 大模型训练进程里扮演关键角色。它具备实现全对全(all - to - all)通信、原生 FP8 调度支持、灵活 GPU 资源控制等特性,可提供高吞吐量与低延迟的全对全 GPU 内核,即 MoE 调度和组合功能。在 AI 领域,混合专家模型(MoE)通过多个专业化 “专家” 子模型处理不同任务,专家并行(EP)技术能让多个专家并行处理任务不同部分,合理分配工作负载,DeepEP 在其中保障 “专家” 间数据快速、有效地流通。

自 DeepEP 开源以来,尽管其凭借创新设计,在初始版本便达成 300% 的通信效率提升,且有效缓解了 MoE 架构模型对特定通信库的依赖,然而,在成本更为亲民、应用范围更为广泛的 RoCE(融合以太网远程直接内存访问)网络环境中,其性能表现不尽人意,这一状况引发开源社区的持续探讨。

腾讯星脉网络团队在 DeepEP 开源后迅速投身技术研究,精准锁定两大关键性能瓶颈。其一,双端口网卡带宽未能得到充分利用;其二,CPU 控制面交互环节存在较高时延问题。腾讯技术团队针对这些问题展开深入攻坚,实施了一系列卓有成效的优化举措。在 RoCE 网络优化层面,借助拓扑感知的多 QP 建链技术,智能调配数据流,极大提升双端口网卡带宽利用率;基于 IBGDA 技术优化,促使 “控制面” 场景操作绕过 CPU “中转”;创造性引入 “QP 内时序锁” 机制,保障多个 GPU 间数据传输顺序精准无误。

经此番优化,DeepEP 性能提升成果显著。在 RoCE 网络环境下,性能实现翻倍增长,提升幅度高达 100%;反哺至 IB(InfiniBand)网络时,原有通信效率再度提升 30%。DeepSeek 的人工智能基础设施工程师赵成刚在 GitHub 仓库发布说明,盛赞腾讯网络平台部门提供的技术方案,让 DeepEP 实现了 “巨大提速”。

目前,该优化技术已全面开源,并且在腾讯混元大模型等项目的训练推理环节成功落地应用。在腾讯星脉与 H20 服务器构建的高性能环境里,这套优化方案展现出良好的通用性与稳定性 。腾讯方面表示,该技术方案源于其在数据中心开发、优化以及图形处理单元之间通信领域积累的丰富经验,此前这些技术成果已应用于腾讯混元 AI 模型训练,如今开源供 DeepSeek 等外部用户使用,在强化 DeepEP 项目稳健性的同时,有力 “提升了通信性能”。

此次腾讯助力 DeepSeek 优化 DeepEP 通信框架,体现了国内科技企业在人工智能领域积极投身开源合作的热忱态度,更表明技术共享、协同优化能够切实推动行业进步,为 AI 大模型训练效率提升开辟新路径。接下来有望见证更多此类合作成果,助力中国人工智能产业朝着更高峰迈进。

◆ ◆ ◆ ◆ ◆

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
30号午评:DeepSeek崩了12小时,所有人都注意,大盘后市或这样走

30号午评:DeepSeek崩了12小时,所有人都注意,大盘后市或这样走

春江财富
2026-03-30 11:52:16
“高市与小泉向中国道歉”,日民众发出正义呼声,右翼绝不会低头

“高市与小泉向中国道歉”,日民众发出正义呼声,右翼绝不会低头

冒泡泡的鱼儿
2026-03-29 23:58:40
6月起,网约车司机超8小时高时长工作时代结束

6月起,网约车司机超8小时高时长工作时代结束

第一财经资讯
2026-03-30 19:50:14
5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

5分钟开通国家免费电视!不用机顶盒、不连网,永久免费

叮当当科技
2026-03-20 03:29:51
中东战火升级!伊朗采购36架歼-10,沙特花60亿抢货,老美急了?

中东战火升级!伊朗采购36架歼-10,沙特花60亿抢货,老美急了?

环球情报员
2026-03-31 00:01:08
伊朗用血泪换来的教训:若中美开战,中国必须首先锁定这一点

伊朗用血泪换来的教训:若中美开战,中国必须首先锁定这一点

共工之锚
2026-03-31 00:09:45
切忌熟人“借运”,风水师:熟人若带这3样东西上门,千万别要!

切忌熟人“借运”,风水师:熟人若带这3样东西上门,千万别要!

一根香烟的少女
2026-03-18 13:21:11
兵马俑中,有一张“脸”至今没法用科学解释,甚至被禁止出国展览

兵马俑中,有一张“脸”至今没法用科学解释,甚至被禁止出国展览

丞丞故事汇
2026-03-29 12:25:56
美军集结地遭袭击伤亡惨重!美媒:美国军力遭受二战后最严重削弱

美军集结地遭袭击伤亡惨重!美媒:美国军力遭受二战后最严重削弱

影孖看世界
2026-03-28 22:40:15
韩国军事专家:这个世界上没有任何一个国家敢动中国

韩国军事专家:这个世界上没有任何一个国家敢动中国

南权先生
2026-03-12 16:14:24
卫报:利物浦希望萨拉赫赶上踢曼城,伊萨克更可能对巴黎回归

卫报:利物浦希望萨拉赫赶上踢曼城,伊萨克更可能对巴黎回归

懂球帝
2026-03-31 01:13:25
2026,离职潮彻底消失了。

2026,离职潮彻底消失了。

老陆不老
2026-03-18 12:53:10
美股延续涨势,道指涨幅扩大至1%

美股延续涨势,道指涨幅扩大至1%

每日经济新闻
2026-03-30 21:42:15
单依纯深圳演唱会“盗唱”李荣浩的《李白》,孟子义意外火了

单依纯深圳演唱会“盗唱”李荣浩的《李白》,孟子义意外火了

九方鱼论
2026-03-30 06:43:27
港股多牛科技重挫近50%

港股多牛科技重挫近50%

每日经济新闻
2026-03-30 15:00:20
千亿市值巨头,涨停

千亿市值巨头,涨停

新浪财经
2026-03-30 17:08:14
警醒!中国该提防巴基斯坦了,他们的小孩,随口就说“秦腔穷”

警醒!中国该提防巴基斯坦了,他们的小孩,随口就说“秦腔穷”

原来仙女不讲理
2026-03-25 17:54:03
打击伊朗为何不需要太多美军呢?因为只需打垮12.5万革命卫队而已

打击伊朗为何不需要太多美军呢?因为只需打垮12.5万革命卫队而已

民间胡扯老哥
2026-03-30 05:05:52
重磅!我国台办正式宣布,郑丽文访问大陆行程确定,卢秀燕不装了

重磅!我国台办正式宣布,郑丽文访问大陆行程确定,卢秀燕不装了

奇思妙想生活家
2026-03-30 13:48:00
坏消息,掘金队在116-93战胜勇士队比赛中卡姆·约翰逊因伤离场

坏消息,掘金队在116-93战胜勇士队比赛中卡姆·约翰逊因伤离场

好火子
2026-03-31 00:16:52
2026-03-31 02:24:49
大白聊IT incentive-icons
大白聊IT
一个多年科技从业者分享点对科技的观察
1254文章数 300关注度
往期回顾 全部

科技要闻

一句谎言引发的硅谷血案

头条要闻

特朗普:对伊朗袭击以炼油厂的回应“很快到来”

头条要闻

特朗普:对伊朗袭击以炼油厂的回应“很快到来”

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

全红婵聊到体重哭了,每天只吃一顿饭

财经要闻

本轮地缘冲突,A股凭什么走出独立行情

汽车要闻

限时12.58万起 银河星耀8远航家系列上市

态度原创

健康
亲子
教育
家居
艺术

干细胞抗衰4大误区,90%的人都中招

亲子要闻

杰森抱着吉他给我们唱了几首,有个爱好生活挺丰富,听听唱的咋样

教育要闻

静待花开:一位母亲与青春期儿子的“破冰”之旅——林亭亭家教好故事

家居要闻

东方法式美学 现代简约

艺术要闻

这个62岁大爷厉害了!他画的超写实美女骗了多少人?.....

无障碍浏览 进入关怀版