网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源第四弹来了!梁文锋参与研发

0
分享至

2025.02.27

本文字数:1709,阅读时长大约3分钟

导读:通过这些分享可以清晰了解DeepSeek是如何最大限度利用GPU能力的。

作者 |第一财经 刘晓洁

2月27日,DeepSeek开源周(OpenSourceWeek)第四弹来了,DeepSeek在X上宣布这次开源的是三项优化并行策略,并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术,通过这些阐述可以清晰了解团队是如何精细地优化计算和通信,最大限度利用GPU能力的。

这三项优化并行策略其中包括DualPipe,这是一种用于V3/R1模型训练中计算与通信重叠的双向流水线并行算法,这种算法能够完全重叠前向和后向计算通信阶段,与传统方法相比减少了“流水线气泡”(设备在某些时刻的空闲等待)。在DualPipe的开发团队署名中,包括创始人梁文锋

优化并行策略第二项是EPLB(Expert Parallelism Load Balancer,专家并行负载均衡器),它针对V3/R1模型,解决MoE(混合专家)模型在分布式训练和推理中的负载不平衡问题。

当使用专家并行(EP)时,不同的专家被分配到不同的GPU。由于不同专家的负载可能会根据当前的工作负载而变化,因此保持不同GPU的负载平衡非常重要。DeepSeek曾在V3论文中提到,团队采用冗余专家策略来重复重载专家,他们创新地将重复的专家打包到GPU上,以确保不同GPU之间的负载平衡。

在第三部分,DeepSeek直接分享了来自训练和推理框架的性能分析数据,以帮助社区更好地了解通信计算重叠策略和低级实现细节。这些数据是用PyTorch Profiler采集的,下载后可以直接在Chrome或Edge浏览器中打开,进行可视化分析,DeepSeek还模拟了绝对平衡的MoE 路由策略用于性能分析。

DeepSeek这四天的发布都与Infra层的算法有关,分享团队最大限度利用GPU能力的技术细节。大模型生态社区OpenCSG(开放传神)创始人陈冉此前对第一财经举例表示,“相当于以前DeepSeek是直接给一辆车,告诉大家这辆车续航900公里,但是现在DeepSeek在深挖,用什么方式能够开到900公里。”DeepSeek的模型为什么能够实现较好的效果,对应有一些算法和相应的框架,而这些“脚手架”的开源有利于之后的生态搭建。

陈冉判断,DeepSeek的代码开源或许会影响一批做AI Infra层的从业者,“AI Infra层的人要找新的方向。”但他同时表示,这种开源是一把双刃剑,如果能将DeepSeek开源的内容用好可能也会得利,“用不好就被冲击”。

此前三日,DeepSeek陆续开源了让大模型在GPU上跑得更快的MLA解码核FlashMLA,用于MoE模型训练和推理的DeepEP通信库,以及可支持MoE的FP8 GEMM代码库DeepGEMM。

从GitHub上获得的星标来看,这些项目颇受欢迎,截至发稿,FlashMLA已在GitHub获得超过1万星标,DeepEP的星标已有6000,DeepGEMM目前超过3700,最新发布的DualPipe星标超过700。

就在昨日,DeepSeek还在海内外同时宣布了API错峰优惠,自2月26日起,北京时间每日00:30至08:30的夜间空闲时段,API调用价格大幅下调:DeepSeek-V3降至原价50%,DeepSeek-R1更低至25%。DeepSeek鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。

另外,也有消息称,DeepSeek正寻求巩固自身优势,尽早推出R2模型,消息提到DeepSeek原本计划在5月初发布R2模型,目前会加快这一速度。DeepSeek目前并未对此回应。

此前DeepSeek在R1论文中提到,R1 的性能将在下一个版本得到改善,因为相关的RL(强化学习)训练数据还很少。随着RL数据的增加,模型解决复杂推理任务的能力持续稳定提升,且会自然涌现出一些复杂行为能力。

业界认为,DeepSeek-R2的发布可能是AI行业的一个关键节点。

微信编辑| 生产队的驴(拉磨版)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
通用丰田等联名致函:敦促美国继续限制进口中国车

通用丰田等联名致函:敦促美国继续限制进口中国车

快科技
2026-03-24 11:18:08
离谱!火箭加时13-0遭逆转,杜兰特失误+关键罚球打铁,申京30分

离谱!火箭加时13-0遭逆转,杜兰特失误+关键罚球打铁,申京30分

老梁体育漫谈
2026-03-26 13:00:48
中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

每日经济新闻
2026-03-26 13:25:09
富人圈子里选儿媳铁律:美貌和文凭都是浮云,这3个品质缺一不可

富人圈子里选儿媳铁律:美貌和文凭都是浮云,这3个品质缺一不可

千秋文化
2026-02-15 20:12:48
德国人日常三餐曝光!6个习惯让人不去医院,国人看完沉默了?

德国人日常三餐曝光!6个习惯让人不去医院,国人看完沉默了?

路医生健康科普
2026-03-04 12:30:03
中年男人最大的悲哀是什么?网友:说到底就是自己能力差呗

中年男人最大的悲哀是什么?网友:说到底就是自己能力差呗

带你感受人间冷暖
2026-03-23 00:02:19
英国发癫:中国风力涡轮机危险,不能用

英国发癫:中国风力涡轮机危险,不能用

观察者网
2026-03-26 12:09:10
纪录收割机!细数詹姆斯20个难以企及的历史最佳纪录

纪录收割机!细数詹姆斯20个难以企及的历史最佳纪录

麦子的篮球故事
2026-03-26 13:40:14
Altman发感谢信,16000名被裁程序员集体破防

Altman发感谢信,16000名被裁程序员集体破防

Ping值焦虑
2026-03-25 17:02:40
以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

林子说事
2026-03-24 00:50:49
民政局离完婚,我拨通父亲电话:离婚了,父亲只说俩字:动手

民政局离完婚,我拨通父亲电话:离婚了,父亲只说俩字:动手

九哥哥车评
2026-03-26 09:04:16
1955年,韩先楚被列入中将名单,毛主席看后质问到:叫罗荣桓来

1955年,韩先楚被列入中将名单,毛主席看后质问到:叫罗荣桓来

思雨忆史录
2026-01-28 09:16:29
整容脸千万别祸害年代剧!《冬去春来》30岁章若楠和30岁林允对比

整容脸千万别祸害年代剧!《冬去春来》30岁章若楠和30岁林允对比

白面书誏
2026-03-25 00:55:20
赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

赚麻了!深圳32座“最吸金”商场曝光,网友:第二名封神了!

深圳买房计划
2026-03-25 22:26:10
高铁直达!比起昆明和大理,我更爱这个被严重低估的云南小城!

高铁直达!比起昆明和大理,我更爱这个被严重低估的云南小城!

匿旅
2026-03-25 23:05:23
最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

最近全网都在夸陈若琳长得好看,我真的想说:别光看脸啊

小光侃娱乐
2026-03-26 06:55:03
半裸coser玩大了?知名平台游戏频道突遭大清洗

半裸coser玩大了?知名平台游戏频道突遭大清洗

游民星空
2026-03-25 16:13:20
初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

初代丑男何润东的突然爆火,狠狠抽了内娱一巴掌

娱乐圈笔娱君
2026-03-24 16:08:36
内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

内塔尼亚胡:对恶绝不手软,才是对和平最大的负责

老马拉车莫少装
2026-03-22 23:24:28
随着萨拉赫宣布离开利物浦,英超历史最佳阵容出炉!C罗+亨利在列

随着萨拉赫宣布离开利物浦,英超历史最佳阵容出炉!C罗+亨利在列

球场没跑道
2026-03-25 11:55:38
2026-03-26 14:07:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248203文章数 621902关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
手机
数码
本地
公开课

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

手机要闻

三星One UI 9前瞻:小部件更方正、Now Bar动画更丝滑

数码要闻

Intel史上最先进!酷睿Ultra 300系列vPro平台发布

本地新闻

春日吃花第三站——广东

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版