网易首页 > 网易号 > 正文 申请入驻

DeepSeek获封号——“源神”,这三天开源了什么?

0
分享至

源圣”马斯克入主白宫东厂以来,开源的激情少了很多。

好在江湖上又出现了新的“开源公子”梁文锋,DeepSeep在之前就预告了本周会搞一个“开源周”活动,将会开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。

今天“开源周”第三天才过去半天,DeepSeek就已经解锁了三项技术,这效率真是杠杠的。

那么DeepSeek这三天都开源了什么黑技术,是否怼得到黑子们的肺管子呢?

第一项:FlashMLA

这是为Hopper GPU 开发的高效MLA解码内核 ,针对可变长度序列进行了优化。

这话说得有点太技术了,我们白话解释一下。

大模型会把用户的提问进行传送、拆分、转义,这个过程会产生很多长短不一的语句,然后扔给大模型去分析和处理。当大量用户同时进行操作时,AI的处理效率就显得很重要了。

MLA技术是谷歌、OpenAi、Grok3等美国AI技术大厂都在玩的创新技术,而DeepSeek的FlashMLA则是将这种创新落地到硬件的具体实现,性能指标(3000GB/s和580TFLOPS)足以媲美业界顶尖方案(如 FlashAttention)。

Hopper是英伟达的GPU(图形处理芯片)架构,例如H100和H800,发布于2022年,主要用于AI计算。DeepSeek则专门给高性能显卡(包括英伟达的Hopper系列GPU)设计了这个“加速神器”,来提高AI处理任务的效率。

DeepSeek举一个例子:假如开了一家快递分拣站,每天要处理不同大小的包裹,传统方法是用固定大小的筐子装,小包裹浪费空间,大包裹又得分筐装,效率很低。而FlashMLA就像一套“智能分拣系统”,能自动根据包裹大小调整筐子尺寸,让所有包裹快速、整齐地装车,既省时间又省钱。

这就是的FlashMLA技术原理,它能让AI用更少的内存、更快的速度处理各种长短不一的句子

第二项:DeepEP

它是首个用于MoE(混合专家)模型训练和推理的开源EP(Expert Parallelism专家并行)通信库。

主要功能为:

高效优化的全对全(all-to-all)通信;
支持节点内(intranode)和节点间(internode)通信,兼容 NVLink 和 RDMA;
训练与推理预填充(prefilling)阶段的高吞吐率计算核;
推理解码(decoding)阶段的低延迟计算核;
原生支持 FP8 数据调度;
灵活的 GPU 资源控制,实现计算与通信的重叠处理。

字都认得,但是堆在一起却很费解。

性能可比肩OpenAI o1的DeepSeek-R1是基于DeepSeek-V3训练出来的模型,DeepSeek-V3此前就以不大规模使用最先进的英伟达GPU、低训练预算著称。说白了,就是DeepSeek不需要堆太多算力,达到高效训练的结果。

DeepEP包含有一组使用纯RDMA的低延迟内核,可以用于将延迟最小化,DeepEP还引入一种通信与计算重叠的方法,这种方法可以不占用SM(流处理器)资源。简而言之,DeepEP也是用于提升GPU利用效率的关键技术之一

第三项:DeepGEMM

今天发布的DeepGEMM是一个支持密集和MoE GEMM的FP8GEMM库,为DeepSeek的V3/R1训练和推理提供支持。

GEMM(General Matrix Multiplication,通用矩阵乘法)是线性代数中的基本运算,而FP8 GEMM则是一种使用8位浮点数进行矩阵乘法的计算操作。

DeepGEMM则同时支持传统的稠密模型和MoE(混合专家)模型的GEMM运算,这一代码为基于英伟达Hopper架构(如H100 GPU)的V3/R1系列硬件提供高效的训练和推理支持。

基于这一代码库,在英伟达Hopper架构的GPU上可实现1350+ FP8 TFLOPS(每秒浮点运算次数)的性能,充分利用算力。

燃!

该代码库设计非常简洁,只有一个核心内核函数,代码量约为300行,且在大多数矩阵规模上均优于专家调优的内核。

大模型生态社区OpenCSG(开放传神)创始人陈冉解读DeepGEMM的意义: “相当于以前DeepSeek是直接给一辆车,告诉大家这辆车续航900公里,但是现在DeepSeek在深挖,用什么方式能够开到900公里。”

DeepSeek连续三天开源的算法,在某种意义上属于“脚手架”。陈冉认为,既有模型标准,也有工具标准,也有生态基石。

DeepSeek接下来还有两个代码库会在本周发布,DeepSeek在公告中表示,“每分享一行代码,都会成为加速AI行业发展的集体动力。”

就冲这句话,DeepSeek就对得起“源神”这个封号,你说呢?

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人不是高达,拆了长不出来

人不是高达,拆了长不出来

平原公子
2026-01-23 19:27:46
金庸有部著作,主角一直打不过反派,结局还烂尾,却深受读者喜爱

金庸有部著作,主角一直打不过反派,结局还烂尾,却深受读者喜爱

金宝哥讲故事
2026-01-11 09:35:05
61岁大爷每天吃西洋参,坚持1年没间断,体检结果连医生都羡慕

61岁大爷每天吃西洋参,坚持1年没间断,体检结果连医生都羡慕

吃青菜长高
2026-02-14 08:26:54
日本的苦日子,还在后面

日本的苦日子,还在后面

六爷阿旦
2026-01-20 17:07:06
美主持人母亲失踪案发酵,特朗普公开警告:若当事人遇害,将寻求判处绑匪死刑

美主持人母亲失踪案发酵,特朗普公开警告:若当事人遇害,将寻求判处绑匪死刑

环球网资讯
2026-02-17 15:43:31
海来阿木:刘浩存的眼神有戏,她能够拉着我,让我投入,不走神

海来阿木:刘浩存的眼神有戏,她能够拉着我,让我投入,不走神

秀语千寻
2026-02-17 18:13:31
WOW!易建联公开露面!等了整整两年时间

WOW!易建联公开露面!等了整整两年时间

篮球实战宝典
2026-02-16 17:54:12
《生命树》要不是白芍放手!韩学超到死不知,白菊为他想好退路

《生命树》要不是白芍放手!韩学超到死不知,白菊为他想好退路

妙知
2026-02-17 19:50:13
韩媒:中国可能0金收官!已被哈萨克斯坦超越 谷爱凌还剩最后机会

韩媒:中国可能0金收官!已被哈萨克斯坦超越 谷爱凌还剩最后机会

念洲
2026-02-17 13:48:48
主动发声,詹姆斯重返骑士,开启退役巡演?哈登恐成最大输家!

主动发声,詹姆斯重返骑士,开启退役巡演?哈登恐成最大输家!

体育大朋说
2026-02-17 21:12:56
舒淇在香港深夜晒聚会照!周迅皮肤如婴儿,郑伊健夫妇发福严重!

舒淇在香港深夜晒聚会照!周迅皮肤如婴儿,郑伊健夫妇发福严重!

最美的开始
2026-02-17 05:16:24
刚刚!石油、黄金、白银,集体跳水!

刚刚!石油、黄金、白银,集体跳水!

中国基金报
2026-02-17 22:52:21
亚冠蓉城2:3惜败町田泽维亚,纵观全场,新帅完全不如徐正源!

亚冠蓉城2:3惜败町田泽维亚,纵观全场,新帅完全不如徐正源!

田先生篮球
2026-02-17 23:07:48
杨采钰晒除夕美照!婚后第一年在婆家过吃的好丰盛,老公出镜超帅

杨采钰晒除夕美照!婚后第一年在婆家过吃的好丰盛,老公出镜超帅

乐悠悠娱乐
2026-02-16 19:28:39
国民党内斗升级!韩国瑜变节?卢秀燕将访美,大陆先对日本下手

国民党内斗升级!韩国瑜变节?卢秀燕将访美,大陆先对日本下手

林子说事
2026-02-17 22:40:43
中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

中日开战可能性增大,但收场太难,若真动手,中方估计半步都不退

百态人间
2026-01-03 16:42:15
初一票房早报!《镖人》7200万,《惊蛰无声》1.3亿,但不重要!

初一票房早报!《镖人》7200万,《惊蛰无声》1.3亿,但不重要!

乐悠悠娱乐
2026-02-17 13:27:04
乒坛再爆冷门!黑马小将入选伦敦世乒赛,日本队名单已诞生4席

乒坛再爆冷门!黑马小将入选伦敦世乒赛,日本队名单已诞生4席

全言作品
2026-02-17 21:17:05
李亚鹏突然提到十年前最难时给黄晓明发短信,不到一分钟收到回复

李亚鹏突然提到十年前最难时给黄晓明发短信,不到一分钟收到回复

百态人间
2026-02-10 15:25:10
“洗浴中心”怎么突然没人了?4点原因让顾客不再敢去,你还去吗

“洗浴中心”怎么突然没人了?4点原因让顾客不再敢去,你还去吗

刘哥谈体育
2026-02-17 23:02:21
2026-02-18 00:47:00
熊孩子爱科技 incentive-icons
熊孩子爱科技
要让孩子从小了解各种知识!
913文章数 2878关注度
往期回顾 全部

科技要闻

春晚这些机器人是怎样做到的?

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

头条要闻

加州州长纽森炮轰特朗普:把美国未来卖给中国

体育要闻

谷爱凌:'不小心"拿到了银牌 祝大家马年大吉

娱乐要闻

春节档电影首波口碑出炉!

财经要闻

大年初一,这三件事很不寻常

汽车要闻

问界M6更多信息:乾崑智驾ADS4.0+鸿蒙座舱5.0

态度原创

健康
本地
手机
家居
公开课

转头就晕的耳石症,能开车上班吗?

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

手机要闻

苹果春季发布会?邀请函曝光,大量新品蓄势待发

家居要闻

中古雅韵 乐韵伴日常

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版