网易首页 > 网易号 > 正文 申请入驻

DeepSeek开源第三日,行业影响几何?

0
分享至

2月26日,在开源周(OpenSourceWeek)第三日,DeepSeek宣布开放高效的FP8 GEMM库DeepGEMM。

DeepSeek这三天的发布都与算法有关,偏技术向。大模型生态社区OpenCSG(开放传神)创始人陈冉对第一财经举例表示,“相当于以前DeepSeek是直接给一辆车,告诉大家这辆车续航900公里,但是现在DeepSeek在深挖,用什么方式能够开到900公里。”DeepSeek的模型为什么能够实现较好的效果,对应有一些算法和相应的框架,而这些“脚手架”的开源有利于之后的生态搭建。

具体到此次发布的关键词,GEMM(General Matrix Multiplication,通用矩阵乘法)是线性代数中的基本运算,而FP8 GEMM则是一种使用8位浮点数进行矩阵乘法的计算操作。FP8是一种低精度浮点格式,适用于深度学习和高性能计算,能够在保持较高计算效率的同时减少内存占用和带宽需求。

据DeepSeek方面介绍,DeepGEMM同时支持传统的稠密模型和MoE(混合专家)模型的GEMM运算,这一代码为基于英伟达Hopper架构(如H100 GPU)的V3/R1系列硬件提供高效的训练和推理支持。

DeepSeek提到,基于这一代码库,在英伟达Hopper架构的GPU上可实现1350+ FP8 TFLOPS(每秒浮点运算次数)的性能,充分利用算力。同时,该代码库设计非常简洁,只有一个核心内核函数,代码量约为300行,但在大多数矩阵规模上均优于专家调优的内核。

开源 DeepGEMM有何影响?记者将此问题抛给DeepSeek,它回答称,DeepGEMM 通过FP8和硬件级优化,解决了大模型计算效率和资源消耗的痛点,尤其为 MoE模型的落地提供了关键支持。其开源行为不仅加速了技术民主化,更可能成为AI计算生态的“基础设施”,推动行业向更高效、低成本的方向发展。

FP8是AI计算的新兴标准,其高效性可加速千亿参数模型的训练,降低显存需求。在边缘设备或云端部署时,FP8的低精度计算能显著提升吞吐量,降低成本。因此,开源 DeepGEMM可以推动FP8生态普及,降低开发者使用门槛,促进更多框架和模型适配FP8,加速行业向低精度计算迁移。

此外,MoE模型因计算复杂性难以落地,DeepGEMM 的开源提供了高效实现参考,可能催生更多MoE应用(如多模态模型、边缘端高效模型)。

对于DeepSeek连续三天的代码库开源,陈冉对记者表示,“我们看下来蛮震撼的。”DeepSeek最终的目标是要表明他们的R1和V3是怎么做出来的,他认为,DeepSeek现在发布的算法某种意义上属于“脚手架”,“一定要给大家‘脚手架’,才能真正让大家基于DeepSeek的技术线继续往前用,最终行业能基于此将生态做起来。”

长期来看,陈冉认为,DeepSeek这一开源动作非常有意义,既有模型标准,也有工具标准,也有生态基石,生态才能长起来。

陈冉判断,DeepSeek的代码开源或许会影响一批做AI Infra层的从业者,“DeepSeek基本将技术栈、模型给出来,就差数据了,但是别人也有可能将数据复现出来,AI Infra层的人就要找新的方向。”但他同时表示,这种开源是一把双刃剑,如果能将DeepSeek开源的内容用好可能也会得利,“用不好就被冲击”。

也有从业者对记者表示,DeepSeek开源的是Infra层的推理加速这一块,DeepSeek底层技术开源对从业者有影响,但或许不会太大。

“DeepSeek对行业的影响这才刚刚开始,没有人能猜到结局。”上述从业者说。

DeepSeek在此前宣布会陆续开源5个代码库,接下来DeepSeek还有两个代码库在这周发布。“每分享一行代码,都会成为加速AI行业发展的集体动力。”DeepSeek在公告中表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人狂自有天收

人狂自有天收

李老逵乱摆龙门阵
2025-09-11 09:01:28
家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

有范又有料
2026-03-24 10:59:07
20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

20人老头乐公司起诉小米汽车,把网友们CPU干冒烟了……

柴狗夫斯基
2026-03-26 11:44:33
一名重大经济犯罪嫌疑人被押解回国

一名重大经济犯罪嫌疑人被押解回国

新华社
2026-03-26 15:00:03
70万韩国青年,选择“消失”

70万韩国青年,选择“消失”

中国新闻周刊
2026-03-26 09:30:07
iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

iPhone4回收价暴涨80倍?借着二手手机涨价热点的又一波疯狂收割

柴狗夫斯基
2026-03-26 21:15:05
9.9元战火未熄,库迪用“不限量”掀了桌子!给瑞幸整不会了

9.9元战火未熄,库迪用“不限量”掀了桌子!给瑞幸整不会了

品牌观察官
2026-03-26 17:17:59
西安某建筑公司全方位崩塌!

西安某建筑公司全方位崩塌!

黯泉
2026-03-26 18:49:04
“鸡蛋界的LV”,安全了吗

“鸡蛋界的LV”,安全了吗

中国新闻周刊
2026-03-26 13:01:31
追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

追悼会前,张雪峰婚姻状况被扒,现任身份不一般,恐影响遗产分配

喜欢历史的阿繁
2026-03-26 14:40:54
26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

春江财富
2026-03-26 15:26:22
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
日媒:日本高中生起诉市政府和日本政府,指控市政府擅自将个人信息提交给防卫省用于招募

日媒:日本高中生起诉市政府和日本政府,指控市政府擅自将个人信息提交给防卫省用于招募

环球网资讯
2026-03-26 20:44:05
“中园石化”被立案调查

“中园石化”被立案调查

每日经济新闻
2026-03-25 11:13:18
狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

狂赚18亿!比爱马仕还狠的运动奢侈品,正在掏空中产的钱包

青眼财经
2026-03-17 16:03:09
2022年,江苏一老师路边花30元买1条上交,专家:很多年没见过了

2022年,江苏一老师路边花30元买1条上交,专家:很多年没见过了

万象硬核本尊
2026-03-26 22:23:37
上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

上海宛平南路一套房子爆火!月租7000元,回家像玩密室逃脱...

黄河新闻网吕梁
2026-03-26 15:14:06
“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

“住宅禁放骨灰盒”新规出炉,引争议!网友:可以去化房地产库存

火山詩话
2026-03-26 11:11:22
保姆偷拿我两瓶茅台,我辞退未揭穿,临走她指我旧鞋,剪开后我懵了...

保姆偷拿我两瓶茅台,我辞退未揭穿,临走她指我旧鞋,剪开后我懵了...

感觉会火
2026-03-26 12:06:22
快提醒家里长辈:广州老年人优待卡满两年记得续期!手机就能办

快提醒家里长辈:广州老年人优待卡满两年记得续期!手机就能办

城事特搜
2026-03-26 19:13:51
2026-03-27 00:48:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
248301文章数 621905关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
教育
亲子
游戏
军事航空

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

亲子要闻

看看把孩子吓得哈哈哈

PS1大IP游戏藏私货!成人手绘与盗版马里奥ROM塞满

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版