网易首页 > 网易号 > 正文 申请入驻

DeepSeek扔的第二枚开源王炸到底是什么?

0
分享至

摘要:

DeepSeek此次开源的全栈通信库DeepEP,通过优化GPU之间信息传输的效率,极大的缓解了从业者的算力焦虑。

2月25日,开源放福利的DeepSeek甩出了一张王炸——开源全球首个面向MoE模型的全栈通信库DeepEP。因为直接解决了AI算力焦虑,GitHub瞬间飙出1500星(指收藏量),圈内集体炸锅,其重要性可见一斑。

很多人好奇DeepEP意味着什么?想象一下双十一的快递驿站:2048个快递小哥(GPU)在200个仓库(服务器)间疯狂搬运包裹(AI数据),传统运输系统就相当于让小哥们蹬三轮送货,而DeepEP直接给全员配上了“磁悬浮+量子传送”套装,稳定高效的传递信息。

特点一:直接改变运输规则

在2024年8月29日的英伟达电话会议上,黄仁勋曾经专门强调了NVLink(英伟达开发的一种让GPU之间直接互连的技术,双向互传速度可达1.8TB/S)对于低延迟、高输出和大型语言模型的重要性,认为它是推动大模型发展的关键技术之一。

然而这个被吹爆的NVLink技术,这次直接被中国团队玩出了新高度。DeepEP玄妙之处就在于对NVLink的优化,这意味着在同个仓库的快递员之间,用磁悬浮轨道运输,速度高达每秒158个集装箱(GB/s),相当于把北京到上海的距离缩短到喝一口水的时间。

黑科技二是其所包含的RDMA技术的低延迟内核,试想下,不同城市的仓库之间,货物直接“量子传送”,每架飞机(网卡)运力达每秒47个集装箱,还能让飞机一边装货一边飞行,计算与通信重叠,彻底告别停机等待。

特点二:智能分拣黑科技:AI版“最强大脑”

当货物需要分发给不同专家(MoE模型中的子网络)时,传统分拣员要逐个拆箱检查,而DeepEP的“调度-组合”系统就像拥有预知能力:在训练预填充模式,4096个数据包同时走智能传送带,自动识别同城或跨城件;在推理预填充模式,128个加急包裹走VIP通道,163微秒送达比人类眨眼快5倍。与此同时采用动态变轨技术,遇到流量洪峰秒切传输模式,完美适配不同场景需求。

特点三:FP8“缩骨术”

普通货物用标准箱子(FP32/FP16格式)运输,而DeepEP能把货物压缩成微型胶囊(FP8格式),同样卡车能多装3倍货物。更神奇的是,这些胶囊到达目的地后会自动恢复原状,既省邮费又省时间。

这套系统已在DeepSeek自家仓库(H800 GPU集群)实测:同城货运速度提升3倍,跨城延迟降低到人类难以感知的程度,而最颠覆性的是它实现了真正的"无感传输"——就像快递小哥边骑车边往快递柜里塞包裹,整个过程行云流水。

现在DeepSeek把这张王牌开源,相当于把顺丰的无人分拣系统图纸公之于众,原本需要2000台GPU的重型任务,现在几百台就能轻松拿捏。

在更早之前,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码,同样是减少大模型训练过程中成本的关键技术之一。为了缓解产业链上下游的成本焦虑,DeepSeek正在倾囊相授。

此前潞晨科技创始人尤洋在社交媒体发文表示,“短期内,中国的MaaS模式可能是最差的商业模式”,其简单估算,如果每日输出1000亿token,基于DeepSeek的服务每月的机器成本是4.5亿元,亏损4亿元;用AMD芯片月收入4500万元,月机器成本2.7亿元,这意味着亏损也超过2亿元。

本文源自:凤凰网科技

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
霸王茶姬“水银门”被通报,网友:好歹毒的商战!

霸王茶姬“水银门”被通报,网友:好歹毒的商战!

广告创意
2026-04-30 15:43:46
2026 北京车展宝马 7 系设计封神!5.4 米修长身段,豪华比例教科书!

2026 北京车展宝马 7 系设计封神!5.4 米修长身段,豪华比例教科书!

聊聊车生活
2026-04-29 22:14:10
华为请他代言,27分钟卖了一万多台车,整个车圈都傻了

华为请他代言,27分钟卖了一万多台车,整个车圈都傻了

茶余饭好
2026-04-29 11:14:32
辽宁北镇官方通报汽修厂闪爆事故致2死:对一危险化学品运输罐车储罐顶部进行电气焊维修作业时发生,善后处置及事故调查工作正在进行

辽宁北镇官方通报汽修厂闪爆事故致2死:对一危险化学品运输罐车储罐顶部进行电气焊维修作业时发生,善后处置及事故调查工作正在进行

极目新闻
2026-05-01 15:51:37
郎永淳公开央视主持人退休工资标准,妻子仅三千多

郎永淳公开央视主持人退休工资标准,妻子仅三千多

吃青菜长高
2026-05-01 15:22:24
99岁医生仍每周出诊4天!他的长寿秘诀“守好三样东西”,很多人做不到

99岁医生仍每周出诊4天!他的长寿秘诀“守好三样东西”,很多人做不到

人民日报健康客户端
2026-04-30 07:36:29
5月1日俄乌:俄罗斯正在认清现实,特朗普不想再装了

5月1日俄乌:俄罗斯正在认清现实,特朗普不想再装了

山河路口
2026-05-01 18:36:01
18亿!凌晨!无国足!国际足联凭什么对中国球迷狮子大开口?

18亿!凌晨!无国足!国际足联凭什么对中国球迷狮子大开口?

曹老师评球
2026-05-01 14:08:15
腰斩的比亚迪

腰斩的比亚迪

诗与星空
2026-04-30 07:26:56
4大锂矿将停产!碳酸锂有望突破25万元/吨

4大锂矿将停产!碳酸锂有望突破25万元/吨

新浪财经
2026-05-01 08:45:40
3大痛点直击!央媒怒批国乒,孙颖莎成典型,王励勤真的难了

3大痛点直击!央媒怒批国乒,孙颖莎成典型,王励勤真的难了

林子说事
2026-05-01 14:55:38
掘金养出"奢侈品":沃森的爆发成了管理层噩梦

掘金养出"奢侈品":沃森的爆发成了管理层噩梦

热血体育社
2026-05-01 19:37:00
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
酒吧里的“波涛汹涌”全被她承包了

酒吧里的“波涛汹涌”全被她承包了

飛娱日记
2026-04-22 07:51:21
沉默45年后,中国第二轮“严打”终于来了!但这次目标变了

沉默45年后,中国第二轮“严打”终于来了!但这次目标变了

吃货的分享
2026-04-30 18:52:37
“五一”首日黄山山顶观景房价格飙升至2000元一晚,单个床位价超400元,多个房型“一房难求”

“五一”首日黄山山顶观景房价格飙升至2000元一晚,单个床位价超400元,多个房型“一房难求”

极目新闻
2026-05-01 16:24:30
26岁女子实名举报63岁人大教授,出轨多人含清华美女教授

26岁女子实名举报63岁人大教授,出轨多人含清华美女教授

老猫观点
2026-05-01 07:20:16
燃气表没电池也能跑,河南一男子用了3年1分钱没交,燃气公司:补交3700多元,不交不给通气,经协商支付1000元

燃气表没电池也能跑,河南一男子用了3年1分钱没交,燃气公司:补交3700多元,不交不给通气,经协商支付1000元

台州交通广播
2026-05-01 18:45:20
狂救6个赛点!国羽3-2死里逃生,李诗沣带伤封神太催泪!

狂救6个赛点!国羽3-2死里逃生,李诗沣带伤封神太催泪!

生活新鲜市
2026-05-01 01:50:53
1976年毛主席逝世,邓小平欲参加追悼会遭拒:你还是不要参加为好

1976年毛主席逝世,邓小平欲参加追悼会遭拒:你还是不要参加为好

大运河时空
2026-05-01 15:50:03
2026-05-01 20:08:49
金融界 incentive-icons
金融界
投资者信赖的财经金融门户网站
9194706文章数 546299关注度
往期回顾 全部

科技要闻

苹果上季在华收入继续大增 iPhone收入新高

头条要闻

特朗普发了张图 伊朗外长回应:犯了个"可怕的错误"

头条要闻

特朗普发了张图 伊朗外长回应:犯了个"可怕的错误"

体育要闻

无奈!约基奇:这要在塞尔维亚 全队早被炒了

娱乐要闻

邓超在景德镇被偶遇,穿黑外套逛茶园

财经要闻

GPU神话松动,AI真正的战场变了

汽车要闻

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

态度原创

健康
房产
教育
公开课
军事航空

干细胞治烧烫伤面临这些“瓶颈”

房产要闻

所有户型全卖爆!海口TOP级豪宅,景观样板间五一全线开放!

教育要闻

26届高考生“撞大运”了!截至目前,今年高考已有9个好消息!

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:持续推进海上封锁的行为不可容忍

无障碍浏览 进入关怀版