网易首页 > 网易号 > 正文 申请入驻

DeepSeek公布推理引擎开源路径,承诺将核心优化注入vLLM生态

0
分享至

“源神”DeepSeek 又有新的开源动作了。4 月 14 日,DeepSeek 悄悄在其 GitHub 的 open-infra-index 库中公布了其自研推理引擎的开源计划。在公告中,DeepSeek 表示,他们并不会选择直接开其内部完整且高度优化的代码库,而是将采取一种更侧重协作、更具可持续性的策略,将其核心优化成果贡献给现有的开源项目,尤其是作为其技术基础的 vLLM。

DeepSeek 在其公告中首先对开源生态系统表达了诚挚的感谢,承认其在模型训练(依赖 PyTorch 等框架)和推理引擎构建(早期基于 vLLM)方面都深受开源社区的裨益。随着自研的 DeepSeek-V3、DeepSeek-R1 等模型展现出强大的能力,市场对其高效部署方案的需求与日俱增,促使 DeepSeek 思考如何将自身的进展回馈给社区。

然而,在评估了直接开源内部完整推理引擎的可行性后,DeepSeek 认为存在几个关键障碍。首先是显著的代码库分歧。其内部引擎源自一年多前的 vLLM 早期分支,经过长期针对 DeepSeek 模型的深度定制优化,已与 vLLM 主线或其他通用推理框架产生巨大差异。直接开源此版本不仅难以被社区广泛应用和扩展,维护成本也极高。

其次是基础设施强依赖。该引擎与 DeepSeek 内部的集群管理系统、特定的硬件配置和运维流程紧密耦合,外部用户几乎无法在标准环境下直接部署,需要进行大规模重构才能剥离这些依赖,这违背了开源项目通常追求的易用性原则。

最后是有限的维护带宽。DeepSeek 坦言,作为一家以模型研发为核心的团队,他们缺乏足够的资源来长期维护一个需要持续投入、支持广泛用例的大型开源项目。贸然发布可能导致项目后续支持不足,损害用户体验。

面对这些现实制约,DeepSeek 选择了与现有开源项目(特别是 vLLM)紧密合作的路径,以更灵活、更易于集成的方式分享其技术积累。具体策略包括提取可复用的独立特性,将其模块化后作为独立的库贡献出来;以及直接分享优化细节,向 vLLM 等项目贡献设计思想、实现方法甚至具体的代码补丁。

这一合作策略获得了社区的普遍理解和积极响应。vLLM 项目官方账号在社交平台 X 上明确表示支持,认为 DeepSeek“以正确的方式开源引擎”,即将改进带回社区使人人受益,而非创建一个独立的仓库。技术社区的讨论也倾向于认为,这种分享“know-how”和可集成模块的方式,比发布一个难以维护的代码“僵尸”更有价值。

社区对 DeepSeek 贡献内容的期待值很高。此前已有分析指出,vLLM 在吸收 DeepSeek 2 月的“开源周”所公布论文中的部分优化后,处理 DeepSeek 模型的性能已有显著提升(约 3 倍)。

而根据 DeepSeek 此前公布的推理系统内部测试结果,每个 H800 节点在预填充期间平均吞吐量达到 73.7k tokens/s 输入(包括缓存命中),或在解码期间达到 14.8k tokens/s 输出。相比之下,有开发者使用 vLLM 在高并发下,使用 sharegpt 数据集时基准测试约为 5K total tokens/s,随机 2000/100 测试达到 12K total token/s 的吞吐量。这表明推理性能优化领域仍有巨大提升空间。

值得注意的是,DeepSeek 在公告中特别澄清,本次宣布的开源路径仅针对其推理引擎代码库。对于未来模型发布,公司将继续秉持开放协作的态度,致力于在新模型推出前与社区及硬件伙伴同步推理优化工作,确保社区能在模型发布首日(Day-0)获得最先进(SOTA)的推理支持(或许这项工作也是为不久后到来的 R2 做铺垫)。其最终目标是构建一个同步生态,让前沿 AI 能力能在多样化硬件平台上无缝落地。

参考资料:

1.https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

2.https://developers.redhat.com/articles/2025/03/19/how-we-optimized-vllm-deepseek-r1#mla__multi_token_prediction__and_parallelism_optimizations

3.https://x.com/vllm_project/status/1911669255428542913?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1911669255428542913%7Ctwgr%5E2c28928084e90824cea080020bfca45fcf9e9ccb%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fanalyticsindiamag.com%2Fai-news-updates%2Fdeepseek-to-open-source-its-inference-engine%2F

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“跳水”大降价,BBA终于扛不住了

“跳水”大降价,BBA终于扛不住了

蒋东文
2026-03-03 20:58:31
随着曼城2-2+切尔西4-1维拉!英超最新积分榜:阿森纳胜,曼联败了

随着曼城2-2+切尔西4-1维拉!英超最新积分榜:阿森纳胜,曼联败了

万花筒体育球球
2026-03-05 07:15:35
央视公布!中国卫星立大功,全程直播美军行动,一举一动尽收眼底

央视公布!中国卫星立大功,全程直播美军行动,一举一动尽收眼底

缘史记
2026-03-04 14:24:52
蔡卓妍是个玩咖?恋爱可以同居,结婚免谈!

蔡卓妍是个玩咖?恋爱可以同居,结婚免谈!

毒舌八卦
2026-03-04 23:10:39
马斯克再登顶胡润全球富豪榜,张一鸣财富5500亿坐稳中国首富

马斯克再登顶胡润全球富豪榜,张一鸣财富5500亿坐稳中国首富

界面新闻
2026-03-05 13:59:43
把天捅破!美国驻以色列大使:若以色列拿下整个中东,那也没问题

把天捅破!美国驻以色列大使:若以色列拿下整个中东,那也没问题

达文西看世界
2026-02-22 21:18:10
高市首相和小泉进次郎在国会的一段视频爆火日网!日本网友竟疯狂嗑起了他俩的CP?!

高市首相和小泉进次郎在国会的一段视频爆火日网!日本网友竟疯狂嗑起了他俩的CP?!

东京新青年
2026-03-04 18:28:54
3-0!3-0!女足亚洲杯首个8强无限诞生,中国队冲四强传来好消息

3-0!3-0!女足亚洲杯首个8强无限诞生,中国队冲四强传来好消息

侃球熊弟
2026-03-05 13:12:26
北京全市普降大雪,怀柔白木出现暴雪

北京全市普降大雪,怀柔白木出现暴雪

新浪财经
2026-03-05 09:57:00
丁俊晖的母亲陈习娟:辛苦抚养儿子成才,最终还没享福就去世了

丁俊晖的母亲陈习娟:辛苦抚养儿子成才,最终还没享福就去世了

老吴教育课堂
2026-03-02 12:53:19
这就是背叛中国的下场,被美欧轮番“吸血”,没有一国愿意帮助它

这就是背叛中国的下场,被美欧轮番“吸血”,没有一国愿意帮助它

古事寻踪记
2026-02-25 07:32:13
约会时刺激女人荷尔蒙的方法,这4个做法,让她彻底沦陷

约会时刺激女人荷尔蒙的方法,这4个做法,让她彻底沦陷

枫红染山径
2026-03-05 15:29:11
中国女篮再战巴西,开球时间敲定,央视赞王思雨,宫鲁鸣知错就改

中国女篮再战巴西,开球时间敲定,央视赞王思雨,宫鲁鸣知错就改

体育大学僧
2026-03-05 09:28:39
美军双航母“两面夹击”伊朗,近300架战机待命远距离打击

美军双航母“两面夹击”伊朗,近300架战机待命远距离打击

邵永灵
2026-03-05 15:59:58
涨粉近5000万,新“抖音一哥”诞生了!

涨粉近5000万,新“抖音一哥”诞生了!

TOP电商
2026-03-04 16:55:32
拒绝爆冷,湖人三连胜,赛后数据一览,最大赢球功臣不是詹姆斯

拒绝爆冷,湖人三连胜,赛后数据一览,最大赢球功臣不是詹姆斯

米果说识
2026-03-04 16:54:53
躲过英超的飞铲,还要躲中东的导弹?纽卡球星的硬核养伤之旅!

躲过英超的飞铲,还要躲中东的导弹?纽卡球星的硬核养伤之旅!

仰卧撑FTUer
2026-03-05 11:00:05
绿凯大爆冷!布朗20+11没借口,三球18+7,克尼佩尔20+4全队第一

绿凯大爆冷!布朗20+11没借口,三球18+7,克尼佩尔20+4全队第一

鱼崖大话篮球
2026-03-05 11:06:02
女员工手一抖摔破3000多元飞天茅台:确实是真酒,我自己需承担赔偿,从此见到茅台就有心理阴影

女员工手一抖摔破3000多元飞天茅台:确实是真酒,我自己需承担赔偿,从此见到茅台就有心理阴影

潇湘晨报
2026-03-04 21:52:09
关于伊朗战争,几则挑战智商下限的奇葩报道

关于伊朗战争,几则挑战智商下限的奇葩报道

跟着老李看世界
2026-03-05 14:26:48
2026-03-05 16:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16362文章数 514707关注度
往期回顾 全部

科技要闻

阿里内部邮件回应:批准林俊旸辞职

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

头条要闻

日本政府紧张研判:派自卫队去霍尔木兹海峡

体育要闻

不开玩笑,没人想在季后赛碰上黄蜂

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

小鹏第二代VLA如何破解智驾不敢用的技术困局?

态度原创

手机
房产
艺术
亲子
公开课

手机要闻

小米史上电池最大的旗舰来了!小米17 Max五月见:8000mAh加持 淘汰充电宝

房产要闻

185个字!2026年中国房地产,定调了!

艺术要闻

2026年“浩瀚草原 亮丽北疆”美展

亲子要闻

手外纪事|第50期《宝宝多指不是哪都可切,希望一次解决孩子问题

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版