网易首页 > 网易号 > 正文 申请入驻

DeepSeek公布推理引擎开源路径,承诺将核心优化注入vLLM生态

0
分享至

“源神”DeepSeek 又有新的开源动作了。4 月 14 日,DeepSeek 悄悄在其 GitHub 的 open-infra-index 库中公布了其自研推理引擎的开源计划。在公告中,DeepSeek 表示,他们并不会选择直接开其内部完整且高度优化的代码库,而是将采取一种更侧重协作、更具可持续性的策略,将其核心优化成果贡献给现有的开源项目,尤其是作为其技术基础的 vLLM。

DeepSeek 在其公告中首先对开源生态系统表达了诚挚的感谢,承认其在模型训练(依赖 PyTorch 等框架)和推理引擎构建(早期基于 vLLM)方面都深受开源社区的裨益。随着自研的 DeepSeek-V3、DeepSeek-R1 等模型展现出强大的能力,市场对其高效部署方案的需求与日俱增,促使 DeepSeek 思考如何将自身的进展回馈给社区。

然而,在评估了直接开源内部完整推理引擎的可行性后,DeepSeek 认为存在几个关键障碍。首先是显著的代码库分歧。其内部引擎源自一年多前的 vLLM 早期分支,经过长期针对 DeepSeek 模型的深度定制优化,已与 vLLM 主线或其他通用推理框架产生巨大差异。直接开源此版本不仅难以被社区广泛应用和扩展,维护成本也极高。

其次是基础设施强依赖。该引擎与 DeepSeek 内部的集群管理系统、特定的硬件配置和运维流程紧密耦合,外部用户几乎无法在标准环境下直接部署,需要进行大规模重构才能剥离这些依赖,这违背了开源项目通常追求的易用性原则。

最后是有限的维护带宽。DeepSeek 坦言,作为一家以模型研发为核心的团队,他们缺乏足够的资源来长期维护一个需要持续投入、支持广泛用例的大型开源项目。贸然发布可能导致项目后续支持不足,损害用户体验。

面对这些现实制约,DeepSeek 选择了与现有开源项目(特别是 vLLM)紧密合作的路径,以更灵活、更易于集成的方式分享其技术积累。具体策略包括提取可复用的独立特性,将其模块化后作为独立的库贡献出来;以及直接分享优化细节,向 vLLM 等项目贡献设计思想、实现方法甚至具体的代码补丁。

这一合作策略获得了社区的普遍理解和积极响应。vLLM 项目官方账号在社交平台 X 上明确表示支持,认为 DeepSeek“以正确的方式开源引擎”,即将改进带回社区使人人受益,而非创建一个独立的仓库。技术社区的讨论也倾向于认为,这种分享“know-how”和可集成模块的方式,比发布一个难以维护的代码“僵尸”更有价值。

社区对 DeepSeek 贡献内容的期待值很高。此前已有分析指出,vLLM 在吸收 DeepSeek 2 月的“开源周”所公布论文中的部分优化后,处理 DeepSeek 模型的性能已有显著提升(约 3 倍)。

而根据 DeepSeek 此前公布的推理系统内部测试结果,每个 H800 节点在预填充期间平均吞吐量达到 73.7k tokens/s 输入(包括缓存命中),或在解码期间达到 14.8k tokens/s 输出。相比之下,有开发者使用 vLLM 在高并发下,使用 sharegpt 数据集时基准测试约为 5K total tokens/s,随机 2000/100 测试达到 12K total token/s 的吞吐量。这表明推理性能优化领域仍有巨大提升空间。

值得注意的是,DeepSeek 在公告中特别澄清,本次宣布的开源路径仅针对其推理引擎代码库。对于未来模型发布,公司将继续秉持开放协作的态度,致力于在新模型推出前与社区及硬件伙伴同步推理优化工作,确保社区能在模型发布首日(Day-0)获得最先进(SOTA)的推理支持(或许这项工作也是为不久后到来的 R2 做铺垫)。其最终目标是构建一个同步生态,让前沿 AI 能力能在多样化硬件平台上无缝落地。

参考资料:

1.https://github.com/deepseek-ai/open-infra-index/blob/main/OpenSourcing_DeepSeek_Inference_Engine/README.md

2.https://developers.redhat.com/articles/2025/03/19/how-we-optimized-vllm-deepseek-r1#mla__multi_token_prediction__and_parallelism_optimizations

3.https://x.com/vllm_project/status/1911669255428542913?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1911669255428542913%7Ctwgr%5E2c28928084e90824cea080020bfca45fcf9e9ccb%7Ctwcon%5Es1_&ref_url=https%3A%2F%2Fanalyticsindiamag.com%2Fai-news-updates%2Fdeepseek-to-open-source-its-inference-engine%2F

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
刚毕业的我给富婆当司机,一次她来我家,对我提出了一个要求

刚毕业的我给富婆当司机,一次她来我家,对我提出了一个要求

青青会讲故事
2025-03-29 13:22:24
研究发现:那些长期喝酒的老人,到七十岁以后,大多变成了这样

研究发现:那些长期喝酒的老人,到七十岁以后,大多变成了这样

泠泠说史
2025-09-30 10:21:48
秦朝竹简破译,历史再无秘密!秦始皇被黑2000年,这下“大白”了

秦朝竹简破译,历史再无秘密!秦始皇被黑2000年,这下“大白”了

铭记历史呀
2026-01-16 14:13:16
你去看一个人的家里,他过得好不好,你就去看这个人,这个家里…

你去看一个人的家里,他过得好不好,你就去看这个人,这个家里…

明智家庭教育
2026-01-15 22:33:50
单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

单论军事指挥能力而言,十大元帅该怎么排名,徐帅肯定不是第八

兴趣知识
2026-01-16 14:56:20
秘书:一种精密的中介者

秘书:一种精密的中介者

疾跑的小蜗牛
2026-01-16 23:09:20
明天四九第一天,牢记“吃三样,喝一汤,忌二事”习俗,养精蓄锐

明天四九第一天,牢记“吃三样,喝一汤,忌二事”习俗,养精蓄锐

花小厨
2026-01-16 15:37:38
伊朗高层48小时转移15亿美元出境,哈梅内伊儿子转了3.28亿美元

伊朗高层48小时转移15亿美元出境,哈梅内伊儿子转了3.28亿美元

桂系007
2026-01-15 14:15:21
广东将遇“过山车式”气温升降

广东将遇“过山车式”气温升降

中国能源网
2026-01-16 17:58:04
章泽天播客“翻车”:在深度内容面前,资本不是万能的

章泽天播客“翻车”:在深度内容面前,资本不是万能的

陈列共和
2026-01-16 21:31:19
顶着骂名给中国送技术,年薪超4亿的她,为何敢和美国对着干

顶着骂名给中国送技术,年薪超4亿的她,为何敢和美国对着干

余們搞笑段子
2026-01-17 01:29:05
克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

克鲁尼举家“逃离美国”?川普一语戳破好莱坞左派的虚伪

斌闻天下
2026-01-14 07:15:03
4个老婆,全家移民,享受正师级待遇,潘长江身上哪个标签是真的

4个老婆,全家移民,享受正师级待遇,潘长江身上哪个标签是真的

春秋论娱
2025-12-30 07:19:06
“特朗普级”战列舰,造价公布

“特朗普级”战列舰,造价公布

极目新闻
2026-01-16 11:58:33
续约反转!皇马新帅变阵,维尼修斯回归左路开心,姆巴佩搭档确定

续约反转!皇马新帅变阵,维尼修斯回归左路开心,姆巴佩搭档确定

万花筒体育球球
2026-01-16 19:18:41
花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

花生再次被关注!调查发现:糖尿病常吃花生,不过半年或有6好处

蜉蝣说
2025-11-20 14:40:39
比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

比恒大还惨!中国第二大民企轰然倒塌,负债7500亿,创始人被带走

甜柠聊史
2025-12-24 18:22:43
《爸爸去哪儿》夏天长这么大了!暂不考虑进娱乐圈

《爸爸去哪儿》夏天长这么大了!暂不考虑进娱乐圈

娱乐顺风车666
2026-01-16 12:02:48
向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

向太太敢说了!向华强今年已经78了,但是她和向华强还有X生活!

心静物娱
2025-12-24 11:02:28
U23亚洲杯神剧情:东南亚劲旅加时激战3-2绝杀晋级

U23亚洲杯神剧情:东南亚劲旅加时激战3-2绝杀晋级

阿衃体育
2026-01-17 02:44:32
2026-01-17 03:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16134文章数 514492关注度
往期回顾 全部

科技要闻

贾国龙与罗永浩被禁言,微博CEO回应

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

头条要闻

美媒披露:美国出动海军陆战队和福特号航母

体育要闻

全队身价=登贝莱,他们凭什么领跑法甲?

娱乐要闻

李湘翻车,早就有迹可循!

财经要闻

清流|酒店商家在携程和美团之间沦为炮灰

汽车要闻

方程豹品牌销量突破30万辆 2026年还将推出轿跑系列

态度原创

教育
家居
本地
艺术
公开课

教育要闻

初试成绩出来了!404分...

家居要闻

岁月柔情 现代品质轻奢

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

艺术要闻

180米!上海北外滩新地标,设计藏了3个“小心机”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版