网易首页 > 网易号 > 正文 申请入驻

梁文锋署名论文!DeepSeek首轮融资后大动作:生成速度大涨85%

0
分享至


智东西
作者 李水青
编辑 心缘

智东西6月27日报道,继完成500亿元融资后,今日,DeepSeek首次放出开源新成果!

刚刚,DeepSeek开源了一套让现有模型跑得更快的工程方案:推出DeepSeek-V4-Pro-DSpark、DeepSeek-V4-Flash-DSpark模型,并开源推测解码(Speculative Decoding)框架DSpark以及推测解码训练框架DeepSpec


▲DeepSeek-V4-Pro-DSpark开源上新页面截图

根据同步上传的梁文锋署名、联合北京大学完成的论文《DSpark:基于半自回归生成的置信度调度推测解码(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)》,将DSpark部署在DeepSeek-V4线上服务系统、承接真实用户流量时,它有效减少了无效校验带来的算力浪费。

相较于成熟的生产基线方案(MTP-1),在保持整体吞吐不变的前提下,DSpark把单用户生成速度提升60%-85%。更关键的是,在严格交互时延约束下,DSpark避免了吞吐率大幅滑坡,实现了以往无法达成的性能档位,推高了整套服务系统的帕累托最优边界。


▲DSpark论文截图

Hugging Face地址:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
GitHub地址:
https://github.com/deepseek-ai/DeepSpec
论文地址:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

根据Hugging Face上的模型卡,DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark并非新模型,而是在原有版本的基础上,增加了一个推测解码模块,用以加快推理速度、降低成本。

推测解码,简单来说,是一种大模型推理无损技术,核心流程为先打草稿、后验证。其将草稿生成与目标模型校验解耦,以此加速大语言模型推理。

当前主流并行草稿器能够单次前向运算生成超长token序列,但由于token之间缺少依赖关系,草稿后续内容的通过率会快速下滑。此外,如果对整段长候选序列无差别校验,会把宝贵的批次算力浪费在极易被驳回的token上,从而导致高并发服务场景下整体吞吐率大幅下降。

为此,DeepSeek提出DSpark推测解码框架,把高吞吐并行生成与自适应、感知负载的校验机制结合在一起。为保证草稿质量,DSpark采用半自回归架构:将并行主干网络与轻量串行模块相结合,建模块内token依赖,缓解末尾内容通过率衰减问题。


▲DSpark架构与解码流程

为优化系统运行效率,DSpark引入置信度调度校验机制:根据预估的前缀通过概率与引擎吞吐特征,为每一条请求动态调整校验长度。在多领域离线基准测试中,相比当前最优的自回归草稿器与并行草稿器,DSpark能够显著提升有效通过序列长度。

如下图所示,针对这DeepSeek-V4-Pro-DSpark和DeepSeek-V4-Flash-DSpark两款模型,DeepSeek提供了一个最小推理示例。


▲DeepSeek提供的最小推理示例

总的来说,用户在部署DSpark版本的DeepSeek-V4模型后,有望在生成速度、首token延迟、并发能力等方面获得体验提升。

再来看看DeepSpec,这是一个用于训练和评估推测性解码草稿模型(Draft Model)的全栈代码库,或者说工具链,它包含数据准备工具、草稿模型实现、训练代码和评估脚本,支持MIT许可。


▲DeepSpec开源上新页面截图

DeepSpec的工作流程如下,它会按顺序运行各个阶段,每个阶段的输出为下一个阶段提供反馈:

1、数据准备:下载提示,重新生成目标答案,并构建目标缓存。
2、训练:针对缓存的目标输出训练一个模型。
3、评估:在基准任务上衡量推测解码的接受程度。

目前,DeepSpec支持的算法包括三个草稿模型:DSpark、DFlash和Eagle3。

DeepSpec团队还在最后向SpecForge(Apache-2.0)、DFlash(MIT)以及Qwen3和Gemma发文致谢。


▲DeepSeek致谢情况

可以看到,DeepSeek不仅发布相关模型,还开放完整的训练框架,供开发者和企业用这套工具给自己的Qwen3、Gemma等模型训练草稿模型。

结语:推理重要度提高,考验工程化能力

DeepSeek本次发布虽然低调,也不是新模型迭代,但实际含金量不低。DeepSeek发布了一套让现有模型跑得更快的工程方案,有望带来更快更低成本的推理体验,并降低推测解码的落地门槛。

大模型竞赛已进入训练与推理并重的系统博弈阶段。本次也是DeepSeek完成融资后,率先落子推理优化赛道。战略意图也很明确:不仅要加速模型迭代和产品化,还要向下抢占算力效率竞争制高点。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
董路坚决拒绝和解!5800万金额未能达成共识,三方相关主体全部乱了阵脚

董路坚决拒绝和解!5800万金额未能达成共识,三方相关主体全部乱了阵脚

林子说事
2026-06-28 20:27:14
历史性突破!美以黎签署三方达成一致,共同打击真主党武装力量

历史性突破!美以黎签署三方达成一致,共同打击真主党武装力量

以色列计划Pro
2026-06-27 20:16:08
71岁卢卡申科新伴仅22岁,常年被美女模特环绕,分居妻子杳无音信

71岁卢卡申科新伴仅22岁,常年被美女模特环绕,分居妻子杳无音信

译言
2026-06-21 07:11:28
为什么菲律宾防长制裁后成“烫手山芋”?

为什么菲律宾防长制裁后成“烫手山芋”?

小眼睛小世界
2026-06-29 06:18:20
普京:如果西方认为乌克兰正在获胜,那他们就等着吧

普京:如果西方认为乌克兰正在获胜,那他们就等着吧

观察者网
2026-06-29 09:10:10
入选国少!前足球小将核心父亲示好 董路:永远不原谅你 原因曝光

入选国少!前足球小将核心父亲示好 董路:永远不原谅你 原因曝光

念洲
2026-06-29 20:03:23
2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

磊子讲史
2026-06-23 17:22:32
塔雷米:这是一届灾难性的世界杯,足球不该成为政治的一部分

塔雷米:这是一届灾难性的世界杯,足球不该成为政治的一部分

懂球帝
2026-06-27 20:18:28
穆帅坐不住了!皇马众星世界杯两极分化,核心彻底崩盘拉胯

穆帅坐不住了!皇马众星世界杯两极分化,核心彻底崩盘拉胯

澜归序
2026-06-29 07:22:49
“工业味精”引爆二级市场 公募扫货磷化铟全产业链

“工业味精”引爆二级市场 公募扫货磷化铟全产业链

证券时报
2026-06-29 07:18:03
高分学子成试验品?福耀科大风波发酵,网友:张雪峰的含金量上升

高分学子成试验品?福耀科大风波发酵,网友:张雪峰的含金量上升

火山詩话
2026-06-27 16:12:32
俄士兵为救中国记者牺牲,记者承诺照顾其妻儿,如今啥样了?

俄士兵为救中国记者牺牲,记者承诺照顾其妻儿,如今啥样了?

莫地方
2026-06-28 01:35:03
为什么日本经贸团访华后仍急切想再来?

为什么日本经贸团访华后仍急切想再来?

小眼睛小世界
2026-06-29 06:16:34
世界杯:巴西vs日本、德国vs巴拉圭、荷兰vs摩洛哥,三场解析!

世界杯:巴西vs日本、德国vs巴拉圭、荷兰vs摩洛哥,三场解析!

生活新鲜市
2026-06-29 19:11:55
森保一:争冠目标也许会被人笑,但这次我们是认真的

森保一:争冠目标也许会被人笑,但这次我们是认真的

懂球帝
2026-06-29 05:45:08
日本vs巴西淘汰赛:维尼修斯4球冲击金靴,攻防大战一触即发

日本vs巴西淘汰赛:维尼修斯4球冲击金靴,攻防大战一触即发

体坛观察猿
2026-06-30 01:01:00
身中30多刀!34岁被害人带人看房,惨死出租屋内,现场遍布血迹!20年后凶手线索浮现

身中30多刀!34岁被害人带人看房,惨死出租屋内,现场遍布血迹!20年后凶手线索浮现

南方都市报
2026-06-28 15:08:45
大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

大家都抢军校警校,没人留意这5条小路,低分考生偷偷捡大漏

户外阿毽
2026-06-29 18:29:28
凌晨2时导弹雨倾泻!伊朗实施大规模报复,美方连夜空袭回击?

凌晨2时导弹雨倾泻!伊朗实施大规模报复,美方连夜空袭回击?

带你领略快乐真谛
2026-06-29 18:53:49
中印西山口白刃战:印度弯刀对上我军三棱刺,126名印军无一生还

中印西山口白刃战:印度弯刀对上我军三棱刺,126名印军无一生还

文史达观
2026-06-29 22:28:47
2026-06-30 01:56:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12146文章数 117113关注度
往期回顾 全部

财经要闻

万达广场批量易主 多位投资人正式入局

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

旅游
亲子
房产
教育
公开课

旅游要闻

昆明不起眼小乡村,田里长出巨型彩绘,外地游客专程驱车百里赶来

亲子要闻

产检发现这种先天缺陷,有救了!柳叶刀重磅

房产要闻

你敢想?海口房地产投资,暴跌5成!

教育要闻

海淀教委最新公布!这20所学校不再具备办学资格

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版