网易首页 > 网易号 > 正文 申请入驻

梁文锋署名!DeepSeek发表重磅论文:如何让大模型跑得更快

0
分享至

快科技6月28日消息,当行业在讨论谁的模型更聪明时,DeepSeek仍然把目光投向更现实的问题:如何让大模型跑得更快。

昨日,DeepSeek官方在Github低调发表了一篇最新论文,介绍其推理加速框架DSpark,试图解决大语言模型在高并发场景下的推理效率瓶颈。

从作者署名来看,这篇论文由DeepSeek与北京大学联合发布,值得注意的是,DeepSeek创始人梁文锋也位列作者名单。

在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。

DeepSeek首先解释了需要解决的问题。大语言模型采用自回归方式生成文本:每一个新词元的生成,都需要基于全部前置词元完成一次完整前向传播,结果是输出越长,等待越久。

由此带来GPU利用率低下、用户等待时间过长的问题,这是大语言模型线上服务的核心性能瓶颈,在实时对话助手、多轮智能体工作流等低时延敏感场景中尤为突出。

目前的主流方案分为自回归草稿模型(Eagle3)、并行草稿模型(DFlash)两条路线,二者各有缺陷,包括生成质量瓶颈和系统效率瓶颈等,且现有方案均缺乏负载自适应校验机制。

基于此,DeepSeek提出DSpark推测解码框架,采用半自回归生成架构:保留并行主干的高吞吐优势,同时加入轻量级串行模块,逐词元注入前缀依赖信息。

该模块提供两种实现——仅依赖前一个词元的马尔可夫头,以及通过循环状态累积完整前缀信息的RNN头。

实验表明,两层Transformer深度的DSpark即可在所有测试领域超过五层DFlash的接受长度。

目前,DeepSeek已经将DSpark部署到DeepSeek-V4在线服务系统中,并基于真实用户流量评估其实际性能。

结果显示,相较于现有生产环境基线系统MTP-1,在相同吞吐量条件下,DSpark将用户端生成速度提升了60%-85%。

此外,DeepSeek也将这一框架部署在其他模型上,以阿里旗下的Qwen3-4B、8B、14B三个模型为例,相较于自回归草稿模型,DSpark平均单轮可接受词元长度分别提升了30.9%、26.7%、30%;相较于并行草稿模型,DSpark分别提升了16.3%、18.4%、18.3%。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
人伦大乱,正在悄悄毁掉无数中国家庭!看似普通,实则家道衰败

人伦大乱,正在悄悄毁掉无数中国家庭!看似普通,实则家道衰败

阿凯销售场
2026-06-29 18:09:39
上映11天口碑票房双爆!《抓特务》票房破亿,9.6高分...

上映11天口碑票房双爆!《抓特务》票房破亿,9.6高分...

草莓解说体育
2026-06-30 01:06:46
我是一名女澡堂搓澡工,今年工作第十年,什么样的女人都遇到过

我是一名女澡堂搓澡工,今年工作第十年,什么样的女人都遇到过

千秋文化
2026-06-29 20:00:08
高市早苗APEC峰会拒见中方,中方不理睬其惺惺作态讨没趣

高市早苗APEC峰会拒见中方,中方不理睬其惺惺作态讨没趣

灯光玄幻天天看
2026-06-29 09:59:27
2:1最后一分钟极限绝杀,五星巴西不敢嘲笑日本了

2:1最后一分钟极限绝杀,五星巴西不敢嘲笑日本了

体育书生阿南
2026-06-30 08:06:30
霸气,巴特勒的经纪人谈詹姆斯和戴维斯可能加盟勇士队的传闻

霸气,巴特勒的经纪人谈詹姆斯和戴维斯可能加盟勇士队的传闻

好火子
2026-06-30 04:34:20
“奶茶袋子装大疆!”初三女孩收礼变脸被骂,面相学果然权威!

“奶茶袋子装大疆!”初三女孩收礼变脸被骂,面相学果然权威!

林林先生
2026-06-30 09:20:03
詹俊:安切洛蒂调整起决定性作用;日本还需天赋异禀的攻击手

詹俊:安切洛蒂调整起决定性作用;日本还需天赋异禀的攻击手

懂球帝
2026-06-30 03:43:06
拜登的预言成真?特朗普打完伊朗后,美国可能会衰落为世界第二?

拜登的预言成真?特朗普打完伊朗后,美国可能会衰落为世界第二?

共工之锚
2026-06-30 00:12:06
美的创始人何享健,坐拥2250亿财富无人继承,三个孩子均为老总

美的创始人何享健,坐拥2250亿财富无人继承,三个孩子均为老总

墨印斋
2026-06-29 09:43:17
16岁少女被五人灌“快乐水”,强奸后跳楼身亡,5人里有2名警察?

16岁少女被五人灌“快乐水”,强奸后跳楼身亡,5人里有2名警察?

法纪实录簿
2026-06-10 10:49:17
陈慧琳为何会看上光头刘建浩?原因很简单

陈慧琳为何会看上光头刘建浩?原因很简单

南万说娱26
2026-05-24 09:25:20
哭不出来别尬演!这次剃光头 自毁形象的马苏,给内娱狠狠上了一课

哭不出来别尬演!这次剃光头 自毁形象的马苏,给内娱狠狠上了一课

东方不败然多多
2026-06-30 00:31:10
面对40岁住家女保姆大胆表白,72岁大爷:我老但不糊涂,请你自重

面对40岁住家女保姆大胆表白,72岁大爷:我老但不糊涂,请你自重

孢木情感
2026-06-30 09:06:32
彻底决裂!布鲁克林·贝克汉姆怒批质问:为何公开他照片?正式宣告与父母永久断绝

彻底决裂!布鲁克林·贝克汉姆怒批质问:为何公开他照片?正式宣告与父母永久断绝

可乐谈情感
2026-06-30 09:56:22
刘尚进任重庆市副市长

刘尚进任重庆市副市长

新京报政事儿
2026-06-30 09:14:19
郑州瑜伽馆偷拍视频风波:这次真的给所有爱健身的女生提了个醒!

郑州瑜伽馆偷拍视频风波:这次真的给所有爱健身的女生提了个醒!

观察鉴娱
2026-06-29 10:46:39
张雪峰女儿张姩菡:否认自己不用读大学,也不可以躺平

张雪峰女儿张姩菡:否认自己不用读大学,也不可以躺平

金牌娱乐
2026-06-30 09:36:46
“实现两岸和平稳定的时机到了!”关键时刻,郑丽文一语轰动岛内

“实现两岸和平稳定的时机到了!”关键时刻,郑丽文一语轰动岛内

漫步独行侠
2026-06-29 08:25:50
贪官末日来了!中央反腐新规已落地,无论在职退休一律终身追责

贪官末日来了!中央反腐新规已落地,无论在职退休一律终身追责

细说职场
2026-06-28 22:51:02
2026-06-30 10:56:49
快科技 incentive-icons
快科技
一起关注每日科技热点
117573文章数 260709关注度
往期回顾 全部

科技要闻

DeepSeek V4正式版要来 高峰期API价格翻倍

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

头条要闻

牛弹琴:韩国对男足耻辱出局激烈反应 全世界震惊不已

体育要闻

日本众将掩面痛哭 连续3届先破门却被逆转

娱乐要闻

韩红称要退出公益,多位名人挽留

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

手机
教育
本地
房产
军事航空

手机要闻

iPhone 18消息满天飞,国产先追上iPhone 17再说吧

教育要闻

郑州经贸学院近三年录取分数线统计

本地新闻

贵州小城的新目标:举办“村超”世界杯!

房产要闻

56.8亿!三亚突然开始疯狂卖地!

军事要闻

普京最新发声:俄罗斯正处于命运攸关之际

无障碍浏览 进入关怀版