网易首页 > 网易号 > 正文 申请入驻

梁文锋署名,DeepSeek发布最新论文

0
分享至

来源|财联社

在6月中旬获得500亿融资后仅十几天,6月27日,DeepSeek团队联合北京大学发布论文《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》。

这不是一次模型版本的迭代,而是在原有DeepSeek-V4-Pro和DeepSeek-V4-Flash基础上增加了一个推测解码模块,重点在于工程落地层面的优化。

随DSpark一同开源的DeepSpec,是一个用于训练和评估推测解码草稿模型的全栈代码库,包含数据准备工具、草稿模型实现、训练代码和评估脚本,支持MIT许可。目前DeepSpec已内置DSpark、DFlash和Eagle3三种实现。

值得注意的是,DeepSeek创始人梁文锋位列论文作者名单。在完成首轮融资的当下,创始人依然亲自参与技术论文撰写,这在AI行业并不多见。


论文标题:

《DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation》

论文链接:

https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf

01

实测数据验证

同等吞吐下,V4-Flash提速60%-85%,V4-Pro提升57%-78%

不同于仅停留在实验室的算法优化,DSpark已完成真实用户流量落地验证。该框架全面部署于 DeepSeek-V4-Flash、V4-Pro线上服务,替代此前MTP-1生产基线。在同等系统总吞吐规模下,V4-Flash单用户生成速度提升60%-85%,V4-Pro提升57%-78%。

除了DeepSeek自家的大模型,DSpark也已经部署到了阿里旗下的Qwen3-4B、8B、14B,以及Gemma4-12B。三大评测领域分别是:数学推理、代码生成、日常对话。

DSpark兼容Qwen、Gemma等国内外主流基座,同时配套DeepSpec仓库、模型权重全部开源。这意味着,对于缺乏底层算法团队的中小企业、ToB服务商,无需投入巨额研发即可复用成熟推理优化方案,大幅降低大模型私有化部署、线上服务的落地门槛,智能体、工业代码、金融舆情等场景规模化落地速度有望加快。


论文数据显示,DSpark在全部目标模型、全部评测领域下,稳定超越自回归基线Eagle3与并行基线DFlash。以Qwen3-4B/8B/14B为例,宏平均接受长度相对Eagle3提升30.9%、26.7%、30.0%;相对DFlash提升16.3%、18.4%、18.3%。这一优势具备跨模型的泛化能力,在Gemma4-12B目标模型上同样取得了一致的性能增益。

除整体提升外,论文实验数据还揭示了显著的领域差异效应::结构化任务(如数学推理、代码生成)的可接受长度天然更高(例如Qwen3-4B在数学任务上平均为5.57,代码任务为5.12),而开放式对话场景则明显偏低(仅3.49)。

论文也指出当前方案存在局限:对于本身可预测性极低、接受率偏低的复杂查询,这部分前置草稿算力无法回收。未来的优化方向可在草稿模型内部引入难度感知的早退出机制,使此类请求能够跳过完整块生成流程。

02

不拼参数拼速度:

DSpark的两项技术突破

大语言模型采用自回归方式生成文本——每生成一个新token都需要一次完整前向传播,推理延迟随输出长度线性增长。推测解码(Speculative Decoding)是行业公认的解决路径:用一个轻量级草稿模型快速生成候选token,再由大模型批量验证。

但现有方案各有短板。

自回归草稿模型(如Eagle3)逐token串行生成,依赖关系建模能力强、接受率高,但草稿耗时随候选块长线性增长,只能使用短块、浅层网络。

为打破串行瓶颈,并行草稿模型成为更优方案:所有草稿位置仅需单次前向传播即可生成,草稿耗时几乎不受块长影响。但想要充分发挥长并行草稿块的潜力,仍存在两大核心瓶颈:

生成质量瓶颈:并行草稿模型独立预测每个位置,无法建模块内token依赖,会出现多模态冲突问题,序列后半段token接受率快速衰减;

系统效率瓶颈:最优验证长度难以确定。并行生成虽能产出长草稿块,但不加区分地验证全部token会降低系统吞吐,高并发场景下问题尤为突出。

DSpark针对这两大瓶颈提出两项互补机制。

半自回归生成架构:保留并行主干的高吞吐优势,同时加入轻量级串行模块,逐token注入前缀依赖信息。该模块提供两种实现——仅依赖前一个token的马尔可夫头,以及通过循环状态累积完整前缀信息的RNN头。实验表明,两层Transformer深度的DSpark即可在所有测试领域超过五层DFlash的接受长度。

置信度调度验证机制:引入置信度头评估每个token在给定前缀下的“存活概率”。硬件感知前缀调度器根据实时引擎吞吐量动态决定最优验证长度,优先将算力分配给预期回报最高的token。论文发现原始置信头存在置信度过高问题,团队设计了“时序温度缩放”后验校准方案予以修正。


DeepSeek在完成大额融资后并未单纯追求参数扩容,而是关注落地效率,击中产业真实痛点。在生成式AI从实验室走向商业化的周期里,“更快、更省算力”正在取代单纯的模型跑分,成为厂商竞争力的关键指标。

百灵投诉平台正式上线!直面各类消费乱象,帮你讨回公道!

如果你也遇到过这些糟心事儿:办理贷款被收取砍头息,银行存款遭诱导购买保险,投资理财碰到霸王条款,或是误入医美消费陷阱、遭遇数码/ AI产品虚假宣传……

点击百灵投诉即可一键提交投诉,“百灵投诉”将持续跟进,让你的声音被听见,推动问题解决。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Shams:沙梅特4年2400万美元重返尼克斯

Shams:沙梅特4年2400万美元重返尼克斯

懂球帝
2026-06-30 05:18:27
老板娘问我她身材好不好?我该怎么回答?

老板娘问我她身材好不好?我该怎么回答?

太急张三疯
2026-06-30 11:28:57
世界杯惊天大瓜!3-3 离谱平局彻底翻车,马赫雷斯一番话直接自爆

世界杯惊天大瓜!3-3 离谱平局彻底翻车,马赫雷斯一番话直接自爆

奶盖熊本熊
2026-06-30 04:07:10
名嘴叶惠贤:开创境外综艺先河,随女儿在澳洲养老,79岁晨跑种菜

名嘴叶惠贤:开创境外综艺先河,随女儿在澳洲养老,79岁晨跑种菜

白面书誏
2026-06-29 16:36:06
天津凌晨突发!抓了!

天津凌晨突发!抓了!

天津族
2026-06-30 08:58:03
老外抢疯了!中国分体空调席卷欧洲市场!这只是冰山一角……

老外抢疯了!中国分体空调席卷欧洲市场!这只是冰山一角……

时尚的弄潮
2026-06-30 01:35:51
联盟大结局!詹库在勇士联手,浓眉加盟组三巨头

联盟大结局!詹库在勇士联手,浓眉加盟组三巨头

湖人侃球师
2026-06-30 13:11:51
战友二婚我随礼88888,他回我一盒假烟,我心寒丢进垃圾桶,次日民警敲门:那盒烟你抽了吗?

战友二婚我随礼88888,他回我一盒假烟,我心寒丢进垃圾桶,次日民警敲门:那盒烟你抽了吗?

背包旅行
2026-06-29 12:18:19
中国44年来首次试射洲际导弹,全球反应堪比好莱坞大片

中国44年来首次试射洲际导弹,全球反应堪比好莱坞大片

烽火三月佳人三千
2026-06-25 14:21:42
中国共产党成立105周年 对话越南驻华大使

中国共产党成立105周年 对话越南驻华大使

中国日报网
2026-06-30 13:40:10
铁三女神裤衩开叉 10 厘米!五年被骂上热搜,裁判却说是合规的?

铁三女神裤衩开叉 10 厘米!五年被骂上热搜,裁判却说是合规的?

十点体坛
2026-06-09 21:58:11
哈佛10年追踪:俯卧撑比血压更准!每周2-3次力竭,给全身换系统

哈佛10年追踪:俯卧撑比血压更准!每周2-3次力竭,给全身换系统

健身狂人
2026-06-13 20:30:47
张雪峰女儿张姩菡:否认自己不用读大学,也不可以躺平

张雪峰女儿张姩菡:否认自己不用读大学,也不可以躺平

金牌娱乐
2026-06-30 09:36:46
项立刚评冯小刚:饭局跳舞事件后我就不看他电影了,太恶心了

项立刚评冯小刚:饭局跳舞事件后我就不看他电影了,太恶心了

映射生活的身影
2026-06-29 16:37:52
日本心慌了,韩国着急了,如今的中国乌鲁木齐,先进制造悄然成势

日本心慌了,韩国着急了,如今的中国乌鲁木齐,先进制造悄然成势

科技故事聚焦
2026-06-30 09:14:02
董卿:母亲因癌离世3个多月,余生我会托起父亲的晚年

董卿:母亲因癌离世3个多月,余生我会托起父亲的晚年

苗苗情感说
2026-06-29 18:11:07
刑侦大案口述纪实:尘封28年,南医大女学生命案终告侦破!

刑侦大案口述纪实:尘封28年,南医大女学生命案终告侦破!

橘仔看世界
2026-06-23 09:09:12
中国出手,菲亲华派绝地翻盘!憋了17天,菲防长送中方一句狠话

中国出手,菲亲华派绝地翻盘!憋了17天,菲防长送中方一句狠话

墨子翟的日记y
2026-06-30 13:34:22
日媒:日本决定暂不把“算数”科目名称改为“数学”

日媒:日本决定暂不把“算数”科目名称改为“数学”

随波荡漾的漂流瓶
2026-06-29 20:28:56
今晚开始!央一央八爱奇艺等4部王炸剧来袭!众星云集,先追哪部

今晚开始!央一央八爱奇艺等4部王炸剧来袭!众星云集,先追哪部

小椰的奶奶
2026-06-30 01:19:29
2026-06-30 14:15:03
凤凰网财经 incentive-icons
凤凰网财经
离用户最近的财经媒体!
7154文章数 10076关注度
往期回顾 全部

财经要闻

韩国万亿"芯"基建:存储能否成AI时代油田

头条要闻

荷兰队连续3届倒在点球大战 此前9次点球大战只赢两场

头条要闻

荷兰队连续3届倒在点球大战 此前9次点球大战只赢两场

体育要闻

德国足球,脸都不要了

娱乐要闻

韩红称要退出公益,多位名人挽留

科技要闻

DeepSeek V4正式版要来 高峰期API价格翻倍

汽车要闻

谁懂啊家人们!爹味和班味一点都没,这台底盘最硬国产大猎装太上头!

态度原创

家居
房产
旅游
本地
公开课

家居要闻

传奇筑 日常诗

房产要闻

56.8亿!三亚突然开始疯狂卖地!

旅游要闻

自贡富顺:白日繁华铺锦绣 夜色灯火暖人心

本地新闻

贵州小城的新目标:举办“村超”世界杯!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版