DeepSeek团队又发布了一个新技术,这次不是先发一个更大的模型,而是把同一个模型的“出字流程”改了一遍。
这个技术叫DSpark。
按照DSpark论文给出的测试口径,DeepSeek-V4-Flash接入DSpark后,单用户生成速度提升约60%-85%;V4-Pro提升约57%-78%。这个数字还需要更多第三方复测,但方向已经很清楚:AI竞争不只是在拼谁的模型更大,也在拼谁能让同一个模型少干废活。
![]()
这事和普通人有关系。
你用AI写总结、改简历、查资料、写代码,最烦的不是它不会,而是等。企业用AI客服、AI搜索、AI办公,更怕的不是一句回答慢半秒,而是一百万次请求堆起来的服务器账单。谁能让AI更快、更省,谁就更容易把AI塞进日常产品里。
不换模型,为什么还能变快?
大语言模型生成文字,有个很笨但很稳定的方式:一个词一个词往外吐。
它不能像人一样,先在脑子里想好一整段,再一口气写出来。它要先生成第一个词,再根据第一个词生成第二个词,再根据前两个词生成第三个词。每走一步,大模型都要算一遍。
这就像让最贵的老师傅,每次只拧一颗螺丝。质量是稳的,速度一定慢。
推测解码的思路,是找一个便宜的小助手先打草稿。小模型先猜后面几个词,大模型再一次性检查。猜对了,就直接通过;猜错了,就从错的地方重新来。
![]()
这不是魔法,是分工。
亚当·斯密在《国富论》里讲过制针工厂。一个人从头到尾做针,效率很低;把工序拆开,每个人做一段,产量会大幅上升。大模型推理也是一样:让小模型负责“先猜”,让大模型负责“拍板”,速度就有机会提升。
但这里有一个坑:分工不是拆开就一定更快。
真正难的不是猜,而是别乱猜
推测解码最怕什么?
不是小模型猜不出来,而是它猜得太差。
如果小模型一口气猜了8个词,前两个还行,后面6个全跑偏,大模型就得反复驳回、重算。看起来多了一个助手,实际上多了一堆返工。
这就像工厂流水线。前面工序做坏了,后面质检再勤快也没用。你不是提高了效率,而是把废品搬得更快。
材料里提到,DSpark做了两个改动。
第一个叫半自回归。这个名字很技术,换个说法就是:小模型不是完全瞎猜后面的词,而是让后面的猜测能参考前面已经猜出来的内容。这样越往后越跑偏的问题会缓一点。
![]()
第二个叫置信度调度校验。意思是大模型检查草稿时,不再一视同仁。通过概率高的地方,快点放行;通过概率低的地方,少猜一点,别浪费检查资源。
这两个动作放在一起,就是让“打草稿”和“做质检”都更像真实生产线:不是每个环节平均用力,而是把力气用在最容易出错的地方。
这件事最容易被误读成“免费提速”
这里要说清楚,DSpark不是让AI凭空免费变快。
它省下的,不是所有算力,而是生成过程里的重复劳动。大模型仍然要跑,显卡仍然要烧电,服务商仍然要付服务器账单。只是同样一批算力,能更快吐出更多有效文字。
所以,它对三类人影响最直接。
第一类是普通用户。以后你在App里用AI,等待时间可能更短。尤其是长回答、代码生成、复杂分析,速度差异会更明显。
![]()
第二类是做AI产品的公司。AI应用最难的不是做个演示,而是每天扛住真实用户。一个用户慢2秒不算大事,十万用户同时慢2秒,就是服务器、排队和投诉。
第三类是模型公司。过去大家喜欢讲参数、榜单、训练成本。接下来,推理成本会变得更重要。因为模型训练是一次性的大开支,模型上线后的推理,是每天都在流血的账单。
这也是为什么DeepSeek这次动作有信号意义。
如果一个模型公司不只会训练模型,还能把模型上线后的每一步都压成本,它就不只是“会做模型”,而是在摸AI生意怎么真正跑起来。
我的判断:AI竞争开始从“谁更大”转向“谁更省”
这次DSpark最有意思的地方,不是一个单独的速度数字。
真正的变化是,AI行业开始认真处理“上线后的效率”。
![]()
过去一年,大模型公司很喜欢讲三个东西:参数有多大,榜单跑多高,训练花了多少钱。这些当然重要,但它们更像发布会上的数字。用户每天感受到的,是另一个问题:能不能快点回?会不会卡?免费额度为什么一会儿就没了?公司为什么不敢把AI用到所有流程里?
答案很多时候就两个字:成本。
如果生成一个回答太贵,产品就只能限次数、限速度、限场景。用户看起来是在等AI,其实是在等服务器账单允许它继续跑。
DSpark这类技术,解决的就是这件小而硬的问题:同一个模型,少一点无效计算,多一点有效输出。
它不像新模型发布那么热闹,也不容易让普通人一眼看懂。但从产业角度看,这类工程优化会越来越关键。因为AI真正走进办公软件、手机、搜索、客服、教育工具,不靠一次炫技,而靠每一天都能稳定、便宜、快速地回答问题。
DeepSeek这次没有把故事讲成“我又造了一个更大的模型”,反而更像是在说:同一台机器,先把流水线调顺。
这可能比单纯刷榜更现实。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.