网易首页 > 网易号 > 正文 申请入驻

北大和DeepSeek最新论文,大模型提速最高85%,算力成本大幅下降

0
分享至

DeepSeek团队又发布了一个新技术,这次不是先发一个更大的模型,而是把同一个模型的“出字流程”改了一遍。

这个技术叫DSpark。

按照DSpark论文给出的测试口径,DeepSeek-V4-Flash接入DSpark后,单用户生成速度提升约60%-85%;V4-Pro提升约57%-78%。这个数字还需要更多第三方复测,但方向已经很清楚:AI竞争不只是在拼谁的模型更大,也在拼谁能让同一个模型少干废活。



这事和普通人有关系。

你用AI写总结、改简历、查资料、写代码,最烦的不是它不会,而是等。企业用AI客服、AI搜索、AI办公,更怕的不是一句回答慢半秒,而是一百万次请求堆起来的服务器账单。谁能让AI更快、更省,谁就更容易把AI塞进日常产品里。

不换模型,为什么还能变快?

大语言模型生成文字,有个很笨但很稳定的方式:一个词一个词往外吐。

它不能像人一样,先在脑子里想好一整段,再一口气写出来。它要先生成第一个词,再根据第一个词生成第二个词,再根据前两个词生成第三个词。每走一步,大模型都要算一遍。

这就像让最贵的老师傅,每次只拧一颗螺丝。质量是稳的,速度一定慢。

推测解码的思路,是找一个便宜的小助手先打草稿。小模型先猜后面几个词,大模型再一次性检查。猜对了,就直接通过;猜错了,就从错的地方重新来。



这不是魔法,是分工。

亚当·斯密在《国富论》里讲过制针工厂。一个人从头到尾做针,效率很低;把工序拆开,每个人做一段,产量会大幅上升。大模型推理也是一样:让小模型负责“先猜”,让大模型负责“拍板”,速度就有机会提升。

但这里有一个坑:分工不是拆开就一定更快。

真正难的不是猜,而是别乱猜

推测解码最怕什么?

不是小模型猜不出来,而是它猜得太差。

如果小模型一口气猜了8个词,前两个还行,后面6个全跑偏,大模型就得反复驳回、重算。看起来多了一个助手,实际上多了一堆返工。

这就像工厂流水线。前面工序做坏了,后面质检再勤快也没用。你不是提高了效率,而是把废品搬得更快。

材料里提到,DSpark做了两个改动。

第一个叫半自回归。这个名字很技术,换个说法就是:小模型不是完全瞎猜后面的词,而是让后面的猜测能参考前面已经猜出来的内容。这样越往后越跑偏的问题会缓一点。



第二个叫置信度调度校验。意思是大模型检查草稿时,不再一视同仁。通过概率高的地方,快点放行;通过概率低的地方,少猜一点,别浪费检查资源。

这两个动作放在一起,就是让“打草稿”和“做质检”都更像真实生产线:不是每个环节平均用力,而是把力气用在最容易出错的地方。

这件事最容易被误读成“免费提速”

这里要说清楚,DSpark不是让AI凭空免费变快。

它省下的,不是所有算力,而是生成过程里的重复劳动。大模型仍然要跑,显卡仍然要烧电,服务商仍然要付服务器账单。只是同样一批算力,能更快吐出更多有效文字。

所以,它对三类人影响最直接。

第一类是普通用户。以后你在App里用AI,等待时间可能更短。尤其是长回答、代码生成、复杂分析,速度差异会更明显。



第二类是做AI产品的公司。AI应用最难的不是做个演示,而是每天扛住真实用户。一个用户慢2秒不算大事,十万用户同时慢2秒,就是服务器、排队和投诉。

第三类是模型公司。过去大家喜欢讲参数、榜单、训练成本。接下来,推理成本会变得更重要。因为模型训练是一次性的大开支,模型上线后的推理,是每天都在流血的账单。

这也是为什么DeepSeek这次动作有信号意义。

如果一个模型公司不只会训练模型,还能把模型上线后的每一步都压成本,它就不只是“会做模型”,而是在摸AI生意怎么真正跑起来。

我的判断:AI竞争开始从“谁更大”转向“谁更省”

这次DSpark最有意思的地方,不是一个单独的速度数字。

真正的变化是,AI行业开始认真处理“上线后的效率”。



过去一年,大模型公司很喜欢讲三个东西:参数有多大,榜单跑多高,训练花了多少钱。这些当然重要,但它们更像发布会上的数字。用户每天感受到的,是另一个问题:能不能快点回?会不会卡?免费额度为什么一会儿就没了?公司为什么不敢把AI用到所有流程里?

答案很多时候就两个字:成本。

如果生成一个回答太贵,产品就只能限次数、限速度、限场景。用户看起来是在等AI,其实是在等服务器账单允许它继续跑。

DSpark这类技术,解决的就是这件小而硬的问题:同一个模型,少一点无效计算,多一点有效输出。

它不像新模型发布那么热闹,也不容易让普通人一眼看懂。但从产业角度看,这类工程优化会越来越关键。因为AI真正走进办公软件、手机、搜索、客服、教育工具,不靠一次炫技,而靠每一天都能稳定、便宜、快速地回答问题。

DeepSeek这次没有把故事讲成“我又造了一个更大的模型”,反而更像是在说:同一台机器,先把流水线调顺。

这可能比单纯刷榜更现实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

同学聚会,发现一个扎心的现实:年过40的女同学中,1/3没有工作,1/3做着低薪但没前途工作,剩下的1/3基本都在体制内

品读时刻
2026-06-13 09:03:28
突然,集体上涨!中东传来大消息,以色列发动袭击!

突然,集体上涨!中东传来大消息,以色列发动袭击!

证券时报e公司
2026-06-27 22:40:45
伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

伊朗为什么宁愿自己挨炸,也不愿放弃黎巴嫩真主党?

春夫杂谈
2026-06-26 19:28:20
“这种环境都能排卵?”女毕业生表白单位男领导,评论区炸锅了

“这种环境都能排卵?”女毕业生表白单位男领导,评论区炸锅了

世界圈
2026-06-26 08:40:50
A股:传来两个消息,明天,周一重要时刻来了!

A股:传来两个消息,明天,周一重要时刻来了!

明心
2026-06-28 10:30:14
同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

同一箱牛奶为何实体店卖60元,网上只卖35元呢?内行人说出了实话

平说财经
2026-06-26 19:31:07
原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

原来他俩已离婚,如今一个在日本孤独终老,一个在上海娶将军之女

翰飞观事
2026-06-28 09:59:22
吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

吃“春药”后,是什么感觉?医生说的2个案例,告诉你真实感受

医学科普汇
2026-06-23 17:16:20
国产三蹦子火到丹麦,轮到老外崇中媚华了,死活不让改倒车请注意

国产三蹦子火到丹麦,轮到老外崇中媚华了,死活不让改倒车请注意

王新喜
2026-06-28 07:55:43
原来她是哈兰德的女友,难怪老公2亿欧元身价,曾在20岁未婚生子

原来她是哈兰德的女友,难怪老公2亿欧元身价,曾在20岁未婚生子

莫地方
2026-06-27 01:00:03
媒体:梅西用比赛说明,他哪怕散步都能踢成全场最佳!

媒体:梅西用比赛说明,他哪怕散步都能踢成全场最佳!

历史第一人梅西
2026-06-28 12:09:14
发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

发现一个有趣的现象:不管信不信,男人过了50,基本都有以下特征

小书虫妈妈
2026-06-25 12:36:46
随着上海申花4-1,浙江1-3,中超最新积分榜出炉

随着上海申花4-1,浙江1-3,中超最新积分榜出炉

俯身冲顶
2026-06-28 21:03:28
美媒晒3方交易方案:詹姆斯3年5830万重返骑士 湖人连获墨菲+阿伦

美媒晒3方交易方案:詹姆斯3年5830万重返骑士 湖人连获墨菲+阿伦

锅子篮球
2026-06-28 12:40:30
男篮抵沈阳备战世预赛!郭士强+2将热度高,王治郅随队,小曾仍在

男篮抵沈阳备战世预赛!郭士强+2将热度高,王治郅随队,小曾仍在

篮球资讯达人
2026-06-28 22:35:44
伊朗:全国约三成民众将参加于7月举行的伊朗已故最高领袖阿里·哈梅内伊的告别、送葬和安葬仪式

伊朗:全国约三成民众将参加于7月举行的伊朗已故最高领袖阿里·哈梅内伊的告别、送葬和安葬仪式

政知新媒体
2026-06-27 17:45:37
斯卡洛尼:梅西本可以踢满全场,但他选择把上场机会让给队友

斯卡洛尼:梅西本可以踢满全场,但他选择把上场机会让给队友

懂球帝
2026-06-28 13:29:21
还差1球,库尼亚有望成为曼联队史世界杯单届进球最多的球员

还差1球,库尼亚有望成为曼联队史世界杯单届进球最多的球员

懂球帝
2026-06-28 18:58:14
事实证明,已经“消失”7年的周立波,早已走上一条不归路

事实证明,已经“消失”7年的周立波,早已走上一条不归路

素衣读史
2026-04-16 19:41:20
正常男人吃一颗伟哥是什么体验?网友们的分享让人脸红心跳加快!

正常男人吃一颗伟哥是什么体验?网友们的分享让人脸红心跳加快!

黯泉
2026-06-25 12:10:30
2026-06-28 23:31:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
637文章数 8841关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

头条要闻

养老院取名"如家" 没被如家酒店投诉反被一女子投诉

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

省钱,我只服梁文锋

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

数码
教育
时尚
房产
艺术

数码要闻

Windows 11配置创新低!DDR1+AGP显卡稳定运行:还能玩孤岛危机

教育要闻

明日提前批第1次志愿填报!注意事项来啦↘

夏天裙子不用买多,建议入手一条蓝裙子,清爽高级又耐看

房产要闻

全国高考大放水,300分就能上本科!论上岸率,海南没输过!

艺术要闻

她不用笔,她用刀

无障碍浏览 进入关怀版